Pune

ElevenLabs ने पेश किया Eleven V3 मॉडल, अब 70 भाषाओं में बोलेगा AI – भारतीय भाषाओं को मिला खास स्थान

ElevenLabs ने पेश किया Eleven V3 मॉडल, अब 70 भाषाओं में बोलेगा AI – भारतीय भाषाओं को मिला खास स्थान

ElevenLabs ने अपना नया टेक्स्ट-टू-स्पीच मॉडल Eleven V3 लॉन्च किया है, जो अब 70 भाषाओं को सपोर्ट करता है, जिनमें कई भारतीय भाषाएं शामिल हैं। यह मॉडल भावनात्मक, प्राकृतिक आवाज़ें जनरेट कर सकता है। 

आर्टिफिशियल इंटेलिजेंस आधारित वॉइस टेक्नोलॉजी में अग्रणी कंपनी ElevenLabs ने अपने नए टेक्स्ट-टू-स्पीच (TTS) मॉडल Eleven V3 के माध्यम से बड़ी छलांग लगाई है। कंपनी ने घोषणा की है कि उसका नया वर्जन अब 41 नई भाषाओं को सपोर्ट करता है, जिससे कुल भाषाओं की संख्या 70 तक पहुँच गई है। इस अपडेट के बाद अब यह मॉडल दुनिया की लगभग 90 प्रतिशत आबादी को वॉयस टेक्नोलॉजी से जोड़ने की क्षमता रखता है।

भारतीय भाषाओं को मिला बड़ा सपोर्ट

ElevenLabs द्वारा शामिल की गई 41 नई भाषाओं में से कई भारतीय भाषाएं भी शामिल हैं, जो भारतीय यूज़र्स के लिए बड़ी खबर है। इन भाषाओं में हिंदी, असमी, बंगाली, गुजराती, मलयालम, मराठी, नेपाली, तमिल, और तेलुगु जैसी भाषाएं शामिल हैं। इससे भारत जैसे विविध भाषाई देश में इस टेक्नोलॉजी का दायरा काफी बढ़ने की उम्मीद है।

सोशल मीडिया पर दी जानकारी

ElevenLabs ने अपने आधिकारिक X (पूर्व में ट्विटर) अकाउंट पर पोस्ट के जरिए जानकारी दी कि Eleven V3 अब कुल 70 भाषाओं में टेक्स्ट को आवाज़ में बदल सकता है। इसका मतलब है कि अब उपयोगकर्ता अपनी पसंदीदा या मातृभाषा में टेक्स्ट टाइप कराकर उसे एक प्राकृतिक और भावनात्मक आवाज़ में सुन सकते हैं।

Instant Voice Clone (IVC) की सलाह

कंपनी ने यूज़र्स को यह भी सलाह दी है कि यदि वे किसी नई भाषा में कंटेंट जनरेट करना चाहते हैं, तो उन्हें उस भाषा के लिए Instant Voice Clone (IVC) फीचर का उपयोग करना चाहिए। इसके ज़रिए यूज़र अपनी या किसी अन्य आवाज़ को सैंपल देकर उसी अंदाज़ में आउटपुट पा सकते हैं।

साथ ही, कंपनी ने कहा कि आने वाले हफ्तों में वह इन नई भाषाओं के लिए Voice Library Voices भी जोड़ेगी ताकि यूज़र को पहले से तैयार आवाज़ों का भी विकल्प मिल सके।

नई टेक्नोलॉजी की ख़ासियतें

Eleven V3 मॉडल, इसके पहले आए बहुभाषी मॉडल V2 और V2.5 का उन्नत संस्करण है। इस नए मॉडल में कई विशेष फीचर्स शामिल किए गए हैं:

  • इमोशनल ऑडियो टैग्स: जैसे फुसफुसाना, आहें, उत्साह, निराशा जैसी ध्वनियाँ अब AI आवाज़ों में जोड़ना संभव है।
  • मल्टी-स्पीकर सपोर्ट: यह मॉडल ओवरलैपिंग संवाद, प्राकृतिक बातचीत, और रुकावटों के साथ रियल-लाइफ कन्वर्सेशन को बेहतर ढंग से पेश करता है।
  • बेहतर प्रासंगिक समझ: तनाव, बोलने की गति और वाक्य के अर्थ को सही तरीके से समझते हुए बोलने की क्षमता इसमें और अधिक उन्नत हुई है।

कहां और कैसे कर सकते हैं इस्तेमाल?

Eleven V3 फिलहाल कंपनी की वेबसाइट और मोबाइल ऐप के माध्यम से उपलब्ध है। यूज़र्स इन प्लेटफॉर्म्स पर लॉगिन करके इस टेक्नोलॉजी का उपयोग कर सकते हैं। हालांकि, यह एपीआई (API) के रूप में अभी उपलब्ध नहीं है, यानी डेवलपर्स या कंपनियों को इसे सीधे तौर पर अपने सिस्टम्स में जोड़ने के लिए थोड़ी प्रतीक्षा करनी होगी।

AI से एजेंट्स की बातचीत: 'Agent Transfer' फीचर

ElevenLabs लगातार नई तकनीकों पर काम कर रहा है। अप्रैल महीने में कंपनी ने एक नया एंटरप्राइज़-फोकस्ड फीचर भी लॉन्च किया था, जिसका नाम है Agent Transfer। यह कंपनी के कन्वर्सेशनल AI सिस्टम का हिस्सा है, जिसमें दो AI एजेंट्स आपस में बातचीत कर सकते हैं और डेटा एक-दूसरे को ट्रांसफर कर सकते हैं।

इस फीचर के ज़रिए यदि कोई एक एजेंट किसी विशेष जानकारी पर सक्षम नहीं है, तो वह बातचीत को एक ऐसे एजेंट को ट्रांसफर कर सकता है जो उस विषय में ज़्यादा दक्ष हो।

Leave a comment