चीनच्या वाढत्या कृत्रिम बुद्धिमत्ता उद्योगातील एकदा आघाडीचे नाव असलेले डीपसीक एआय आता घसरणीचा सामना करत आहे. बायडूचे सह-संस्थापक रॉबिन ली यांनी या घटनेमागील कारणांवर अलीकडेच प्रकाश टाकला आहे.
डीपसीक एआय: रॉबिन ली यांनी चिनी एआय टूल डीपसीकबद्दल एक महत्त्वाचे विधान केले. त्यांनी म्हटले आहे की, डीपसीकने सुरुवातीलाच सिलिकॉन व्हॅलीतील आघाडीच्या तंत्रज्ञान कंपन्यांमध्ये खळबळ उडवली होती, परंतु आता ते आपला प्रभाव कमी करत आहे. एका डेव्हलपर कॉन्फरन्स दरम्यान, ली यांनी एक प्रमुख कमतरता अधोरेखित केली: डीपसीक तर्क-आधारित भाषा मॉडेलवर कार्य करते, जी इतर जनरेटिव्ह एआय टूल्सपेक्षा वेगळी आहे, परंतु त्याच्या सुरुवातीच्या प्रक्षेपणानंतर त्याचा विकास वेग आणि प्रभाव लक्षणीयरित्या मंदावला आहे.
पाठ्य-आधारित मॉडेल्समधील कमी होणारी मागणी
ली यांच्या मते, डीपसीकसारखी पाठ्य-पाठ्य जनरेटिव्ह एआय मॉडेल्स वेगाने महत्त्व कमी करत आहेत. चिनी फायनान्शिअल टाइम्समधील एका अहवालात ली यांच्या हवाला देऊन म्हटले आहे की वापरकर्ते आता फक्त पाठ्य निर्माण करण्यापुरते मर्यादित राहू इच्छित नाहीत. त्यांच्या अपेक्षा वाढल्या आहेत; ते आता पाठ्याच्या माध्यमातून प्रतिमा, व्हिडिओ आणि ऑडिओ सामग्रीची निर्मिती करण्याची इच्छा करतात.
यामुळे प्रतिमा-पाठ्य आणि व्हिडिओ-पाठ्य तंत्रज्ञानाची मागणी झपाट्याने वाढली आहे, ज्यामुळे फक्त-पाठ्य मॉडेल्स मागे पडत आहेत. ली यांनी डीपसीकसारखी मॉडेल्स कमी कामगिरी करणारी म्हणून वर्गीकृत केली आहेत, असे म्हणत की बहु-मोडल क्षमता समाविष्ट करण्यापूर्वी त्यांची लोकप्रियता मर्यादितच राहिल.
एक झपाट्याने वाढ, आता आव्हानांना सामोरे
डीपसीकने जानेवारी २०२५ मध्ये आपल्या R1 मॉडेलसह एक आश्चर्यकारक पदार्पण केले. त्याच्या प्रक्षेपणाने सिलिकॉन व्हॅलीत देखील लक्षणीय लक्ष वेधले. डीपसीकला चीनच्या मोठ्या भाषा मॉडेल (LLM) जागेत एक गेम-चेंजर मानले जात होते. त्याची तर्क आणि तार्किक विचार क्षमता त्याला इतर चिनी एआय मॉडेल्सपेक्षा वेगळे करत होती.
परंतु, तंत्रज्ञान जगात यश मिळवण्यासाठी मजबूत सुरुवात पुरेशी नाही. सतत नवोन्मेष आणि विकसित वापरकर्ता मागण्यांशी जुळवून घेणे हे अत्यंत महत्त्वाचे आहे. डीपसीक सध्या या आव्हानाचा सामना करत आहे.
बायडूची बहु-मोडल रणनीती
हे बदलते परिदृश्य ओळखून, बायडूने डीपसीकपासून आपले लक्ष हटवले आहे. कंपनीने अलीकडेच नवीन जनरेटिव्ह एआय मॉडेल्स, अर्नी ४.५ टर्बो आणि X१ टर्बो लाँच केले आहेत. दोन्ही मॉडेल्स बहु-मोडल क्षमता दाखवतात, म्हणजेच ते फक्त पाठ्यच नव्हे तर प्रतिमा, ऑडिओ आणि व्हिडिओ देखील प्रक्रिया आणि निर्माण करू शकतात.
हे पाऊल बायडूच्या डीपसीकसारख्या फक्त-पाठ्य एआय प्रकल्पांपासून दूर जाण्याची सूचना देते. कंपनी आता अशा एआय उपायांवर लक्ष केंद्रित करत आहे जे व्यापक वापर प्रकरणांना समर्थन देतात, भविष्यातील बाजारपेठेतील वर्चस्वासाठी ही आवश्यकता आहे.
चिनी एआय बाजारात वाढणारी स्पर्धा
डीपसीकला फक्त स्वतःच्या मर्यादांपासूनच नव्हे तर चिनी बाजारात वेगाने वाढणाऱ्या स्पर्धेतूनही आव्हानांचा सामना करावा लागत आहे. अलीबाबाने आपले एआय मॉडेल, क्वेन लाँच केले आहे, जे पाठ्य निर्माण, प्रतिमा आणि व्हिडिओ प्रक्रियामध्ये पारंगत आहे. त्याचप्रमाणे, क्लिंगा एआय सारख्या नवीन खेळाडू प्रतिमा-पाठ्य आणि व्हिडिओ-पाठ्य तंत्रज्ञानात उत्तम पर्याय देत आहेत.
बायडूने डीपसीकला क्वानफान प्लॅटफॉर्म सारख्या अनेक सेवांमध्ये समाविष्ट करण्याचा प्रयत्न केला असला तरी, बहु-मोडल क्षमतेचा अभाव डीपसीकला आपला पूर्वीचा प्रभाव राखण्यापासून रोखत आहे.
बहु-मोडल एआयचे महत्त्व
आजचे वापरकर्ते साध्या पाठ्य चॅट्स किंवा लेख निर्माण करण्याने समाधानी नाहीत. प्रतिमा, व्हिडिओ आणि ऑडिओ सामग्री सोशल मीडिया, डिजिटल मार्केटिंग, मनोरंजन, गेमिंग आणि अगदी ऑनलाइन शिक्षणात वाढत्या प्रमाणात प्रचलित आहे. हे फक्त-पाठ्य एआय मॉडेल्समध्ये मर्यादा निर्माण करते. बहु-मोडल एआय मॉडेल्स वापरकर्त्यांना अधिक संवादात्मक, प्रभावी आणि वास्तववादी अनुभव प्रदान करतात.
उदाहरणार्थ, एक कथा लिहिणारा वापरकर्ता त्वरित तयार केलेले दृश्य पाहू इच्छित असू शकतो. किंवा एक वापरकर्ता एका संक्षिप्त पाठ्य इनपुटमधून एक लघु व्हिडिओ क्लिप तयार करू इच्छित असू शकतो. म्हणूनच GPT-4o सारख्या मॉडेल्समधून ऑडिओ, दृश्य आणि पाठ्य बहु-मोडल क्षमता सादर करत आहेत.
डीपसीकचा पुढचा मार्ग
डीपसीककडे अजूनही आपली रणनीती बदलण्याची आणि बहु-मोडल क्षमता त्वरीत स्वीकारण्याची संधी आहे. जर डीपसीक पाठ्य, प्रतिमा आणि व्हिडिओ निर्माण करण्यासारख्या वैशिष्ट्यांना यशस्वीरित्या समाविष्ट करेल, तर ते मजबूत बाजार स्थान पुन्हा मिळवू शकते. पुढे, डीपसीकने उघड स्रोत मॉडेल्समधील वाढत्या प्रभावाचा लाभ घ्यावा आणि डेव्हलपर समुदायातील आपले समर्थन नेटवर्क मजबूत करावे.