चीनको उदीयमान कृत्रिम बुद्धिमत्ता (AI) उद्योगमा एक समयमा अग्रणी खेलाडी रहेको डिपसिक AI हाल ओरालो लागिरहेको छ। बाइडुका सह-संस्थापक रोबिन लीले यस गिरावटका पछाडिका कारणहरूमा हालै प्रकाश पारेका छन्।
डिपसिक AI: रोबिन लीले चिनियाँ AI उपकरण डिपसिकको सम्बन्धमा हालै एउटा महत्वपूर्ण वक्तव्य दिएका छन्। उनले भनेका छन् कि डिपसिक, जसले सुरुमा आफ्नो सुरुवात पछि अग्रणी सिलिकन भ्याली प्रविधि कम्पनीहरूमा हलचल मच्चायो, अब आफ्नो चमक गुमाइरहेको छ। एक विकासकर्ता सम्मेलनको क्रममा, लीले एउटा प्रमुख कमजोरी उजागर गरे: डिपसिकले अन्य जेनेरेटिभ AI उपकरणहरू भन्दा फरक तरिकाले तर्कमा आधारित भाषा मोडेलमा काम गर्दछ, तर यसको विकास गति र प्रभाव यसको सुरुवात पछि उल्लेखनीय रूपमा सुस्त भएको छ।
पाठ-आधारित मोडेलहरूको घट्दो माग
लीका अनुसार, डिपसिक जस्ता पाठ-देखि-पाठ जेनेरेटिभ AI मोडेलहरू द्रुत रूपमा प्रासंगिकता गुमाइरहेका छन्। चिनियाँ फाइनान्सियल टाइम्सको एक रिपोर्टले लीलाई उद्धृत गर्दै भनेको छ कि प्रयोगकर्ताहरू अब पाठ निर्माणमा मात्र सीमित हुन चाहँदैनन्। उनीहरूको अपेक्षा बढेको छ; अब उनीहरू पाठ मार्फत छवि, भिडियो र अडियो सामग्रीको निर्माण चाहन्छन्।
यसले पाठ-देखि-छवि र पाठ-देखि-भिडियो प्रविधिहरूको मागमा वृद्धि भएको छ, जसले केवल पाठमा आधारित मोडेलहरूलाई पछाडि पारेको छ। लीले डिपसिक जस्ता मोडेलहरूलाई कम प्रदर्शन भएको वर्गीकरण गर्दै भनेका छन् कि जबसम्म तिनीहरूले बहु-मोडल क्षमताहरूलाई समावेश गर्दैनन्, तबसम्म तिनीहरूको लोकप्रियता सीमित नै रहनेछ।
एक उल्कापिंड वृद्धि, अब चुनौतीहरूको सामना गर्दै
डिपसिकले जनवरी २०२५ मा आफ्नो R1 मोडेलसँग शानदार सुरुवात गर्यो। यसको सुरुवातले सिलिकन भ्यालीमा समेत उल्लेखनीय ध्यान आकर्षित गर्यो। डिपसिकलाई चीनको ठूलो भाषा मोडेल (LLM) स्पेसमा खेल परिवर्तक मानिन्थ्यो। यसको तर्क र तार्किक सोच क्षमताले यसलाई अन्य चिनियाँ AI मोडेलहरूबाट अलग गर्यो।
यद्यपि, प्रविधि संसारमा सफलता कायम राख्न बलियो सुरुवात मात्र पर्याप्त छैन। निरन्तर नयाँ आविष्कार र विकसित प्रयोगकर्ता मागहरूमा अनुकूलन महत्त्वपूर्ण छ। डिपसिक हाल यस चुनौतीसँग जुधिरहेको छ।
बाइडुको बहु-मोडल रणनीति
यस परिवर्तनशील परिदृश्यलाई पहिचान गर्दै, बाइडुले डिपसिकबाट आफ्नो ध्यान हटाएको छ। कम्पनीले हालै नयाँ जेनेरेटिभ AI मोडेलहरू, अर्नी ४.५ टर्बो र एक्स १ टर्बो सुरु गरेको छ। दुवै मोडेलहरूले बहु-मोडल क्षमताहरूलाई समावेश गर्दछ, जसको अर्थ तिनीहरूले पाठ मात्र नभई छवि, अडियो र भिडियो पनि प्रशोधन र सिर्जना गर्न सक्छन्।
यस कदमले बाइडुको डिपसिक जस्ता केवल पाठमा आधारित AI परियोजनाहरूबाट टाढा सार्ने देखाउँछ। कम्पनी अब व्यापक प्रयोगका मामिलाहरूलाई समर्थन गर्ने AI समाधानहरूमा केन्द्रित छ, जुन भविष्यको बजार प्रभुत्वको लागि आवश्यक छ।
चिनियाँ AI बजारमा बढ्दो प्रतिस्पर्धा
डिपसिकले आफ्नै सीमाहरूबाट मात्र होइन, चिनियाँ बजारमा द्रुत रूपमा बढ्दो प्रतिस्पर्धाबाट पनि चुनौतीहरूको सामना गरिरहेको छ। अलिबाबाले आफ्नो AI मोडेल, क्वेन, पाठ निर्माण, छवि र भिडियो प्रशोधनमा कुशल सुरु गरेको छ। यसैगरी, क्लिङ्गा AI जस्ता नयाँ खेलाडीहरूले पाठ-देखि-भिडियो र पाठ-देखि-छवि प्रविधिहरूमा उत्कृष्ट विकल्पहरू प्रदान गरिरहेका छन्।
बाइडुले क्वान्फान प्लेटफर्म जस्ता धेरै सेवाहरूमा डिपसिकलाई एकीकृत गर्न प्रयास गरे तापनि, बहु-मोडल क्षमताहरूको अभावले डिपसिकलाई आफ्नो पहिलेको प्रभाव कायम राख्न बाधा पुर्याइरहेको छ।
बहु-मोडल AI को महत्त्व
आजका प्रयोगकर्ताहरू अब साधारण पाठ च्याट वा लेख निर्माणबाट सन्तुष्ट छैनन्। छवि, भिडियो र अडियो सामग्री सामाजिक सञ्चार माध्यम, डिजिटल मार्केटिङ, मनोरञ्जन, गेमिङ र अनलाइन शिक्षामा समेत बढ्दो रूपमा प्रचलित छन्। यसले केवल पाठमा आधारित AI मोडेलहरूको दायरा सीमित गर्दछ। बहु-मोडल AI मोडेलहरूले प्रयोगकर्ताहरूलाई बढी अन्तर्क्रियात्मक, प्रभावकारी र यथार्थपरक अनुभवहरू प्रदान गर्दछन्।
उदाहरणका लागि, कथा लेख्ने एक प्रयोगकर्ताले तत्काल उत्पन्न हुने दृश्य चाहन सक्छ। वा एक प्रयोगकर्ताले छोटो पाठ इनपुटबाट छोटो भिडियो क्लिप बनाउन चाहन सक्छ। यही कारणले गर्दा GPT-4o जस्ता मोडेलहरूसँग अडियो, दृश्य र पाठ बहु-मोडल क्षमताहरू प्रस्तुत गरिरहेका छन्।
डिपसिकको अगाडिको बाटो
डिपसिकसँग अझै पनि आफ्नो रणनीति अनुकूलन गर्ने र द्रुत रूपमा बहु-मोडल क्षमताहरू अपनाउने अवसर छ। यदि डिपसिकले पाठ, छवि र भिडियो निर्माण जस्ता सुविधाहरू सफलतापूर्वक समावेश गर्छ भने, यसले बलियो बजार स्थिति पुनः प्राप्त गर्न सक्छ। थप रूपमा, डिपसिकले खुला स्रोत मोडेलहरूको बढ्दो प्रभावको लाभ उठाउनुपर्छ र विकासकर्ता समुदाय भित्र आफ्नो समर्थन नेटवर्क बलियो बनाउनुपर्छ।