चीनी एआई स्टार्टअप ने इमेज-टू-वीडियो टूल लॉन्च के साथ ओपनएआई के सोरा पर निशाना साधा है

Namita Shah November 14, 2024

2 minutes read

टेक-टू इंटरएक्टिव सीईओ स्ट्रॉस ज़ेलनिक: हम आगे बढ़ने वाली एक जैविक विकास कहानी हैं

यहां चित्रित विदु की वेबसाइट से एक एआई-जनरेटेड क्लिप है। टूल टेक्स्ट या छवि संकेतों से वीडियो बना सकता है।

एवलिन चेंग | सीएनबीसी

बीजिंग – बीजिंग स्थित शेंगशु टेक्नोलॉजी ने बुधवार को कहा कि उसका कृत्रिम बुद्धिमत्ता से संचालित टेक्स्ट-टू-वीडियो टूल विदु अब छवियों को मिलाकर वीडियो बनाने में सक्षम होगा।

Vidu पहले से ही दुनिया भर के उपयोगकर्ताओं को लिखित संकेतों के आधार पर 8-सेकंड की क्लिप बनाने की अनुमति देता है। जबकि OpenAI — चैटजीपीटी के निर्माता – फरवरी में पता चला कि इसका एआई मॉडल सोरा है टेक्स्ट से एक मिनट के वीडियो तैयार कर सकता है, लेकिन इसे अभी तक सार्वजनिक रूप से जारी नहीं किया गया है।

शेंगशू ने कहा कि विदु का नया एआई फीचर तीन तस्वीरों को जोड़ सकता है – जैसे कि शर्ट, व्यक्ति और मोपेड – एक दृश्य के माध्यम से शर्ट पहने और मोपेड चलाते हुए व्यक्ति के वीडियो में।

अन्य प्लेटफ़ॉर्म का दावा है कि वे एआई का उपयोग करके टेक्स्ट या छवियों को वीडियो में बदल सकते हैं, लेकिन आउटपुट की गुणवत्ता भिन्न होती है। शेंगशू जिस सफलता का दावा करता है वह तीन अद्वितीय छवियों को लेने और उन्हें एआई-जनित वीडियो में दृश्य स्थिरता के साथ एकीकृत करने की क्षमता है।

“बहुत पहले ही हमने पता लगा लिया था [visual consistency] समस्या के रूप में, और इसे अच्छी तरह से हल करना चाहते थे,” शेंगशू के मुख्य प्रौद्योगिकी अधिकारी फैन बाओ ने सीएनबीसी द्वारा अनुवादित मंदारिन में कहा।

विदु को अप्रैल में लॉन्च किया गया था और दो प्रोफ़ाइल फ़ोटो को गले लगाने वाले लोगों के जीवंत वीडियो में बदलने की इसकी क्षमता टिकटॉक पर वायरल हो गई थी।

सीएनबीसी अनुवाद के अनुसार, एआई वीडियो जनरेटर पहले से ही विज्ञापनदाताओं, एनिमेटरों और अन्य व्यवसायों से पैसा कमा रहा है, शेंगशू के सह-संस्थापक और सीईओ जियायु तांग ने मंदारिन में कहा। उन्होंने कहा कि प्रति ग्राहक मासिक उपयोग दर 100,000 युआन से 1 मिलियन युआन ($13,871 से $138,711) तक हो सकती है।

कॉपीराइट मुद्दों को संबोधित करने के लिए, टैंग ने कहा कि एक कंपनी एक कलाकार के साथ एक समझौते पर हस्ताक्षर कर सकती है जो एआई को एक विज्ञापन के लिए कलाकार की पेंटिंग की शैली की नकल करने की अनुमति देती है। उन्होंने कहा कि उन्होंने उपभोक्ताओं द्वारा छवियों के उपयोग के संबंध में कोई महत्वपूर्ण कानूनी मामला नहीं देखा है।

टैंग ने कहा कि विदु जनता को मशहूर हस्तियों या “संवेदनशील” व्यक्तियों की छवियों का उपयोग करके सामग्री तैयार करने की अनुमति नहीं देता है। उन्होंने कहा कि एआई टूल नग्न और हिंसक छवियों पर भी प्रतिबंध लगाता है। जहां तक व्यक्तिगत तस्वीरों का सवाल है, टैंग ने कहा कि विदु सामान्य डेटा सुरक्षा विनियमन – एक वैश्विक बेंचमार्क – के अनुसार डेटा को नष्ट कर देता है।

पिचबुक के अनुसार, शेंगशू की स्थापना पिछले साल Baidu वेंचर्स, अलीबाबा-संबद्ध एंट ग्रुप, चीनी स्टार्टअप झिपु एआई, किमिंग वेंचर पार्टनर्स और बीजिंग शहर सहित समर्थकों के साथ की गई थी।

टैंग ने कहा कि विदु का एआई चीन और विदेशों में किराए के क्लाउड सर्वर से चलता है।

Source

Namita Shah

Subscribe to our mailing list to get the new updates!

एमिरेट्स एनबीए कप दिसंबर में लास वेगास में एक स्लैम डंक लेकर आएगा

फुल हाउस की अगली पीढ़ी: कैंडेस कैमरून ब्यूर और अधिक स्टार्स के बच्चे

Related Articles

युवा विरोध का एक वर्ष: सत्ता पुनः प्राप्त करना

चाड में एक दशक से अधिक समय बाद पहले संसदीय चुनाव में मतदान: क्या जानना है

वर्ष की 2024 तस्वीरें

उत्तरी गाजा में अंतिम प्रमुख स्वास्थ्य सुविधा “सेवा से बाहर”: WHO