समाचार

चीनी एआई स्टार्टअप ने इमेज-टू-वीडियो टूल लॉन्च के साथ ओपनएआई के सोरा पर निशाना साधा है

यहां चित्रित विदु की वेबसाइट से एक एआई-जनरेटेड क्लिप है। टूल टेक्स्ट या छवि संकेतों से वीडियो बना सकता है।

एवलिन चेंग | सीएनबीसी

बीजिंग – बीजिंग स्थित शेंगशु टेक्नोलॉजी ने बुधवार को कहा कि उसका कृत्रिम बुद्धिमत्ता से संचालित टेक्स्ट-टू-वीडियो टूल विदु अब छवियों को मिलाकर वीडियो बनाने में सक्षम होगा।

Vidu पहले से ही दुनिया भर के उपयोगकर्ताओं को लिखित संकेतों के आधार पर 8-सेकंड की क्लिप बनाने की अनुमति देता है। जबकि OpenAI चैटजीपीटी के निर्माता – फरवरी में पता चला कि इसका एआई मॉडल सोरा है टेक्स्ट से एक मिनट के वीडियो तैयार कर सकता है, लेकिन इसे अभी तक सार्वजनिक रूप से जारी नहीं किया गया है।

शेंगशू ने कहा कि विदु का नया एआई फीचर तीन तस्वीरों को जोड़ सकता है – जैसे कि शर्ट, व्यक्ति और मोपेड – एक दृश्य के माध्यम से शर्ट पहने और मोपेड चलाते हुए व्यक्ति के वीडियो में।

अन्य प्लेटफ़ॉर्म का दावा है कि वे एआई का उपयोग करके टेक्स्ट या छवियों को वीडियो में बदल सकते हैं, लेकिन आउटपुट की गुणवत्ता भिन्न होती है। शेंगशू जिस सफलता का दावा करता है वह तीन अद्वितीय छवियों को लेने और उन्हें एआई-जनित वीडियो में दृश्य स्थिरता के साथ एकीकृत करने की क्षमता है।

“बहुत पहले ही हमने पता लगा लिया था [visual consistency] समस्या के रूप में, और इसे अच्छी तरह से हल करना चाहते थे,” शेंगशू के मुख्य प्रौद्योगिकी अधिकारी फैन बाओ ने सीएनबीसी द्वारा अनुवादित मंदारिन में कहा।

विदु को अप्रैल में लॉन्च किया गया था और दो प्रोफ़ाइल फ़ोटो को गले लगाने वाले लोगों के जीवंत वीडियो में बदलने की इसकी क्षमता टिकटॉक पर वायरल हो गई थी।

टेक-टू इंटरएक्टिव सीईओ स्ट्रॉस ज़ेलनिक: हम आगे बढ़ने वाली एक जैविक विकास कहानी हैं

सीएनबीसी अनुवाद के अनुसार, एआई वीडियो जनरेटर पहले से ही विज्ञापनदाताओं, एनिमेटरों और अन्य व्यवसायों से पैसा कमा रहा है, शेंगशू के सह-संस्थापक और सीईओ जियायु तांग ने मंदारिन में कहा। उन्होंने कहा कि प्रति ग्राहक मासिक उपयोग दर 100,000 युआन से 1 मिलियन युआन ($13,871 से $138,711) तक हो सकती है।

कॉपीराइट मुद्दों को संबोधित करने के लिए, टैंग ने कहा कि एक कंपनी एक कलाकार के साथ एक समझौते पर हस्ताक्षर कर सकती है जो एआई को एक विज्ञापन के लिए कलाकार की पेंटिंग की शैली की नकल करने की अनुमति देती है। उन्होंने कहा कि उन्होंने उपभोक्ताओं द्वारा छवियों के उपयोग के संबंध में कोई महत्वपूर्ण कानूनी मामला नहीं देखा है।

टैंग ने कहा कि विदु जनता को मशहूर हस्तियों या “संवेदनशील” व्यक्तियों की छवियों का उपयोग करके सामग्री तैयार करने की अनुमति नहीं देता है। उन्होंने कहा कि एआई टूल नग्न और हिंसक छवियों पर भी प्रतिबंध लगाता है। जहां तक ​​व्यक्तिगत तस्वीरों का सवाल है, टैंग ने कहा कि विदु सामान्य डेटा सुरक्षा विनियमन – एक वैश्विक बेंचमार्क – के अनुसार डेटा को नष्ट कर देता है।

पिचबुक के अनुसार, शेंगशू की स्थापना पिछले साल Baidu वेंचर्स, अलीबाबा-संबद्ध एंट ग्रुप, चीनी स्टार्टअप झिपु एआई, किमिंग वेंचर पार्टनर्स और बीजिंग शहर सहित समर्थकों के साथ की गई थी।

टैंग ने कहा कि विदु का एआई चीन और विदेशों में किराए के क्लाउड सर्वर से चलता है।

Source

Related Articles

Back to top button