तकनीकी

ओपनएआई सोरा ने समझाया: यह चैटजीपीटी से कैसे अलग है, और इसका उपयोग कौन कर सकता है

ओपनएआई ने अंततः अपना उन्नत टेक्स्ट-टू-वीडियो जनरेटर सोरा लॉन्च किया है, जो इसे जनता के लिए उपलब्ध कराता है। जिस तरह आप चैटजीपीटी पर त्वरित संकेत सबमिट करके हजारों शब्द उत्पन्न कर सकते हैं, उसी तरह अब आप सोरा पर संकेत सबमिट करके वीडियो बना सकते हैं। हालाँकि, इसकी कार्यक्षमता इससे भी आगे जाती है—आप उन्हें जीवंत बनाने के लिए चित्र भी अपलोड कर सकते हैं। अपने परदादा की एक पुरानी तस्वीर जमा करने और उन्हें चलते, दौड़ते या अन्य कार्य करते हुए देखने की कल्पना करें। हम यहां नवाचार के इसी स्तर की बात कर रहे हैं। जैसा कि कहा गया है, आप सोच रहे होंगे: सोरा जीपीटी-4 जैसे एलएलएम (बड़े भाषा मॉडल) से कैसे अलग है जो सोरा के पीछे की तकनीक चैटजीपीटी को शक्ति प्रदान करता है? इसका प्रशिक्षण किस पर किया जाता है? और सबसे महत्वपूर्ण बात यह है कि क्या हर कोई सोरा तक पहुंच सकता है? हम नीचे इन सभी सवालों के जवाब देते हैं—आगे पढ़ें।

यह भी पढ़ें: iPhone 18 Pro की कीमत हो सकती है काफी ज्यादा, कीमत बढ़ने की बड़ी वजह…

सोरा टेक्स्ट-आधारित बड़े भाषा मॉडल से किस प्रकार भिन्न है?

आरंभ करने के लिए, सोरा एक टेक्स्ट-टू-वीडियो एआई मॉडल है, जबकि जीपीटी एक बड़ा भाषा मॉडल है। उनके मतभेदों के बावजूद, उनके द्वारा स्वीकार किए जाने वाले इनपुट कुछ हद तक समान हैं, क्योंकि GPT-4 मल्टीमॉडल है – यह टेक्स्ट, छवियों और यहां तक ​​​​कि वीडियो को इनपुट के रूप में संसाधित कर सकता है।

उदाहरण के लिए, सोरा के साथ, आप एक विस्तृत संकेत सबमिट करके एक पर्वत श्रृंखला का वीडियो बना सकते हैं। आप निर्दिष्ट कर सकते हैं कि क्या पहाड़ बर्फ से ढके होने चाहिए, क्या सूरज चमक रहा है, और अन्य विवरण। इसके अलावा, आप सोरा को सबमिट करके किसी मौजूदा छवि में जान डाल सकते हैं। संक्षेप में, सोरा टेक्स्ट, छवियों या वीडियो को इनपुट के रूप में संसाधित करता है और आउटपुट के रूप में वीडियो तैयार करता है।

इसके विपरीत, GPT मॉडल केवल टेक्स्ट आउटपुट उत्पन्न करते हैं, भले ही आप टेक्स्ट या छवि इनपुट सबमिट करें। आउटपुट में यह अंतर दोनों को अलग करता है।

आप पूछ सकते हैं: क्या चैटजीपीटी या गूगल जेमिनी छवियां उत्पन्न कर सकते हैं? क्या वे क्रमशः GPT-4 और जेमिनी द्वारा संचालित नहीं हैं? उत्तर है नहीं. वे टेक्स्ट-टू-इमेज जेनरेशन के लिए DALL-E 3 (OpenAI) और Imagen 3 (Google) जैसे मॉडलों पर भरोसा करते हैं।

सोरा में वीडियो को समय में आगे या पीछे बढ़ाने की क्षमता भी है, जो इसकी क्षमताओं में एक और आयाम जोड़ता है।

यह भी पढ़ें: इस सप्ताह iOS 18.2 रिलीज़: iPhone उपयोगकर्ताओं को शक्तिशाली AI सुविधाएँ मिलेंगी…

सोरा को कैसे प्रशिक्षित किया गया?

ओपनएआई का दावा है कि सोरा को अलग-अलग अवधि, रिज़ॉल्यूशन और पहलू अनुपात के वीडियो और छवियों पर प्रशिक्षित किया गया था। कंपनी का कहना है कि यह एक ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, जो वीडियो और छवि अव्यक्त कोड के स्पेस-टाइम पैच को संसाधित करता है।

तकनीकी दृष्टिकोण से, दृष्टिकोण में एक महत्वपूर्ण अंतर है। जबकि सोरा जैसे टेक्स्ट-टू-वीडियो मॉडल को अलग तरह से प्रशिक्षित किया जाता है, बड़े भाषा मॉडल जैसे जीपीटी-4ओ या मेटा के लामा जैसी कंपनियों के अन्य एआई मॉडल को आम तौर पर उस पर प्रशिक्षित किया जाता है जिसे हम टोकन के रूप में संदर्भित करते हैं।

हालाँकि, टोकन के बजाय, OpenAI सोरा को प्रशिक्षित करने के लिए विज़ुअल पैच नामक एक विधि का उपयोग करता है। अनिवार्य रूप से, यह वीडियो को निम्न-आयामी अव्यक्त स्थान में संपीड़ित करके पैच में तोड़ देता है। आगे की प्रक्रिया के लिए प्रतिनिधित्व को स्पेस-टाइम पैच में विघटित किया जाता है।

सोरा किसके लिए उपलब्ध है?

वर्तमान में, सोरा मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध नहीं है। इसका मतलब है कि आपको एक सदस्यता खरीदने की आवश्यकता होगी – या तो ओपनएआई प्लस सदस्यता या ओपनएआई प्रो सदस्यता।

प्लस सदस्यता, जिसकी लागत है भारत में 2,000, प्रति माह 50 सोरा वीडियो पीढ़ियों तक पहुंच की अनुमति देता है। यदि आप प्रो खाता चुनते हैं, जिसकी कीमत $200 है, तो आप 500 तेज़ वीडियो पीढ़ी तक उत्पन्न कर सकते हैं। हालाँकि, उच्च रिज़ॉल्यूशन का चयन करने से उपलब्ध पीढ़ियों की संख्या कम हो जाती है। यदि आप धैर्यवान हैं और धीमी पीढ़ी मोड का उपयोग करने के इच्छुक हैं, तो आप असीमित वीडियो पीढ़ियों का आनंद ले सकते हैं।

यह ध्यान रखना महत्वपूर्ण है कि रिज़ॉल्यूशन पर एक सीमा है, और वीडियो केवल 20 सेकंड तक लंबे हो सकते हैं। वे वाइडस्क्रीन, वर्टिकल या वर्गाकार पहलू अनुपात में उपलब्ध हैं।

विशिष्टताओं के लिए, ओपनएआई प्लस (या चैटजीपीटी प्लस) उपयोगकर्ता 50 वीडियो की सीमा के साथ 480पी रिज़ॉल्यूशन पर वीडियो उत्पन्न कर सकते हैं। जबकि 720p पीढ़ी संभव है, परिणामी वीडियो संख्या में कम होंगे।

उन्होंने कहा, अत्यधिक मांग के कारण, ओपनएआई वर्तमान में सोरा के लिए नए साइनअप की अनुमति नहीं दे रहा है। ओपनएआई के सीईओ सैम ऑल्टमैन ने पुष्टि की है कि साइनअप को अस्थायी रूप से रोक दिया गया है, लेकिन मांग स्थिर होने पर इसे फिर से शुरू किया जाएगा। उन्होंने उपयोगकर्ताओं को आश्वासन दिया कि OpenAI इन मुद्दों को जल्द से जल्द हल करने की पूरी कोशिश कर रहा है। हालाँकि, सभी को सोरा तक पहुंच प्राप्त करने में कुछ समय लग सकता है। यदि आपको जल्दी पहुंच नहीं मिलती है, तो यह उच्च मांग के कारण है।

यह भी पढ़ें: iPhone 17 Air, iPhone 16 Pro की तुलना में 2 मिमी पतला होने की संभावना है: अधिक विवरण यहां देखें

Source link

Related Articles

Back to top button