ईवो से मिलें, एक एआई मॉडल जो 'अद्वितीय सटीकता' के साथ जीन उत्परिवर्तन के प्रभावों की भविष्यवाणी कर सकता है

वैज्ञानिकों ने एक नए प्रकार का मशीन लर्निंग मॉडल विकसित किया है जो आनुवंशिक निर्देशों को समझ और डिजाइन कर सकता है।
मॉडल, जिसे ईवो कहा जाता है, आनुवंशिक उत्परिवर्तन के प्रभावों की भविष्यवाणी कर सकता है और नए डीएनए अनुक्रम उत्पन्न कर सकता है – हालांकि वे डीएनए अनुक्रम जीवित जीवों के डीएनए से निकटता से मेल नहीं खाते हैं।
हालांकि, समय और प्रशिक्षण के साथ, ईवो और इसी तरह के मॉडल वैज्ञानिकों को विभिन्न डीएनए और आरएनए अनुक्रमों के कार्यों को समझने और बीमारी को कम करने में मदद कर सकते हैं, शोधकर्ताओं ने जर्नल में 15 नवंबर को प्रकाशित एक नए अध्ययन में लिखा है। विज्ञान.
ईवो एक प्रकार है कृत्रिम होशियारी (एआई) प्रणाली को बड़े भाषा मॉडल (एलएलएम) कहा जाता है, जो ओपनएआई के जीपीटी-4 या गूगल के समान है मिथुन. शोधकर्ता और डेवलपर्स इंटरनेट जैसे सार्वजनिक रूप से उपलब्ध संसाधनों से बड़ी मात्रा में डेटा पर एलएलएम को प्रशिक्षित करते हैं, और एलएलएम सामान्य वाक्यांशों या विशिष्ट वाक्य संरचनाओं जैसे पैटर्न की तलाश करते हैं, एक-एक करके वाक्य में शब्दों की आपूर्ति करने के लिए उन पैटर्न का उपयोग करते हैं।
अधिक सामान्य एलएलएम के विपरीत, ईवो को शब्दों पर प्रशिक्षित नहीं किया जाता है। इसके बजाय, इसे लाखों रोगाणुओं के जीनोम पर प्रशिक्षित किया जाता है – आर्किया, बैक्टीरिया और वायरस जो उन्हें संक्रमित करते हैं, लेकिन पौधों और जानवरों जैसे यूकेरियोटिक जीवों पर नहीं। प्रत्येक आधार जोड़ी – मूल रासायनिक इकाइयाँ जो डीएनए बनाती हैं – उन जीनोम से मॉडल में एक “शब्द” के रूप में कार्य करती हैं। इसके बाद इवो अपने प्रशिक्षण सेट के आधार जोड़े के अनुक्रमों की तुलना करके यह अनुमान लगाता है कि डीएनए का एक स्ट्रैंड कैसे काम करेगा, या नई आनुवंशिक सामग्री उत्पन्न करेगा।
अन्य मॉडलों ने आनुवंशिक जानकारी की जांच के लिए पहले से ही मशीन लर्निंग और यहां तक कि एलएलएम का उपयोग किया है। वैज्ञानिकों ने अध्ययन में लिखा है, लेकिन अब तक वे विशेष कार्यों तक ही सीमित रहे हैं या उच्च कम्प्यूटेशनल लागत से बाधित हुए हैं। इसके विपरीत, ईवो सूचनाओं की लंबी श्रृंखला को संसाधित करने के लिए एक तेज़, उच्च-रिज़ॉल्यूशन मॉडल का उपयोग करता है, जो इसे जीनोम पैमाने पर पैटर्न का विश्लेषण करने और बड़े पैमाने पर इंटरैक्शन के बारे में जानकारी प्राप्त करने की अनुमति देता है जो अधिक विशिष्ट मॉडल से छूट सकते हैं।
लेखकों ने कार्यों की एक श्रृंखला पर इवो का परीक्षण किया। ईवो ने भविष्यवाणी की कि आनुवंशिक उत्परिवर्तन प्रोटीन संरचनाओं को कैसे प्रभावित करेंगे, उस कार्य के लिए विशेष रूप से प्रशिक्षित मॉडल की तुलना में प्रदर्शन करेंगे। इसने प्रोटीन और आरएनए घटकों का एक सेट भी उत्पन्न किया जो प्रयोगशाला परीक्षणों में वायरल संक्रमण से बचाता है।
ईवो ने पूरे जीनोम के आकार के डीएनए के अनुक्रम भी तैयार किए – लेकिन वह डीएनए जरूरी नहीं कि किसी चीज़ को जीवित रखे। कुछ आनुवंशिक निर्देश मौजूदा जीवों के डीएनए के समान थे। पहली नज़र में अन्य भी एक जैसे दिखते थे, लेकिन करीब से निरीक्षण करने पर कुछ समझ में नहीं आता था, बहुत अधिक उंगलियों वाले व्यक्ति की एआई-जनरेटेड छवि के समान। उदाहरण के लिए, ईवो-जनरेटेड डीएनए में एन्कोड की गई कई प्रोटीन संरचनाएं प्राकृतिक रूप से पाए जाने वाले प्रोटीन से मेल नहीं खाती हैं।
शोधकर्ताओं ने अध्ययन में लिखा है, “ये नमूने एक जीनोम की 'धुंधली छवि' का प्रतिनिधित्व करते हैं जिसमें प्रमुख विशेषताएं हैं लेकिन प्राकृतिक जीनोम के विशिष्ट सूक्ष्म विवरणों का अभाव है।”
उन्होंने केवल इवो को माइक्रोबियल जीनोम पर प्रशिक्षित किया, इसलिए मानव आनुवंशिक उत्परिवर्तन के प्रभावों की भविष्यवाणी करना अभी भी इसकी समझ से बाहर है। गंभीर रूप से, टीम ने प्रदर्शन में सुधार के साथ ईवो जैसे उपकरणों के दुरुपयोग को रोकने के लिए सुरक्षा और नैतिकता दिशानिर्देशों की आवश्यकता पर जोर दिया। विशेष रूप से, टीम ने संक्रमित करने वाले वायरल जीनोम के डेटा को बाहर कर दिया यूकेरियोटिक मेजबान.
शोधकर्ताओं ने लिखा, “दुरुपयोग को रोकने और मौजूदा और उभरते खतरों को कम करने के लिए प्रभावी रणनीतियों को बढ़ावा देने के लिए वैज्ञानिक समुदाय, सुरक्षा विशेषज्ञों और नीति-निर्माताओं को शामिल करते हुए एक सक्रिय चर्चा जरूरी है।”