शोधकर्ताओं ने बायोमोलेक्यूलर संरचनाओं की भविष्यवाणी के लिए एक पूरी तरह से ओपन-सोर्स मॉडल बोल्ट्ज़-1 पेश किया है


एमआईटी शोधकर्ताओं ने बायोमोलेक्यूलर संरचनाओं की भविष्यवाणी के लिए पूरी तरह से ओपन-सोर्स मॉडल बोल्ट्ज़-1 पेश किया है
अल्फाफोल्ड3 जैसे मॉडल अकादमिक अनुसंधान तक सीमित होने के कारण, टीम ने नवाचार को अधिक व्यापक रूप से प्रोत्साहित करने के लिए एक समकक्ष विकल्प बनाया।
एमआईटी वैज्ञानिकों ने बोल्ट्ज़-1 नामक एक शक्तिशाली, ओपन-सोर्स एआई मॉडल जारी किया है, जो बायोमेडिकल अनुसंधान और दवा विकास में काफी तेजी ला सकता है।
स्वास्थ्य में मशीन लर्निंग के लिए एमआईटी जमील क्लिनिक में शोधकर्ताओं की एक टीम द्वारा विकसित, बोल्ट्ज-1 पहला पूर्णतः ओपन-सोर्स मॉडल है जो Google DeepMind के मॉडल अल्फाफोल्ड3 के स्तर पर अत्याधुनिक प्रदर्शन प्राप्त करता है। प्रोटीन और अन्य जैविक अणुओं की 3डी संरचनाओं की भविष्यवाणी करता है।
एमआईटी स्नातक छात्र जेरेमी वोहलवेंड और गैब्रिएल कोरसो, एमआईटी जमील क्लिनिक रिसर्च एफिलिएट सारो पासारो और इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान के एमआईटी प्रोफेसर रेजिना बार्ज़िले और टॉमी जाक्कोला के साथ बोल्ट्ज़-1 के प्रमुख डेवलपर्स थे। वोहलवेंड और कोरसो ने एमआईटी के स्टाटा सेंटर में 5 दिसंबर के एक कार्यक्रम में मॉडल प्रस्तुत किया, जहां उन्होंने कहा कि उनका अंतिम लक्ष्य वैश्विक सहयोग को बढ़ावा देना, खोजों में तेजी लाना और बायोमोलेक्यूलर मॉडलिंग को आगे बढ़ाने के लिए एक मजबूत मंच प्रदान करना है।
कोरसो ने कहा, “हमें उम्मीद है कि यह समुदाय के लिए एक शुरुआती बिंदु होगा।” “एक कारण है कि हम इसे बोल्ट्ज़ नहीं बल्कि बोल्ट्ज़-1 कहते हैं। यह पंक्ति का अंत नहीं है। हम समुदाय से उतना योगदान चाहते हैं जितना हम प्राप्त कर सकते हैं।”
प्रोटीन लगभग सभी जैविक प्रक्रियाओं में एक आवश्यक भूमिका निभाते हैं। एक प्रोटीन का आकार उसके कार्य से निकटता से जुड़ा होता है, इसलिए नई दवाओं को डिजाइन करने या विशिष्ट कार्यक्षमता वाले नए प्रोटीन की इंजीनियरिंग के लिए प्रोटीन की संरचना को समझना महत्वपूर्ण है। लेकिन बेहद जटिल प्रक्रिया के कारण, जिसके द्वारा प्रोटीन की अमीनो एसिड की लंबी श्रृंखला को 3डी संरचना में बदल दिया जाता है, उस संरचना की सटीक भविष्यवाणी करना दशकों से एक बड़ी चुनौती रही है।
डीपमाइंड का अल्फाफोल्ड2, जिसने डेमिस हसाबिस और जॉन जम्पर को रसायन विज्ञान में 2024 का नोबेल पुरस्कार दिलाया, 3डी प्रोटीन संरचनाओं की तेजी से भविष्यवाणी करने के लिए मशीन लर्निंग का उपयोग करता है जो इतनी सटीक हैं कि वे वैज्ञानिकों द्वारा प्रयोगात्मक रूप से प्राप्त संरचनाओं से अप्रभेद्य हैं। इस ओपन-सोर्स मॉडल का उपयोग दुनिया भर में अकादमिक और वाणिज्यिक अनुसंधान टीमों द्वारा किया गया है, जिससे दवा विकास में कई प्रगति हुई है।
अल्फाफोल्ड3 एक जनरेटिव एआई मॉडल को शामिल करके अपने पूर्ववर्तियों में सुधार करता है, जिसे प्रसार मॉडल के रूप में जाना जाता है, जो बेहद जटिल प्रोटीन संरचनाओं की भविष्यवाणी में शामिल अनिश्चितता की मात्रा को बेहतर ढंग से संभाल सकता है। हालाँकि, AlphaFold2 के विपरीत, AlphaFold3 पूरी तरह से खुला स्रोत नहीं है, न ही यह व्यावसायिक उपयोग के लिए उपलब्ध है, जिसने वैज्ञानिक समुदाय की आलोचना को प्रेरित किया और मॉडल का व्यावसायिक रूप से उपलब्ध संस्करण बनाने के लिए वैश्विक दौड़ शुरू कर दी।
बोल्ट्ज़-1 पर अपने काम के लिए, एमआईटी शोधकर्ताओं ने अल्फाफोल्ड3 के समान प्रारंभिक दृष्टिकोण का पालन किया, लेकिन अंतर्निहित प्रसार मॉडल का अध्ययन करने के बाद, उन्होंने संभावित सुधारों का पता लगाया। उन्होंने उन लोगों को शामिल किया जिन्होंने मॉडल की सटीकता को सबसे अधिक बढ़ाया, जैसे कि नए एल्गोरिदम जो भविष्यवाणी दक्षता में सुधार करते हैं।

मॉडल के साथ-साथ, उन्होंने प्रशिक्षण और फाइन-ट्यूनिंग के लिए अपनी पूरी पाइपलाइन को ओपन-सोर्स कर दिया ताकि अन्य वैज्ञानिक बोल्ट्ज़-1 पर निर्माण कर सकें।
बार्ज़िले कहते हैं, “इस रिलीज़ को संभव बनाने के लिए मुझे जेरेमी, गैब्रिएल, सरो और जमील क्लिनिक टीम के बाकी सदस्यों पर बेहद गर्व है। इसमें और सुधार के लिए कई रोमांचक विचार हैं और हम आने वाले महीनों में उन्हें साझा करने के लिए उत्सुक हैं।” .
बोल्ट्ज़-1 को विकसित करने में एमआईटी टीम को चार महीने की मेहनत और कई प्रयोग करने पड़े। उनकी सबसे बड़ी चुनौतियों में से एक प्रोटीन डेटा बैंक में निहित अस्पष्टता और विविधता पर काबू पाना था, जो सभी जैव-आणविक संरचनाओं का एक संग्रह है जिसे हजारों जीवविज्ञानियों ने पिछले 70 वर्षों में हल किया है।
वोहलवेंड कहते हैं, “मुझे इस डेटा के साथ कई लंबी रातें जूझनी पड़ीं। इसमें से बहुत कुछ शुद्ध डोमेन ज्ञान है जिसे बस हासिल करना होता है। कोई शॉर्टकट नहीं है।”
अंत में, उनके प्रयोगों से पता चलता है कि बोल्ट्ज़-1 जटिल जैव-आणविक संरचना भविष्यवाणियों के विविध सेट पर अल्फाफोल्ड3 के समान सटीकता प्राप्त करता है।
जाक्कोला कहते हैं, “जेरेमी, गेब्रियल और सरो ने जो हासिल किया है वह उल्लेखनीय से कम नहीं है। इस परियोजना पर उनकी कड़ी मेहनत और दृढ़ता ने जैव-आणविक संरचना की भविष्यवाणी को व्यापक समुदाय के लिए अधिक सुलभ बना दिया है और आणविक विज्ञान में प्रगति में क्रांतिकारी बदलाव आएगा।”
शोधकर्ताओं ने बोल्ट्ज़-1 के प्रदर्शन में सुधार जारी रखने और भविष्यवाणियां करने में लगने वाले समय को कम करने की योजना बनाई है। वे शोधकर्ताओं को अपने GitHub रिपॉजिटरी पर बोल्ट्ज़-1 को आज़माने और अपने स्लैक चैनल पर बोल्ट्ज़-1 के साथी उपयोगकर्ताओं के साथ जुड़ने के लिए भी आमंत्रित करते हैं।
वोहलवेंड कहते हैं, “हमें लगता है कि इन मॉडलों को बेहतर बनाने के लिए अभी भी कई वर्षों का काम बाकी है। हम दूसरों के साथ सहयोग करने और यह देखने के लिए बहुत उत्सुक हैं कि समुदाय इस टूल के साथ क्या करता है।”
पैराबिलिस मेडिसिन्स के सीईओ और अध्यक्ष मथाई माम्मेन बोल्ट्ज़-1 को एक “सफलतापूर्ण” मॉडल कहते हैं। वे कहते हैं, “इस प्रगति को ओपन सोर्स करके, एमआईटी जमील क्लिनिक और सहयोगी अत्याधुनिक संरचनात्मक जीव विज्ञान उपकरणों तक पहुंच का लोकतंत्रीकरण कर रहे हैं।” “यह ऐतिहासिक प्रयास जीवन बदलने वाली दवाओं के निर्माण में तेजी लाएगा। इस गहरी छलांग को आगे बढ़ाने के लिए बोल्ट्ज़-1 टीम को धन्यवाद!”
जीवविज्ञान के एमआईटी और व्हाइटहेड इंस्टीट्यूट फॉर बायोमेडिकल इंजीनियरिंग के सदस्य जोनाथन वीसमैन, जो अध्ययन में शामिल नहीं थे, कहते हैं, “बोल्ट्ज़ -1 मेरी प्रयोगशाला और पूरे समुदाय के लिए बेहद सक्षम होगा।” “हम इस शक्तिशाली उपकरण का लोकतंत्रीकरण करके संभव की गई खोजों की एक पूरी श्रृंखला देखेंगे।” वीज़मैन कहते हैं कि उनका अनुमान है कि बोल्ट्ज़-1 की ओपन-सोर्स प्रकृति रचनात्मक नए अनुप्रयोगों की एक विशाल श्रृंखला को जन्म देगी।