नया एआई टूल बेजोड़ परिशुद्धता के साथ जीन स्प्लिसिंग का पता लगाता है

जॉन्स हॉपकिन्स शोधकर्ताओं का एक हालिया नवाचार जीन फ़ंक्शन और रोग से जुड़े उत्परिवर्तन में गहरी अंतर्दृष्टि सक्षम बनाता है

जॉन्स हॉपकिन्स के शोधकर्ताओं ने स्प्लैम नामक एक शक्तिशाली नया एआई उपकरण विकसित किया है जो यह पहचान सकता है कि जीन में स्प्लिसिंग कहां होती है – एक अग्रिम जो वैज्ञानिकों को अधिक सटीकता के साथ आनुवंशिक डेटा का विश्लेषण करने में मदद कर सकता है, जिससे जीन कैसे कार्य करते हैं और उत्परिवर्तन बीमारी में योगदान करते हैं, इस बारे में नई अंतर्दृष्टि प्रदान करते हैं।
उनके नतीजे सामने आते हैं जीनोम जीवविज्ञान .
चाबी छीनना
- स्प्लैम नामक एक एआई उपकरण उत्परिवर्तन और बीमारी के बीच संभावित संबंधों का पता लगाने के लिए मौजूदा तरीकों की तुलना में अधिक सटीकता के साथ आनुवंशिक डेटा का विश्लेषण करता है
- स्प्लैम ब्याह स्थलों को पहचानकर काम करता है, जहां कोशिकाएं गैर-जरूरी हिस्सों को काट देती हैं
- डीएनए के कार्यात्मक भागों और शरीर में उनकी भूमिका की पहचान करने के लिए जीन प्रतिलेखों को इकट्ठा करने में स्प्लिस साइटों को पहचानना एक महत्वपूर्ण कदम है।
व्हिटिंग स्कूल ऑफ इंजीनियरिंग के कंप्यूटर साइंस विभाग में डॉक्टरेट के उम्मीदवार और सेंटर फॉर कम्प्यूटेशनल बायोलॉजी (सीसीबी) से संबद्ध सह-प्रमुख लेखक कुआन-हाओ चाओ कहते हैं, “स्प्लिसिंग साइटों की सटीक पहचान करना यह समझने की कुंजी है कि कोशिकाएं आनुवंशिक निर्देशों की व्याख्या कैसे करती हैं।” ). “स्प्लैम हमें आनुवंशिक डेटा का सटीकता और दक्षता के साथ विश्लेषण करने देता है, जिससे पता चलता है कि उत्परिवर्तन हमारे स्वास्थ्य को कैसे प्रभावित करते हैं और क्यों एक ही जीन विभिन्न परिस्थितियों में विभिन्न प्रोटीन का उत्पादन कर सकता है।”
इस परियोजना में उनके सलाहकार शामिल हैं – ब्लूमबर्ग कम्प्यूटेशनल बायोलॉजी और जीनोमिक्स के प्रतिष्ठित प्रोफेसर और सीसीबी के निदेशक स्टीवन साल्ज़बर्ग, और विभाग में एक माध्यमिक नियुक्ति के साथ बायोमेडिकल इंजीनियरिंग और जेनेटिक मेडिसिन के एसोसिएट प्रोफेसर मिहेला पर्टिया। कंप्यूटर विज्ञान के साथ-साथ एलन माओ, बायोमेडिकल इंजीनियरिंग और कंप्यूटर विज्ञान में चौथे वर्ष की स्नातक दोहरी पढ़ाई।
कोशिकाएं अपने कार्यों को निर्देशित करने के लिए जीन पर भरोसा करती हैं, प्रत्येक जीन में उपयोगी निर्देश (जिन्हें एक्सॉन कहा जाता है) और गैर-आवश्यक खंड (जिन्हें इंट्रॉन कहा जाता है) दोनों होते हैं। स्प्लिसिंग वह प्रक्रिया है जिसके द्वारा कोशिकाएं गैर-आवश्यक भागों को काट देती हैं, केवल वही बचाती हैं जो आवश्यक है।
शोधकर्ताओं के अनुसार, स्प्लिस साइटों को कम्प्यूटेशनल रूप से पहचानना आधुनिक आनुवंशिकी अध्ययनों में जीन प्रतिलेखों को सटीक रूप से इकट्ठा करने में एक महत्वपूर्ण कदम है, जहां आरएनए अनुक्रमण प्रयोग उस स्तर को मापते हैं जिस पर एक जीन व्यक्त होता है-मूल रूप से, चाहे वह अलग-अलग स्थितियों में चालू या बंद हो।
चाओ कहते हैं, “उदाहरण के लिए, कैंसर शोधकर्ता अक्सर स्वस्थ बनाम कैंसरग्रस्त कोशिकाओं में जीन अभिव्यक्ति की तुलना करने के लिए आरएनए अनुक्रमण तकनीकों का उपयोग करते हैं।”
जीनोम को एनोटेट करने में स्प्लिस साइटों की पहचान करना भी महत्वपूर्ण है, जिसमें यह पहचानना शामिल है कि हमारे डीएनए के कौन से हिस्से कार्यात्मक हैं और वे शरीर में क्या भूमिका निभाते हैं। जीनोम एनोटेशन का एक परिचित अनुप्रयोग आनुवंशिक परीक्षण सेवाओं में है, जैसे कि 23andMe जैसी कंपनियों द्वारा पेश की जाने वाली सेवाएँ। ये परीक्षण आपके वंश, स्वास्थ्य जोखिमों और आनुवंशिक लक्षणों के बारे में बताने के लिए आपके जीनोम के कुछ हिस्सों का विश्लेषण करते हैं। जीनोम एनोटेशन मानव जीनोम के इन क्षेत्रों की पहचान और व्याख्या करके इसे संभव बनाता है।
अत्याधुनिक “स्प्लिसएआई” टूल की तुलना में, हॉपकिंस टीम की “स्प्लैम” विधि आरएनए स्प्लिस साइटों की भविष्यवाणी करने के लिए बहुत छोटी डीएनए अनुक्रम विंडो का उपयोग करती है, जिससे इसका मॉडल अधिक जैविक रूप से यथार्थवादी और अनुसंधान में उपयोग के लिए व्यवहार्य हो जाता है, चाओ कहते हैं। .

टीम का स्प्लैम एल्गोरिदम संभावित दाता और स्वीकर्ता साइटों के दोनों तरफ 800 न्यूक्लियोटाइड – 400 प्रत्येक एडेनिन (ए), साइटोसिन (सी), गुआनिन (जी), और थाइमिन (टी) का डीएनए अनुक्रम लेता है और संभावना को आउटपुट करता है। प्रत्येक आधार जोड़ी के लिए एक दाता साइट, एक स्वीकर्ता साइट, या कुछ भी नहीं।
चाओ कहते हैं, “हमारा एल्गोरिदम इन दाता/स्वीकर्ता साइटों को जोड़े में पहचानने का प्रयास करता है, जैसे एक स्प्लिसोसम 'आण्विक मशीन' कोशिका में करती है जब यह एक इंट्रॉन को काटती है।”
शोधकर्ताओं ने 800 न्यूक्लियोटाइड्स की विंडो के भीतर स्प्लिस जंक्शनों को पहचानने के लिए अपना एल्गोरिदम विकसित किया – स्प्लिस एआई द्वारा आवश्यक 10,000 न्यूक्लियोटाइड्स की तुलना में बहुत छोटा क्षेत्र। टीम की रिपोर्ट है कि कम जीनोमिक डेटा की आवश्यकता के बावजूद, स्प्लैम स्प्लिसएआई की तुलना में बेहतर स्प्लिस जंक्शन पहचान सटीकता प्राप्त करता है।
मानव डीएनए पर अपने गहन शिक्षण मॉडल को प्रशिक्षित करने के बाद, शोधकर्ताओं ने अन्य प्रजातियों के आनुवंशिक कोड पर अतिरिक्त परीक्षण किए।
चाओ कहते हैं, “गहन शिक्षण विधियों के बारे में अक्सर चिंता यह होती है कि क्या वे केवल अपने प्रशिक्षण डेटा को याद रखते हैं या क्या उनके पूर्वानुमानित मॉडल उस डेटा पर काम करेंगे जो उन्होंने प्रशिक्षण में देखा है।” “तो यह मूल्यांकन करने के लिए कि क्या स्प्लैम ने अधिक सामान्य स्प्लिसिंग नियम सीखे हैं, हमने लगातार तीन अधिक दूर की प्रजातियों से डेटा एकत्र किया और उनमें से प्रत्येक पर पुन: प्रशिक्षण के बिना एल्गोरिदम लागू किया।”
टीम ने चिंपैंजी, चूहे और सरसों परिवार के एक फूल वाले पौधे के जीनोम को चुना। उनके बाद के प्रयोगों से पता चला कि स्प्लैम के जैविक रूप से प्रेरित डिज़ाइन ने अभी भी इन अधिक दूर के डीएनए अनुक्रमों पर अत्यधिक सटीक परिणाम उत्पन्न किए हैं – यह दिखाते हुए कि उनकी विधि ने वास्तव में कई जानवरों और पौधों में साझा किए गए आवश्यक स्प्लिसिंग पैटर्न सीखे हैं।
टीम के अगले कदमों में इसके मॉडल को अधिक प्रजातियों पर लागू करना और ट्रांसक्रिप्टोम असेंबली में व्यावहारिक उपयोग के लिए मौजूदा आरएनए अनुक्रमण पाइपलाइनों में इसकी विधि को एकीकृत करना शामिल है।
चाओ कहते हैं, “हमारी विधि में ट्रांसक्रिप्टोम असेंबली में सुधार और स्प्लिसिंग शोर को कम करने में तत्काल अनुप्रयोग हैं, जो इसे जीनोमिक अध्ययनों की एक विस्तृत श्रृंखला के लिए मूल्यवान बनाता है।” “हमें उम्मीद है कि स्प्लैम हमारे जीनोम और उनके भीतर के जीन की बेहतर समझ में योगदान देगा।”
स्वास्थ्य, विज्ञान+प्रौद्योगिकी
आनुवंशिकी, कंप्यूटर विज्ञान, कृत्रिम बुद्धि



