विज्ञान

एआई-सहायता प्राप्त जीनोमिक अध्ययन में लगातार समस्याएँ

क्यूओंगशी लू फोटो जो स्टर्बेंक द्वारा
क्यूओंगशी लू फोटो जो स्टर्बेंक द्वारा

विस्कॉन्सिन-मैडिसन विश्वविद्यालय के शोधकर्ता चेतावनी दे रहे हैं कि आनुवंशिकी और चिकित्सा के क्षेत्र में लोकप्रियता हासिल करने वाले कृत्रिम बुद्धिमत्ता उपकरण मधुमेह जैसी बीमारियों के जोखिम कारकों सहित जीन और शारीरिक विशेषताओं के बीच संबंध के बारे में त्रुटिपूर्ण निष्कर्ष निकाल सकते हैं।

दोषपूर्ण भविष्यवाणियाँ जीनोम-वाइड एसोसिएशन अध्ययन में सहायता के लिए शोधकर्ताओं द्वारा एआई के उपयोग से जुड़ी हैं। इस तरह के अध्ययन जीन और शारीरिक लक्षणों के बीच संबंधों की तलाश के लिए कई लोगों में सैकड़ों हजारों आनुवंशिक विविधताओं को स्कैन करते हैं। आनुवंशिक विविधताओं और कुछ बीमारियों के बीच संभावित संबंध विशेष रुचि के हैं।

आनुवंशिकी का बीमारी से संबंध हमेशा सीधा नहीं होता

आनुवंशिकी कई स्वास्थ्य स्थितियों के विकास में भूमिका निभाती है। जबकि कुछ व्यक्तिगत जीनों में परिवर्तन सीधे तौर पर सिस्टिक फाइब्रोसिस जैसी बीमारियों के बढ़ते जोखिम से जुड़े होते हैं, आनुवंशिकी और शारीरिक लक्षणों के बीच संबंध अक्सर अधिक जटिल होता है।

जीनोम-वाइड एसोसिएशन अध्ययनों ने इनमें से कुछ जटिलताओं को सुलझाने में मदद की है, अक्सर व्यक्तियों के आनुवंशिक प्रोफाइल और स्वास्थ्य विशेषताओं के बड़े डेटाबेस का उपयोग किया जाता है, जैसे कि नेशनल इंस्टीट्यूट ऑफ हेल्थ के ऑल ऑफ अस प्रोजेक्ट और यूके बायोबैंक। हालाँकि, इन डेटाबेस में अक्सर स्वास्थ्य स्थितियों के बारे में डेटा गायब होता है जिसका शोधकर्ता अध्ययन करने का प्रयास कर रहे हैं।

यूडब्ल्यू-मैडिसन डिपार्टमेंट ऑफ बायोस्टैटिस्टिक्स में एसोसिएट प्रोफेसर क्यूओंगशी लू कहते हैं, “कुछ विशेषताएं या तो बहुत महंगी हैं या मापने के लिए श्रम-गहन हैं, इसलिए आपके पास आनुवंशिकी के साथ उनके संबंध के बारे में सार्थक सांख्यिकीय निष्कर्ष निकालने के लिए पर्याप्त नमूने नहीं हैं।” और चिकित्सा सूचना विज्ञान और जीनोम-वाइड एसोसिएशन अध्ययन पर एक विशेषज्ञ।

एआई के साथ डेटा अंतराल को पाटने के जोखिम

शोधकर्ता अधिक से अधिक परिष्कृत एआई उपकरणों के साथ डेटा अंतराल को पाटकर इस समस्या को हल करने का प्रयास कर रहे हैं।

लू कहते हैं, “मशीन लर्निंग में प्रगति का लाभ उठाने के लिए यह हाल के वर्षों में बहुत लोकप्रिय हो गया है, इसलिए अब हमारे पास ये उन्नत मशीन-लर्निंग एआई मॉडल हैं जिनका उपयोग शोधकर्ता सीमित डेटा के साथ जटिल लक्षणों और बीमारी के जोखिमों की भविष्यवाणी करने के लिए करते हैं।”

अब, लू और उनके सहयोगियों ने इन मॉडलों पर भरोसा करने के जोखिम का प्रदर्शन किया है, बिना उन पूर्वाग्रहों के भी जो वे पेश कर सकते हैं। टीम ने हाल ही में नेचर जेनेटिक्स जर्नल में प्रकाशित एक पेपर में समस्या का वर्णन किया है। इसमें, लू और उनके सहयोगियों ने दिखाया कि जीनोम-वाइड एसोसिएशन अध्ययनों में नियोजित एक सामान्य प्रकार की मशीन लर्निंग एल्गोरिदम गलती से टाइप 2 मधुमेह के विकास के लिए किसी व्यक्ति के जोखिम के साथ कई आनुवंशिक विविधताओं को जोड़ सकता है।

लू कहते हैं, “समस्या यह है कि यदि आप मशीन लर्निंग द्वारा अनुमानित मधुमेह जोखिम को वास्तविक जोखिम मानते हैं, तो आप सोचेंगे कि उन सभी आनुवंशिक विविधताओं का वास्तविक मधुमेह से संबंध है, भले ही वे नहीं हैं।”

लू कहते हैं, ये “झूठी सकारात्मकताएं” इन विशिष्ट विविधताओं और मधुमेह के जोखिम तक सीमित नहीं हैं, बल्कि एआई-सहायता प्राप्त अध्ययनों में एक व्यापक पूर्वाग्रह हैं।

नई सांख्यिकीय पद्धति झूठी सकारात्मकता को कम कर सकती है

एआई उपकरणों पर अत्यधिक निर्भरता की समस्या की पहचान करने के अलावा, लू और उनके सहयोगियों ने एक सांख्यिकीय पद्धति का प्रस्ताव दिया है जिसका उपयोग शोधकर्ता अपने एआई-सहायता प्राप्त जीनोम-वाइड एसोसिएशन अध्ययनों की विश्वसनीयता की गारंटी के लिए कर सकते हैं। यह विधि उस पूर्वाग्रह को दूर करने में मदद करती है जो मशीन लर्निंग एल्गोरिदम तब पेश कर सकते हैं जब वे अधूरी जानकारी के आधार पर अनुमान लगा रहे हों।

“यह नई रणनीति सांख्यिकीय रूप से इष्टतम है,” लू कहते हैं, यह देखते हुए कि टीम ने इसका उपयोग व्यक्तियों के अस्थि खनिज घनत्व के साथ आनुवंशिक संबंधों को बेहतर ढंग से इंगित करने के लिए किया है।

कुछ जीनोम-व्यापी एसोसिएशन अध्ययनों में एआई एकमात्र समस्या नहीं है

जबकि समूह की प्रस्तावित सांख्यिकीय पद्धति एआई-सहायता प्राप्त अध्ययनों की सटीकता में सुधार करने में मदद कर सकती है, लू और उनके सहयोगियों ने हाल ही में इसी तरह के अध्ययनों के साथ समस्याओं की पहचान की है जो एल्गोरिदम के बजाय प्रॉक्सी जानकारी के साथ डेटा अंतराल को भरते हैं।

नेचर जेनेटिक्स में हाल ही में प्रकाशित एक अन्य पेपर में, शोधकर्ताओं ने उन अध्ययनों के बारे में चेतावनी दी है जो आनुवंशिकी और कुछ बीमारियों के बीच संबंध स्थापित करने के प्रयास में प्रॉक्सी जानकारी पर अत्यधिक भरोसा करते हैं।

उदाहरण के लिए, यूके बायोबैंक जैसे बड़े स्वास्थ्य डेटाबेस में बड़ी आबादी के बारे में ढेर सारी आनुवंशिक जानकारी होती है, लेकिन उनके पास उन बीमारियों की घटनाओं के बारे में बहुत अधिक डेटा नहीं होता है जो जीवन में बाद में उत्पन्न होती हैं, जैसे कि अधिकांश न्यूरोडीजेनेरेटिव रोग।

विशेष रूप से अल्जाइमर रोग के लिए, कुछ शोधकर्ताओं ने पारिवारिक स्वास्थ्य इतिहास सर्वेक्षणों के माध्यम से एकत्र किए गए प्रॉक्सी डेटा के साथ उस अंतर को पाटने का प्रयास किया है, जहां व्यक्ति माता-पिता के अल्जाइमर निदान की रिपोर्ट कर सकते हैं।

यूडब्ल्यू-मैडिसन टीम ने पाया कि इस तरह के प्रॉक्सी-सूचना अध्ययन अल्जाइमर के जोखिम और उच्च संज्ञानात्मक क्षमताओं के बीच “अत्यधिक भ्रामक आनुवंशिक सहसंबंध” उत्पन्न कर सकते हैं।

लू कहते हैं, “इन दिनों, जीनोमिक वैज्ञानिक नियमित रूप से बायोबैंक डेटासेट के साथ काम करते हैं जिनमें सैकड़ों हजारों व्यक्ति होते हैं; हालांकि, जैसे-जैसे सांख्यिकीय शक्ति बढ़ती है, इन विशाल डेटासेट में पूर्वाग्रह और त्रुटियों की संभावना भी बढ़ जाती है।” “हमारे समूह के हालिया अध्ययन विनम्र उदाहरण प्रदान करते हैं और बायोबैंक-स्केल अनुसंधान अध्ययनों में सांख्यिकीय कठोरता के महत्व पर प्रकाश डालते हैं।”

165 बासकॉम हॉल
500 लिंकन ड्राइव
मैडिसन, 53706

ईमेल:
: 608'265 -4151
प्रतिक्रिया या प्रश्न? विस्कॉन्सिन प्रणाली विश्वविद्यालय

Source

Related Articles

Back to top button