एक शोध परिकल्पना की आवश्यकता है? एआई से पूछें


एमआईटी इंजीनियरों ने साक्ष्य-संचालित परिकल्पनाओं की पहचान करने के लिए एआई फ्रेमवर्क विकसित किया है जो जैविक रूप से प्रेरित सामग्रियों को आगे बढ़ा सकते हैं।
एक अद्वितीय और आशाजनक शोध परिकल्पना तैयार करना किसी भी वैज्ञानिक के लिए एक मौलिक कौशल है। इसमें समय भी लग सकता है: नए पीएचडी उम्मीदवार अपने कार्यक्रम का पहला वर्ष यह तय करने में बिता सकते हैं कि उनके प्रयोगों में वास्तव में क्या खोजना है। क्या होगा अगर कृत्रिम बुद्धिमत्ता मदद कर सके?
एमआईटी शोधकर्ताओं ने मानव-एआई सहयोग के माध्यम से सभी क्षेत्रों में आशाजनक अनुसंधान परिकल्पनाओं को स्वायत्त रूप से उत्पन्न करने और मूल्यांकन करने का एक तरीका बनाया है। एक नए पेपर में, उन्होंने वर्णन किया है कि कैसे उन्होंने इस ढांचे का उपयोग साक्ष्य-संचालित परिकल्पनाओं को बनाने के लिए किया जो जैविक रूप से प्रेरित सामग्रियों के क्षेत्र में अधूरी अनुसंधान आवश्यकताओं के साथ संरेखित हैं।
बुधवार को प्रकाशित उन्नत सामग्री अध्ययन के सह-लेखक अलिर्ज़ा ग़फ़रोलाही, प्रयोगशाला में परमाणु और आणविक यांत्रिकी (एलएएमएम) के पोस्टडॉक, और मार्कस ब्यूहलर, एमआईटी के सिविल और पर्यावरण इंजीनियरिंग और मैकेनिकल इंजीनियरिंग विभागों में इंजीनियरिंग में जेरी मैक्एफ़ी प्रोफेसर और निदेशक हैं। लम.
ढांचा, जिसे शोधकर्ता SciAgents कहते हैं, में कई AI एजेंट शामिल हैं, जिनमें से प्रत्येक के पास विशिष्ट क्षमताएं और डेटा तक पहुंच है, जो “ग्राफ़ रीजनिंग” विधियों का लाभ उठाते हैं, जहां AI मॉडल एक ज्ञान ग्राफ का उपयोग करते हैं जो विभिन्न वैज्ञानिक अवधारणाओं के बीच संबंधों को व्यवस्थित और परिभाषित करता है। बहु-एजेंट दृष्टिकोण उस तरह की नकल करता है जिस तरह से जैविक प्रणालियाँ खुद को प्राथमिक निर्माण खंडों के समूह के रूप में व्यवस्थित करती हैं। ब्यूहलर का कहना है कि यह “फूट डालो और जीतो” सिद्धांत जीव विज्ञान में कई स्तरों पर एक प्रमुख प्रतिमान है, सामग्री से लेकर कीड़ों के झुंड तक और सभ्यताओं तक – सभी उदाहरण जहां कुल बुद्धि व्यक्तियों की क्षमताओं के योग से कहीं अधिक है।
ब्यूहलर कहते हैं, “कई एआई एजेंटों का उपयोग करके, हम उस प्रक्रिया का अनुकरण करने की कोशिश कर रहे हैं जिसके द्वारा वैज्ञानिकों के समुदाय खोज करते हैं।” “एमआईटी में, हम अलग-अलग पृष्ठभूमि वाले लोगों के एक समूह को एक साथ काम करके और कॉफी की दुकानों पर या एमआईटी के अनंत गलियारे में एक-दूसरे से टकराकर ऐसा करते हैं। लेकिन यह बहुत संयोगपूर्ण और धीमा है। हमारी खोज खोज की प्रक्रिया को अनुकरण करने की है क्या एआई सिस्टम रचनात्मक हो सकते हैं और खोज कर सकते हैं।”
अच्छे विचारों को स्वचालित करना
जैसा कि हाल के विकासों ने प्रदर्शित किया है, बड़े भाषा मॉडल (एलएलएम) ने सवालों के जवाब देने, जानकारी को सारांशित करने और सरल कार्यों को निष्पादित करने की प्रभावशाली क्षमता दिखाई है। लेकिन जब शुरुआत से नए विचार उत्पन्न करने की बात आती है तो वे काफी सीमित होते हैं। एमआईटी शोधकर्ता एक ऐसी प्रणाली डिजाइन करना चाहते थे जो एआई मॉडल को अधिक परिष्कृत, मल्टीस्टेप प्रक्रिया करने में सक्षम बनाए जो प्रशिक्षण के दौरान सीखी गई जानकारी को याद करने, नए ज्ञान का विस्तार करने और बनाने से परे हो।
उनके दृष्टिकोण का आधार एक ऑन्टोलॉजिकल ज्ञान ग्राफ है, जो विविध वैज्ञानिक अवधारणाओं को व्यवस्थित और उनके बीच संबंध बनाता है। ग्राफ़ बनाने के लिए, शोधकर्ता वैज्ञानिक पत्रों का एक सेट एक जेनरेटिव एआई मॉडल में फीड करते हैं। पिछले काम में, ब्यूहलर ने एआई मॉडल को वैज्ञानिक अवधारणाओं के अमूर्त को ग्राफ के रूप में विकसित करने में मदद करने के लिए श्रेणी सिद्धांत के रूप में जाने जाने वाले गणित के एक क्षेत्र का उपयोग किया, जो घटकों के बीच संबंधों को परिभाषित करने में निहित है, इस तरह से ग्राफ रीजनिंग नामक प्रक्रिया के माध्यम से अन्य मॉडलों द्वारा विश्लेषण किया जा सकता है। . यह अवधारणाओं को समझने के लिए अधिक सैद्धांतिक तरीका विकसित करने पर एआई मॉडल पर ध्यान केंद्रित करता है; यह उन्हें सभी डोमेन में बेहतर सामान्यीकरण करने की भी अनुमति देता है।
ब्यूहलर कहते हैं, “विज्ञान-केंद्रित एआई मॉडल बनाना हमारे लिए वास्तव में महत्वपूर्ण है, क्योंकि वैज्ञानिक सिद्धांत आम तौर पर केवल ज्ञान स्मरण के बजाय सामान्यीकृत सिद्धांतों में निहित होते हैं।” “इस तरह से एआई मॉडल को 'सोच' पर केंद्रित करके, हम पारंपरिक तरीकों से आगे निकल सकते हैं और एआई के अधिक रचनात्मक उपयोग का पता लगा सकते हैं।”
सबसे हालिया पेपर के लिए, शोधकर्ताओं ने जैविक सामग्रियों पर लगभग 1,000 वैज्ञानिक अध्ययनों का उपयोग किया, लेकिन ब्यूहलर का कहना है कि किसी भी क्षेत्र से कहीं अधिक या कम शोध पत्रों का उपयोग करके ज्ञान ग्राफ उत्पन्न किया जा सकता है।
ग्राफ स्थापित होने के साथ, शोधकर्ताओं ने वैज्ञानिक खोज के लिए एक एआई सिस्टम विकसित किया, जिसमें सिस्टम में विशिष्ट भूमिका निभाने के लिए कई मॉडल विशेष थे। अधिकांश घटक OpenAI के ChatGPT-4 श्रृंखला मॉडल से बनाए गए थे और इन-संदर्भ शिक्षण के रूप में जानी जाने वाली तकनीक का उपयोग किया गया था, जिसमें संकेत सिस्टम में मॉडल की भूमिका के बारे में प्रासंगिक जानकारी प्रदान करते हैं, जबकि इसे प्रदान किए गए डेटा से सीखने की अनुमति देते हैं।
ढांचे में व्यक्तिगत एजेंट एक जटिल समस्या को सामूहिक रूप से हल करने के लिए एक-दूसरे के साथ बातचीत करते हैं जिसे उनमें से कोई भी अकेले नहीं कर पाएगा। उन्हें जो पहला काम दिया जाता है वह शोध परिकल्पना तैयार करना है। एलएलएम इंटरैक्शन ज्ञान ग्राफ से एक सबग्राफ को परिभाषित करने के बाद शुरू होता है, जो यादृच्छिक रूप से या कागजात में चर्चा किए गए कीवर्ड की एक जोड़ी को मैन्युअल रूप से दर्ज करके हो सकता है।
ढांचे में, एक भाषा मॉडल जिसे शोधकर्ताओं ने “ओन्टोलॉजिस्ट” नाम दिया है, को कागजात में वैज्ञानिक शब्दों को परिभाषित करने और उनके बीच संबंधों की जांच करने, ज्ञान ग्राफ को विकसित करने का काम सौंपा गया है। “साइंटिस्ट 1” नाम का एक मॉडल अप्रत्याशित गुणों और नवीनता को उजागर करने की क्षमता जैसे कारकों के आधार पर एक शोध प्रस्ताव तैयार करता है। प्रस्ताव में संभावित निष्कर्षों, अनुसंधान के प्रभाव और कार्रवाई के अंतर्निहित तंत्र पर एक अनुमान की चर्चा शामिल है। एक “वैज्ञानिक 2” मॉडल इस विचार का विस्तार करता है, विशिष्ट प्रयोगात्मक और सिमुलेशन दृष्टिकोण सुझाता है और अन्य सुधार करता है। अंत में, एक “आलोचक” मॉडल इसकी ताकत और कमजोरियों पर प्रकाश डालता है और आगे सुधार का सुझाव देता है।
ब्यूहलर कहते हैं, “यह विशेषज्ञों की एक टीम बनाने के बारे में है जो सभी एक ही तरह से नहीं सोच रहे हैं।” “उन्हें अलग तरह से सोचना होगा और अलग-अलग क्षमताएं रखनी होंगी। क्रिटिक एजेंट को जानबूझकर दूसरों की आलोचना करने के लिए प्रोग्राम किया गया है, इसलिए आपके पास हर कोई सहमत नहीं है और कह रहा है कि यह एक अच्छा विचार है। आपके पास एक एजेंट है जो कह रहा है, 'यहां एक कमजोरी है, कर सकते हैं आप इसे बेहतर ढंग से समझाते हैं?' यह आउटपुट को एकल मॉडल से बहुत अलग बनाता है।”
सिस्टम में अन्य एजेंट मौजूदा साहित्य की खोज करने में सक्षम हैं, जो सिस्टम को न केवल व्यवहार्यता का आकलन करने का एक तरीका प्रदान करता है, बल्कि प्रत्येक विचार की नवीनता का निर्माण और मूल्यांकन भी करता है।
सिस्टम को मजबूत बनाना
अपने दृष्टिकोण को मान्य करने के लिए, ब्यूहलर और गफ़रोलाही ने “रेशम” और “ऊर्जा गहन” शब्दों के आधार पर एक ज्ञान ग्राफ बनाया। ढांचे का उपयोग करते हुए, “वैज्ञानिक 1” मॉडल ने उन्नत ऑप्टिकल और यांत्रिक गुणों के साथ बायोमटेरियल बनाने के लिए डेंडिलियन-आधारित पिगमेंट के साथ रेशम को एकीकृत करने का प्रस्ताव रखा। मॉडल ने अनुमान लगाया कि सामग्री पारंपरिक रेशम सामग्री की तुलना में काफी मजबूत होगी और प्रसंस्करण के लिए कम ऊर्जा की आवश्यकता होगी।
वैज्ञानिक 2 ने तब सुझाव दिए, जैसे कि विशिष्ट आणविक गतिशील सिमुलेशन टूल का उपयोग करके यह पता लगाना कि प्रस्तावित सामग्री कैसे बातचीत करेगी, यह कहते हुए कि सामग्री के लिए एक अच्छा अनुप्रयोग बायोइंस्पायर्ड चिपकने वाला होगा। इसके बाद क्रिटिक मॉडल ने प्रस्तावित सामग्री की कई खूबियों और सुधार के क्षेत्रों पर प्रकाश डाला, जैसे इसकी मापनीयता, दीर्घकालिक स्थिरता और विलायक के उपयोग के पर्यावरणीय प्रभाव। उन चिंताओं को दूर करने के लिए, आलोचक ने प्रक्रिया सत्यापन के लिए पायलट अध्ययन आयोजित करने और सामग्री स्थायित्व का कठोर विश्लेषण करने का सुझाव दिया।
शोधकर्ताओं ने बेतरतीब ढंग से चुने गए कीवर्ड के साथ अन्य प्रयोग भी किए, जिन्होंने अधिक कुशल बायोमिमेटिक माइक्रोफ्लुइडिक चिप्स के बारे में विभिन्न मूल परिकल्पनाएं तैयार कीं, जो कोलेजन-आधारित मचान के यांत्रिक गुणों को बढ़ाती हैं, और बायोइलेक्ट्रॉनिक डिवाइस बनाने के लिए ग्राफीन और एमिलॉयड फाइब्रिल के बीच बातचीत करती हैं।
गफ़रोलाही कहते हैं, “प्रणाली ज्ञान ग्राफ के पथ के आधार पर इन नए, कठोर विचारों के साथ आने में सक्षम थी।” “नवीनता और प्रयोज्यता के संदर्भ में, सामग्री मजबूत और नवीन लग रही थी। भविष्य के काम में, हम हजारों या दसियों हज़ार नए शोध विचार उत्पन्न करने जा रहे हैं, और फिर हम उन्हें वर्गीकृत कर सकते हैं, बेहतर ढंग से समझने की कोशिश कर सकते हैं कि ये कैसे होते हैं सामग्रियाँ उत्पन्न होती हैं और उन्हें और कैसे बेहतर बनाया जा सकता है।”
आगे बढ़ते हुए, शोधकर्ताओं को अपने ढांचे में जानकारी प्राप्त करने और सिमुलेशन चलाने के लिए नए टूल शामिल करने की उम्मीद है। वे अधिक उन्नत मॉडल के लिए अपने ढांचे में फाउंडेशन मॉडल को आसानी से बदल सकते हैं, जिससे सिस्टम को एआई में नवीनतम नवाचारों के साथ अनुकूलित करने की अनुमति मिलती है।
ब्यूहलर कहते हैं, “जिस तरह से ये एजेंट बातचीत करते हैं, उसके कारण एक मॉडल में सुधार, भले ही मामूली हो, सिस्टम के समग्र व्यवहार और आउटपुट पर बड़ा प्रभाव डालता है।”
अपने दृष्टिकोण के ओपन-सोर्स विवरण के साथ प्रीप्रिंट जारी करने के बाद से, शोधकर्ताओं से विभिन्न वैज्ञानिक क्षेत्रों और यहां तक कि वित्त और साइबर सुरक्षा जैसे क्षेत्रों में ढांचे का उपयोग करने में रुचि रखने वाले सैकड़ों लोगों ने संपर्क किया है।
ब्यूहलर कहते हैं, “ऐसी बहुत सी चीजें हैं जो आप प्रयोगशाला में जाए बिना कर सकते हैं।” “आप मूल रूप से प्रक्रिया के अंत में प्रयोगशाला में जाना चाहते हैं। प्रयोगशाला महंगी है और इसमें लंबा समय लगता है, इसलिए आप एक ऐसी प्रणाली चाहते हैं जो सर्वोत्तम विचारों में बहुत गहराई से गहराई तक जा सके, सर्वोत्तम परिकल्पनाएं तैयार कर सके और उभरती घटनाओं की सटीक भविष्यवाणी कर सके। व्यवहार। हमारा दृष्टिकोण इसे उपयोग में आसान बनाना है, ताकि आप अन्य विचारों को लाने या नई खोज करने के लिए मॉडल को वास्तव में चुनौती देने के लिए डेटासेट में खींचने के लिए एक ऐप का उपयोग कर सकें।
पेपर: “SciAgents: बायोइंस्पायर्ड मल्टी-एजेंट इंटेलिजेंट ग्राफ रीजनिंग के माध्यम से वैज्ञानिक खोज को स्वचालित करना”