एआई और मानव लेखक शैलीगत फिंगरप्रिंट साझा करते हैं

जॉन्स हॉपकिन्स शोधकर्ताओं का नया काम चैटजीपीटी और अन्य कार्यक्रमों के लेखन पैटर्न का पता लगाता है

लोग व्यक्तिगत शैली और व्यक्तिगत उत्कर्ष के साथ लिखते हैं जो उन्हें अन्य लेखकों से अलग करता है। जॉन्स हॉपकिन्स विश्वविद्यालय के नेतृत्व वाले नए शोध में पाया गया है कि कृत्रिम बुद्धिमत्ता, जिसमें चैट जीपीटी जैसे शीर्ष कार्यक्रम भी शामिल हैं, भी ऐसा ही करती है।
एक नया टूल न केवल एआई द्वारा बनाए गए लेखन का पता लगा सकता है, बल्कि यह अनुमान लगा सकता है कि इसे किस बड़े भाषा मॉडल ने बनाया है, ऐसे निष्कर्ष जो स्कूल में नकल करने वालों और ऑनलाइन दुष्प्रचार फैलाने वाले लोगों द्वारा समर्थित भाषा कार्यक्रमों की पहचान करने में मदद कर सकते हैं।
वरिष्ठ शोध वैज्ञानिक लेखक निकोलस एंड्रयूज ने कहा, “हम यह दिखाने वाले पहले व्यक्ति हैं कि एआई-जनित पाठ में मानव लेखन के समान विशेषताएं हैं, और इसका उपयोग विश्वसनीय रूप से इसका पता लगाने और विशिष्ट भाषा मॉडल के लिए इसका श्रेय देने के लिए किया जा सकता है।” जॉन्स हॉपकिन्स का मानव भाषा प्रौद्योगिकी उत्कृष्टता केंद्र।
कार्य, जो यह बता सकता है कि किन कार्यक्रमों का दुरुपयोग होने की संभावना है और मजबूत नियंत्रण और सुरक्षा उपाय किए जा सकते हैं, हाल ही में एक शीर्ष एआई सम्मेलन, लर्निंग रिप्रेजेंटेशन पर अंतर्राष्ट्रीय सम्मेलन में प्रस्तुत किया गया था।
ChatGPT जैसे बड़े भाषा मॉडल के आगमन ने किसी के लिए भी नकली लेखन उत्पन्न करना आसान बना दिया है। इसमें से अधिकांश सौम्य है लेकिन स्कूल साहित्यिक चोरी से जूझ रहे हैं और बुरे कलाकार स्पैम, फ़िशिंग और गलत सूचना फैला रहे हैं।

2016 के चुनाव और सोशल मीडिया पर विदेशी प्रभाव अभियानों को लेकर चिंताओं के बाद, एंड्रयूज ऑनलाइन गलत सूचनाओं से निपटने में मदद करने के लिए प्रौद्योगिकियों को विकसित करने में रुचि रखने लगे।
एंड्रयूज ने कहा, “मैंने कहा कि आइए ऑनलाइन किसी के फिंगरप्रिंट बनाने की कोशिश करें और देखें कि क्या वे फिंगरप्रिंट किसी भी दुष्प्रचार से मेल खाते हैं जो हम देख रहे हैं।” “अब हमारे पास यह हथौड़ा है जिसे बनाने में हमने कई साल लगाए हैं, और हम इसका उपयोग यह पता लगाने के लिए कर सकते हैं कि ऑनलाइन क्या नकली है और क्या नहीं है। इतना ही नहीं, हम यह पता लगा सकते हैं कि क्या यह चैटजीपीटी या जेमिनी या एलएलएएमए था, क्योंकि उनमें से प्रत्येक में भाषाई फिंगरप्रिंट होते हैं जो अलग होते हैं ये न केवल मानव लेखकों से बल्कि अन्य मशीन लेखकों से भी हैं।
“बड़ा आश्चर्य यह था कि हमने सिस्टम को मशीन लेखन पर लागू करने के इरादे से नहीं बनाया था और मॉडल को चैटजीपीटी के अस्तित्व में आने से पहले प्रशिक्षित किया गया था। लेकिन जिन विशेषताओं ने मानव लेखकों को एक-दूसरे से अलग करने में मदद की, वे मशीन लेखन की उंगलियों के निशान का पता लगाने में बहुत सफल थे।”
टीम यह जानकर आश्चर्यचकित रह गई कि प्रत्येक एआई लेखन कार्यक्रम की एक अलग शैली होती है। उन्होंने मान लिया था कि सभी मशीन लेखन एक ही सामान्य भाषाई फिंगरप्रिंट साझा करेंगे।
Reddit से गुमनाम लेखन नमूनों पर प्रशिक्षित उनका पता लगाने वाला उपकरण किसी भी भाषा में काम करता है। यह किसी के लिए भी स्वतंत्र रूप से उपयोग और डाउनलोड करने के लिए उपलब्ध है। इसे अब तक करीब 10,000 बार डाउनलोड किया जा चुका है.

टीम एआई राइटिंग डिटेक्शन सिस्टम बनाने वाली पहली टीम नहीं है। लेकिन इसकी पद्धति सबसे सटीक और फुर्तीली प्रतीत होती है, जो लगातार बदलते एआई परिदृश्य पर तुरंत प्रतिक्रिया देने में सक्षम है।
एंड्रयूज ने कहा, “कानून प्रवर्तन ने संदिग्ध अपराधियों द्वारा फिरौती के नोटों और अन्य लेखन को पार्स करके और इसे व्यक्तियों से मिलाने की कोशिश करके इस अवधारणा को जन्म दिया।” “हमने मूल रूप से इसे बढ़ाया। हमने इन लिखित विशेषताओं को परिभाषित करने की मानवीय, मैन्युअल प्रक्रिया को हटा दिया, समस्या पर बहुत सारा डेटा डाला और तंत्रिका नेटवर्क को यह तय करने दिया कि कौन सी विशेषताएं महत्वपूर्ण हैं। हमने यह नहीं कहा कि विस्मयादिबोधक चिह्न देखें या देखें निष्क्रिय या सक्रिय आवाज़। सिस्टम ने इसका पता लगा लिया और इस तरह हम लोगों की तुलना में बहुत बेहतर करने में सक्षम हुए।”
जब टीम ने लर्निंग रिप्रेजेंटेशन पर अंतर्राष्ट्रीय सम्मेलन में काम प्रस्तुत किया, तो मुख्य लेखक राफेल रिवेरा सोटो, जॉन्स हॉपकिन्स प्रथम वर्ष के पीएचडी उम्मीदवार, एंड्रयूज द्वारा सलाह दी गई, ने एक विचारोत्तेजक डेमो बनाया। उन्होंने सम्मेलन से सभी सहकर्मी समीक्षाओं को डिटेक्टर के माध्यम से चलाया। इसने लगभग 10% समीक्षाओं को संभावित मशीन जनित और संभवतः चैटजीपीटी के रूप में चिह्नित किया।
लेखकों में जॉन्स हॉपकिन्स के डॉक्टरेट उम्मीदवार अलीम खान शामिल हैं; लॉरेंस लिवरमोर नेशनल लेबोरेटरी के कैलिन कोच और बैरी चेन; और अमेरिकी रक्षा विभाग के मार्कस बिशप।