राय: चिंतित हैं कि चैटजीपीटी आपकी नौकरी के लिए आ रहा है? एक पुराने मूल्यांकन उपकरण का उत्तर हो सकता है

“एआई यूएस मेडिकल लाइसेंसिंग परीक्षा पास करता है।” “औसत दर्जे के प्रदर्शन के बावजूद ChatGPT लॉ स्कूल की परीक्षा पास करता है।” “क्या चैटजीपीटी को व्हार्टन एमबीए मिलेगा?”

इस तरह की सुर्खियों में हाल ही में चैटजीपीटी की सफलताओं का (और अक्सर बढ़ा-चढ़ा कर) उल्लेख किया गया है, जो एक कृत्रिम बुद्धिमत्ता उपकरण है जो मानव संकेतों के लिए परिष्कृत पाठ प्रतिक्रियाएं लिखने में सक्षम है। ये सफलताएं एआई की क्षमता की मानव विशेषज्ञों से तुलना करने की एक लंबी परंपरा का पालन करती हैं, जैसे कि 1997 में गैरी कास्परोव पर डीप ब्लू की शतरंज की जीत, आईबीएम वाटसन की “जियोपार्डी!” 2011 में केन जेनिंग्स और ब्रैड रटर पर जीत, और खेल में अल्फागो की जीत 2016 में ली सेडोल पर जीत।

इन हालिया सुर्खियों का निहित निहितार्थ अधिक खतरनाक है: एआई आपके काम के लिए आ रहा है। यह आपके डॉक्टर, आपके वकील और आपके द्वारा नियुक्त किए गए सलाहकार के रूप में स्मार्ट है। यह हमारे जीवन में एक आसन्न, व्यापक व्यवधान की शुरुआत करता है।

लेकिन सनसनीखेजता एक तरफ, क्या एआई की मानव प्रदर्शन के साथ तुलना हमें कुछ बताती है वास्तव में उपयोगी? यूएस मेडिकल लाइसेंसिंग परीक्षा पास करने वाले एआई का हमें प्रभावी ढंग से उपयोग कैसे करना चाहिए? क्या यह रोगी के सेवन के दौरान विश्वसनीय और सुरक्षित रूप से चिकित्सा इतिहास एकत्र कर सकता है? निदान पर दूसरी राय देने के बारे में क्या? इस तरह के सवालों का जवाब मेडिकल लाइसेंसिंग परीक्षा में किसी इंसान की तरह प्रदर्शन करके नहीं दिया जा सकता है।

समस्या यह है कि अधिकांश लोगों के पास एआई साक्षरता बहुत कम है – एआई उपकरणों का प्रभावी ढंग से कब और कैसे उपयोग करना है, इसकी समझ। एआई उपकरणों की ताकत और कमजोरियों का आकलन करने के लिए हमें जो चाहिए वह एक सीधा, सामान्य-उद्देश्य वाला ढांचा है जिसका उपयोग हर कोई कर सकता है। तभी जनता उन उपकरणों को अपने दैनिक जीवन में शामिल करने के बारे में सूचित निर्णय ले सकती है।

इस जरूरत को पूरा करने के लिए, मेरे शोध समूह ने शिक्षा से एक पुराने विचार की ओर रुख किया: ब्लूम्स टैक्सोनॉमी। पहली बार 1956 में प्रकाशित और बाद में 2001 में संशोधित, ब्लूम की टैक्सोनॉमी सोच के स्तरों का वर्णन करने वाला एक पदानुक्रम है जिसमें उच्च स्तर अधिक जटिल विचार का प्रतिनिधित्व करते हैं। इसके छह स्तर हैं: 1) याद रखें – बुनियादी तथ्यों को याद करें, 2) समझें – अवधारणाओं की व्याख्या करें, 3) लागू करें – नई स्थितियों में जानकारी का उपयोग करें, 4) विश्लेषण करें – विचारों के बीच संबंध बनाएं, 5) मूल्यांकन करें – आलोचना करें या किसी निर्णय या राय को सही ठहराएं , और 6) सृजन – मूल कार्य का उत्पादन करें।

ये छह स्तर गैर-विशेषज्ञों के लिए भी सहज हैं, लेकिन सार्थक आकलन करने के लिए पर्याप्त विशिष्ट हैं। इसके अलावा, ब्लूम की टैक्सोनॉमी किसी विशेष तकनीक से बंधी नहीं है – यह मोटे तौर पर अनुभूति पर लागू होती है। हम इसका उपयोग चैटजीपीटी या अन्य एआई टूल्स की ताकत और सीमाओं का आकलन करने के लिए कर सकते हैं जो छवियों में हेरफेर करते हैं, ऑडियो बनाते हैं, या पायलट ड्रोन बनाते हैं।

मेरे शोध समूह ने ब्लूम के टैक्सोनॉमी के लेंस के माध्यम से चैटजीपीटी का आकलन करना शुरू कर दिया है, जिससे यह एक संकेत पर विविधताओं का जवाब देने के लिए कह रहा है, प्रत्येक अनुभूति के एक अलग स्तर को लक्षित करता है।

उदाहरण के लिए, हमने एआई से पूछा: “मान लीजिए कि इस सर्दी में कोविड टीकों की मांग 1 मिलियन खुराक से अधिक या कम 300,000 खुराक होने का अनुमान है। 95% मांग को पूरा करने के लिए हमें कितना स्टॉक करना चाहिए?” – एक लागू कार्य। फिर हमने प्रश्न को संशोधित किया, इसे “1.8 मिलियन टीकों के आदेश देने के पेशेवरों और विपक्षों पर चर्चा करने” के लिए कहा – एक मूल्यांकन स्तर का कार्य। फिर हमने दो प्रतिक्रियाओं की गुणवत्ता की तुलना की और वर्गीकरण के सभी छह स्तरों के लिए इस अभ्यास को दोहराया।

प्रारंभिक परिणाम शिक्षाप्रद हैं। चैटजीपीटी आम तौर पर कार्यों को याद करने, समझने और लागू करने के साथ अच्छा करता है लेकिन अधिक जटिल विश्लेषण और मूल्यांकन कार्यों के साथ संघर्ष करता है। पहले संकेत के साथ, ChatGPT ने अच्छी प्रतिक्रिया दी आवेदन और की व्याख्या एक उचित टीका मात्रा का सुझाव देने के लिए एक सूत्र (यद्यपि प्रक्रिया में एक छोटी अंकगणितीय गलती कर रही है)।

हालांकि, दूसरे के साथ, चैटजीपीटी ने बहुत अधिक या बहुत कम वैक्सीन होने के बारे में असंबद्ध रूप से परेशान किया। इसने इन जोखिमों का कोई मात्रात्मक मूल्यांकन नहीं किया, इतनी बड़ी मात्रा के लिए कोल्ड स्टोरेज की तार्किक चुनौतियों का हिसाब नहीं दिया और इस संभावना के बारे में चेतावनी नहीं दी कि एक टीका-प्रतिरोधी संस्करण उत्पन्न हो सकता है।

हम इन टैक्सोनॉमी स्तरों पर विभिन्न संकेतों के लिए समान व्यवहार देख रहे हैं। इस प्रकार, ब्लूम की टैक्सोनॉमी हमें कृत्रिम मानव बनाम एआई तुलना की तुलना में एआई प्रौद्योगिकी के अधिक सूक्ष्म आकलन करने की अनुमति देती है।

जहां तक ​​हमारे डॉक्टर, वकील और परामर्शदाता की बात है, ब्लूम की टैक्सोनॉमी भी इस बारे में अधिक सूक्ष्म दृष्टिकोण प्रदान करती है कि एआई किसी दिन इन व्यवसायों को कैसे बदल सकता है – प्रतिस्थापित नहीं कर सकता। हालांकि एआई रिकॉल और समझने के कार्यों में उत्कृष्टता प्राप्त कर सकता है, कुछ लोग किसी बीमारी के सभी संभावित लक्षणों को सूचीबद्ध करने के लिए अपने डॉक्टर से परामर्श करते हैं या पोर्टर के पांच बलों के सिद्धांत को समझाने के लिए अपने वकील से केस कानून को शब्दशः सुनाने या सलाहकार को नियुक्त करने के लिए कहते हैं।

लेकिन हम उच्च स्तरीय संज्ञानात्मक कार्यों के लिए विशेषज्ञों की ओर रुख करते हैं। हम एक उपचार योजना के लाभों और जोखिमों को तौलने में अपने डॉक्टर के नैदानिक ​​निर्णय को महत्व देते हैं, हमारे वकील की मिसाल को संश्लेषित करने की क्षमता और हमारी ओर से वकालत करने की क्षमता, और एक परामर्शदाता की एक आउट-ऑफ-द-बॉक्स समाधान की पहचान करने की क्षमता जिसके बारे में किसी और ने नहीं सोचा था। ये कौशल विश्लेषण, मूल्यांकन और निर्माण कार्य हैं, अनुभूति के स्तर जहां एआई तकनीक वर्तमान में कम है।

ब्लूम की टैक्सोनॉमी का उपयोग करके हम देख सकते हैं कि प्रभावी मानव-एआई सहयोग का अर्थ मोटे तौर पर निचले स्तर के संज्ञानात्मक कार्यों को सौंपना होगा ताकि हम अपनी ऊर्जा को अधिक जटिल, संज्ञानात्मक कार्यों पर केंद्रित कर सकें। इस प्रकार, एआई मानव विशेषज्ञ के साथ प्रतिस्पर्धा कर सकता है या नहीं, इस पर रहने के बजाय, हमें यह पूछना चाहिए कि मानव महत्वपूर्ण सोच, निर्णय और रचनात्मकता को बढ़ावा देने में मदद करने के लिए एआई की क्षमताओं का कितनी अच्छी तरह उपयोग किया जा सकता है।

बेशक, ब्लूम की टैक्सोनॉमी की अपनी सीमाएँ हैं। कई जटिल कार्यों में वर्गीकरण के कई स्तर शामिल हैं, वर्गीकरण में निराशाजनक प्रयास। और ब्लूम की टैक्सोनॉमी पूर्वाग्रह या नस्लवाद के मुद्दों को सीधे तौर पर संबोधित नहीं करती है, जो बड़े पैमाने पर एआई अनुप्रयोगों में एक प्रमुख चिंता का विषय है। लेकिन अपूर्ण होते हुए भी, ब्लूम की टैक्सोनॉमी उपयोगी बनी हुई है। यह हर किसी के लिए समझने के लिए पर्याप्त सरल है, एआई उपकरणों की एक विस्तृत श्रृंखला पर लागू करने के लिए पर्याप्त सामान्य-उद्देश्य है, और यह सुनिश्चित करने के लिए पर्याप्त संरचित है कि हम उन उपकरणों के प्रश्नों का एक सुसंगत, संपूर्ण सेट पूछें।

सोशल मीडिया के उदय और नकली समाचारों की तरह हमें बेहतर मीडिया साक्षरता विकसित करने की आवश्यकता है, चैटजीपीटी जैसे उपकरण मांग करते हैं कि हम अपनी एआई साक्षरता विकसित करें। ब्लूम की टैक्सोनॉमी यह सोचने का एक तरीका प्रदान करती है कि एआई क्या कर सकता है – और यह क्या नहीं कर सकता – क्योंकि इस प्रकार की तकनीक हमारे जीवन के अधिक हिस्सों में अंतर्निहित हो जाती है।

विशाल गुप्ता यूएससी मार्शल स्कूल ऑफ बिजनेस में डेटा साइंस और ऑपरेशंस के एसोसिएट प्रोफेसर हैं और औद्योगिक और सिस्टम इंजीनियरिंग विभाग में शिष्टाचार नियुक्ति रखते हैं।

Leave a Comment