३० अत्याधुनिक एआई एजेन्टको गहन अध्ययनले देखायो — अधिकांश कम्पनीहरू आफ्नो प्रणालीको सुरक्षाबारे मौन छन्। यो बेखबरी हाम्रो दैनिक जीवनमा कति घातक हुन सक्छ?
काठमाडौं – मानिस जब घुम्न जान्छ, उसले आफ्नो घरको चाबी कसैलाई सुम्पन्छ — कुनै विश्वासिलो मान्छेलाई। तर के हुन्छ जब त्यो “विश्वासिलो मान्छे” कुनै स्वचालित कम्प्युटर प्रणाली हो, जसले हाम्रो इमेल पढ्छ, बैंक खाता हेर्छ, वेबसाइटमा हाम्रो तर्फबाट अर्डर गर्छ — र जसको भित्री कार्यविधिबारे हामीलाई केही थाहा छैन? यही हो आजको एआई एजेन्टको वास्तविकता।
MIT, हार्वर्ड, स्ट्यानफोर्ड र क्याम्ब्रिज विश्वविद्यालयका अनुसन्धानकर्ताहरूले प्रकाशित गरेको “२०२५ एआई एजेन्ट इन्डेक्स“ले विश्वका ३० सबैभन्दा प्रभावशाली एआई एजेन्ट प्रणालीहरूको गहन विश्लेषण गरेको छ। यो प्रतिवेदन पढ्दा एउटा भयावह चित्र उभिन्छ — जति शक्तिशाली प्रविधि, त्यति नै कम जवाफदेहिता।
२०२५ एआई एजेन्ट इन्डेक्स
३०अध्ययन गरिएका एआई एजेन्ट प्रणालीहरू
२५/३०ले आन्तरिक सुरक्षा परिणाम खुलासा गरेनन्
२.९ ट्रि.डलर मूल्यको काम स्वचालित हुने अनुमान (२०३० सम्म)
एजेन्ट भनेको के हो?
साधारण च्याटबट र एआई एजेन्टबीच आकाश-जमीनको फरक छ। च्याटबटले प्रश्न सुन्छ र जवाफ दिन्छ — बस। तर एजेन्टले निर्णय लिन्छ, योजना बनाउँछ र संसारमा प्रत्यक्ष कार्य गर्छ। उसले तपाईंको इमेल पठाउन सक्छ, वेबसाइट ब्राउज गर्न सक्छ, फाइल बनाउन र मेट्न सक्छ, सफ्टवेयर कोड लेख्न सक्छ — र यो सब मानवीय हस्तक्षेप बिना।
“च्याटबटले हानि पुर्याउँछ जब मानिसले गलत निर्णय गर्छ — तर एजेन्टले आफैं हानि पुर्याउन सक्छ।”
इन्डेक्सले एजेन्टहरूलाई तीन श्रेणीमा विभाजन गरेको छ: च्याट एजेन्टहरू (क्लड कोड, च्याटजीपीटी एजेन्ट, मानस एआई जस्ता — १२ वटा), ब्राउजर एजेन्टहरू (पर्प्लेक्सिटी कोमेट, ओपेरा नियोन — ५ वटा) र उद्यम एजेन्टहरू (माइक्रोसफ्ट कोपाइलट स्टुडियो, सेल्सफोर्स — १३ वटा)। यी प्रणालीहरूले मिलेर विश्व अर्थतन्त्रको एक महत्त्वपूर्ण हिस्सा सञ्चालन गर्न थालिसकेका छन्।
पारदर्शिताको संकट
अनुसन्धानको सबैभन्दा चिन्ताजनक निष्कर्ष के हो भने — सुरक्षाको क्षेत्रमा जानकारी नै छैन। १,३५० सूचना क्षेत्रहरूमध्ये २४० सुरक्षासँग सम्बन्धित थिए। तीमध्ये १३३ क्षेत्रमा कुनै सार्वजनिक जानकारी नै फेला परेन। अर्थात् ५५ प्रतिशतभन्दा बढी सुरक्षा सूचना अँध्यारोमै छ।
तथ्य जाँच
२५/३० एजेन्टहरूले आन्तरिक सुरक्षा परीक्षणका परिणाम सार्वजनिक गरेनन्। २३/३० का लागि कुनै तेस्रो-पक्ष परीक्षण जानकारी नै छैन। केवल एन्थ्रोपिक क्लड, ओपनएआई च्याटजीपीटी र ओपनएआई कोडेक्सले स्वतन्त्र परीक्षण दस्तावेजीकरण गरेका छन्।
यो अवस्था किन चिन्ताजनक छ? किनभने एजेन्टहरूले गर्ने गल्तीहरू केवल “गलत जवाफ” मात्र होइनन् — ती वास्तविक संसारमा वास्तविक क्षति पुर्याउन सक्छन्। गलत मानिसलाई इमेल पठाइन्छ, गलत कागजात मेटिन्छ, अनजानमा किनमेल हुन्छ। यी गल्तीहरूको जिम्मेवारी कसले लिने? यो प्रश्नको उत्तर अझै कसैसँग छैन।
चार प्रमुख चिन्ताहरू
सुरक्षा अन्धकार
अधिकांश एजेन्टहरूको सुरक्षा परीक्षणको कुनै सार्वजनिक रेकर्ड छैन। क्षमता देखाइन्छ, खतरा लुकाइन्छ।
एकाधिकारको जोखिम
लगभग सबै एजेन्ट GPT, Claude वा Gemini मा निर्भर छन्। एउटा असफल भए सम्पूर्ण पारिस्थितिकी तन्त्र डगमगाउँछ।
पहिचान लुकाउने
२१/३० एजेन्टहरू डिफल्टमा आफूलाई एआई भएको खुलासा गर्दैनन्। मान्छे ठान्दा एजेन्टसँग कुरा गरिरहेका हुन सक्छौं।
वेब नियम उल्लंघन
ब्राउजर एजेन्टहरूले robots.txt बेवास्ता गर्छन् र एन्टी-बट सिस्टम बाइपास गर्न डिजाइन गरिएका छन्।
चीन बनाम अमेरिका: शासनको विभाजन
भौगोलिक दृष्टिकोणले पनि यो इन्डेक्सले महत्त्वपूर्ण तथ्य उजागर गरेको छ। ३०/३० मध्ये २१ एजेन्ट अमेरिकी कम्पनीहरूका हुन्, ५ चिनियाँ। तर यो संख्याभन्दा बढी रोचक कुरा हो — दुई देशबीचको शासन ढाँचाको ठूलो खाडल।
अमेरिकी कम्पनीहरूमध्ये ७६ प्रतिशतले कुनै न कुनै एआई सुरक्षा फ्रेमवर्क प्रकाशित गरेका छन्। तर चिनियाँ कम्पनीहरूमध्ये केवल एउटाले (Z.ai) यस्तो फ्रेमवर्क सार्वजनिक गरेको छ — अर्थात् केवल २० प्रतिशत। अनुसन्धानकर्ताहरूले सावधानीपूर्वक उल्लेख गरेका छन् कि यो जानकारीको अनुपस्थिति दस्तावेजीकरणको कमी पनि हुन सक्छ — वास्तविक सुरक्षाको अभाव नभएर पारदर्शिताको अभाव।
“एआई एजेन्ट उद्योग अहिले त्यो अवस्थामा छ जहाँ इन्जिन राम्रो बन्दैछ, तर ब्रेक जाँच गरिएको छैन।”
स्वायत्तताको खतरनाक बिन्दु
इन्डेक्सले एजेन्टको स्वायत्तता L1 देखि L5 सम्मको मापदण्डमा नापेको छ। L1 मा मानिस सबै निर्णय गर्छ, L5 मा एजेन्ट पूर्ण स्वायत्त हुन्छ र मानिस केवल दर्शक बन्छ। चिन्ताजनक तथ्य के हो भने — ब्राउजर एजेन्टहरू L4-L5 मा सञ्चालन हुन्छन्, अर्थात् तिनीहरूलाई एकपटक काम दिएपछि मानवीय हस्तक्षेपको ठाउँ नै छैन।
पर्प्लेक्सिटी कोमेट र ब्राउजर यूज जस्ता प्रणालीहरूले काम सुरु गरेपछि रोक्ने कुनै उपाय छैन — जबसम्म तिनीहरूले काम सकाउँदैनन्। यो “एकपटक दोहोरो थिचेपछि फिर्ता हुन नसकिने बन्दुकको घोडा” जस्तो हो। र यस्तै एजेन्टमा सुरक्षा जानकारीको सबैभन्दा ठूलो अभाव छ — ब्राउजर एजेन्ट श्रेणीमा ६४ प्रतिशत सुरक्षा सूचना क्षेत्र खाली छन्।
वेब र न्यायालयको युद्ध
एआई एजेन्टहरूले इन्टरनेटमा कसरी व्यवहार गर्छन् भन्ने विषय अहिले अदालतसम्म पुगिसकेको छ। पर्प्लेक्सिटी कोमेटले वेबसाइटहरूको robots.txt नियम मान्दैन भनेर अमेजनले कानूनी कारबाहीको धम्की दिएको थियो। न्यूयोर्क टाइम्सले माइक्रोसफ्ट र ओपनएआईमाथि मुद्दा दायर गरेको छ। क्लाउडफ्लेयरले पर्प्लेक्सिटीका गोप्य क्रलरहरू पकड्यो जसले Chrome जस्तो देखाएर वेबसाइटको नो-क्रल नियम मिच्थे।
नेपालका लागि सोच्नुपर्ने प्रश्न
जब विश्वका ठूला न्यायिक प्रणालीहरूले पनि एआई एजेन्टको जवाफदेहिता तय गर्न संघर्ष गरिरहेका छन्, नेपाल जस्तो देश जहाँ यस्ता प्रणालीहरू बिनाकुनै नीतिगत ढाँचाका प्रयोगमा आउन थालेका छन् — त्यहाँ हानि भएमा जिम्मेवारी कसले लिने?
सेफ्टी-वाशिङ: नयाँ खतरा
अनुसन्धानकर्ताहरूले एउटा नयाँ प्रवृत्ति पहिचान गरेका छन् जसलाई तिनीहरूले “सेफ्टी-वाशिङ” भनेका छन् — जसरी कम्पनीहरूले हरियो देखिन “ग्रीन-वाशिङ” गर्छन्, त्यसरी नै एआई कम्पनीहरूले सुरक्षित देखिन उच्चस्तरीय नीतिगत दस्तावेज बनाउँछन् तर वास्तविक परीक्षण परिणाम लुकाउँछन्।
उदाहरणका लागि: ९/३० एजेन्टहरूले क्षमता बेन्चमार्कहरू प्रकाशित गरेका छन् — “हाम्रो एजेन्टले यति राम्रो काम गर्छ” भनेर। तर ती एउटै एजेन्टहरूको सुरक्षा मूल्यांकन खुलासा छैन। क्षमता मार्केटिङ हो, सुरक्षा लुकाइन्छ। यो “खरिद गर्नुस् तर जोखिम थाहा नगर्नुस्” भन्ने विज्ञापनको नयाँ संस्करण हो।
के गर्नु पर्छ?
यो इन्डेक्स केवल समस्याको तस्बिर हो — समाधान होइन। तर यसले केही स्पष्ट दिशानिर्देशहरू सुझाउँछ:
पहिलो, एजेन्ट-विशिष्ट सुरक्षा मूल्यांकन अनिवार्य बनाउनु पर्छ। आधारभूत मोडेलको परीक्षण पर्याप्त छैन — कारण एजेन्टले उपकरणहरू, मेमोरी र स्वायत्ता थप्दा नयाँ जोखिमहरू उत्पन्न हुन्छन्। ChatGPT Agent, OpenAI Codex, Claude Code र Gemini 2.5 Computer Use मात्र हाल एजेन्ट-विशिष्ट सिस्टम कार्ड प्रकाशित गर्छन् — यो दायरा विस्तार हुन जरुरी छ।
दोस्रो, वेबमा एजेन्टको पहिचान अनिवार्य गर्नु पर्छ। OpenAI ChatGPT Agent एकमात्र प्रणाली हो जसले क्रिप्टोग्राफिक अनुरोध हस्ताक्षर प्रयोग गर्छ — यसले एजेन्टले के गर्यो भनेर प्रमाणित गर्न सहज बनाउँछ। भविष्यमा जब एजेन्टहरू अझ बढी कार्यहरू गर्छन्, यो लेखाजोखा आधारभूत आवश्यकता बन्नेछ।
तेस्रो, जवाफदेहिताको श्रृंखला स्पष्ट गर्नु पर्छ। अहिले मोडेल प्रदायक, एजेन्ट विकासकर्ता, उद्यम प्रयोगकर्ता र अन्तिम उपभोक्ताबीच जिम्मेवारी फैलिएको छ। कुनै एक घटक असफल भयो भने जिम्मेवारी कसैले लिँदैन — यही “जवाफदेहिता विघटन”को समस्या हो।
“क्षमताहरू जोखिम व्यवस्थापन अभ्यासहरूभन्दा छिटो अग्रसर हुँदैछन् — र यो खाडल भर्न नसके परिणाम गम्भीर हुन सक्छ।”
नेपालको सन्दर्भ
नेपालमा एआई एजेन्टको प्रत्यक्ष चर्चा अझै सीमित छ। तर यो सोच्नु गल्ती हुनेछ कि यो समस्या हाम्रो होइन। नेपालका सरकारी कार्यालयहरू, बैंकहरू, अस्पतालहरू र व्यावसायिक संस्थाहरूले माइक्रोसफ्ट, गुगल र अन्य प्लेटफर्महरूका सेवाहरू प्रयोग गर्दछन् — जसमध्ये धेरैले अहिले एजेन्टिक क्षमताहरू जोडिसकेका छन्।
जब हाम्रा संस्थाहरूले यी प्रणालीहरू प्रयोग गर्छन् — र ती प्रणालीहरूमा कुनै सुरक्षा खामी देखिन्छ — त्यसको परिणाम नेपाली नागरिकहरूले भोग्नु पर्छ, तर जिम्मेवारी लिने कुनै स्पष्ट संयन्त्र छैन। सूचना प्रविधि नीति बनाउने निकायहरूले यो वास्तविकतालाई अब बेवास्ता गर्न मिल्दैन।
२०२५ एआई एजेन्ट इन्डेक्सको सबैभन्दा ठूलो सन्देश यो हो: प्रविधि चाँडो बढ्छ, जिम्मेवारी ढिलो हुर्कन्छ। जब शक्ति र पारदर्शिताबीचको खाडल यति ठूलो हुन्छ, सम्भावित क्षति पनि त्यत्तिकै ठूलो हुन्छ। अनुसन्धानकर्ताहरूले यो खाडल मापन गरेका छन् — अब यसलाई भर्ने काम नीति निर्माता, उद्योग र नागरिक समाजको हातमा छ।
यस लेखको आधार
यो विश्लेषण Staufer, Feng, Wei, Bailey, Duan, Yang, Ozisik, Casper र Kolt द्वारा फेब्रुअरी २०२६ मा प्रकाशित “The 2025 AI Agent Index: Documenting Technical and Safety Features of Deployed Agentic AI Systems” (arXiv:2602.17753) प्रतिवेदनमा आधारित छ।
स्रोत तथ्यहरू: २०२५ एआई एजेन्ट इन्डेक्स (arXiv:2602.17753v1)। म्याकिन्जी एन्ड कम्पनीको “The State of AI in 2025” प्रतिवेदन। सबै तथ्याङ्क प्रतिवेदनको डिसेम्बर ३१, २०२५ कटअफ मितिसम्मका हुन्। यो लेखले मूल अनुसन्धानको सारांश र सम्पादकीय विश्लेषण प्रस्तुत गर्दछ।







प्रतिक्रिया दिनुहोस्