उन्नत एआई पहिले नै शत्रुतापूर्ण संस्थाहरूद्वारा दुरुपयोग भइरहेको छ
युनिभर्सिटी कलेज लन्डनका एआई प्राध्यापक टम रकटाशेल (Tom Rocktäschel) हालै आफ्नो क्षेत्रको एक नयाँ अनुसन्धान शाखाको बारेमा कक्षा लिइरहेका थिए, जब उनका एक विद्यार्थीले त्यो कामलाई वर्णन गर्न एउटा ऐतिहासिक उपमा प्रयोग गरे।
“अहिले हामी सबै एक प्रकारले ‘मिनी ओपेनहाइमर’ जस्तै भएका छौं,” विद्यार्थीले ठट्टा गरे। रकटाशेल, जो हालै मात्र गुगल डिपमाइन्ड (Google DeepMind) का शीर्ष अनुसन्धानकर्ता थिए, उनले यो तर्कलाई स्वीकार गर्नुपर्यो।
परमाणु हतियार अनुसन्धानसँग गरिएको यो तुलनाको विषय हालको दौड हो, जसमा ओपेनएआई (OpenAI) र एन्थ्रोपिक (Anthropic) लगायतका शीर्ष एआई प्रयोगशालाहरू र एउटा बढ्दो स्टार्ट-अप समूहले एउटा यस्तो एआई विकास गर्न प्रतिस्पर्धा गरिरहेका छन् जसले प्रविधिमा अभूतपूर्व काम गर्न सकोस्: आफ्नै उत्तराधिकारी बनाउने।
एआईको सफ्टवेयर-प्रोग्रामिङ क्षमतामा पछिल्लो छ महिनामा आएको ठूलो फड्कोबाट उत्साहित भएर, प्रविधि उद्योगका नेता र अनुसन्धानकर्ताहरू अब ढुक्क हुँदैछन् कि एउटा यस्तो एआई, जसले मानव हस्तक्षेपबिना आफैंलाई सुधार गर्न सक्छ, त्यो उनीहरूको पहुँचमा छ।
यी स्व-सिकाई गर्ने एआईहरूले आफैंको अझ शक्तिशाली संस्करणहरू बनाउन सक्छन्। क्रमिक पुस्ताहरूले यसलाई बारम्बार दोहोर्याउन सक्छन्, थप क्षमताहरू थप्न सक्छन् वा आफूलाई अझ प्रभावकारी रूपमा चलाउन सक्छन्।
यो ‘फ्लाइह्विल’ प्रभाव, जसलाई उद्योगमा “रिकर्सिभ सेल्फ-इम्प्रुभमेन्ट” (RSI) भनिन्छ, यसले एआईलाई गुगलको जेमिनी (Gemini), ओपेनएआईको च्याटजीपीटी (ChatGPT) र एन्थ्रोपिकको क्लाउड (Claude) भन्दा धेरै पर, अज्ञात क्षेत्रमा छिट्टै लैजान सक्छ।
एआई आशावादीहरू यसलाई तथाकथित ‘सुपरइन्टेलिजेन्स’ को कुञ्जी मान्छन्, जुन त्यो बिन्दु हो जहाँ एआईले मानव मस्तिष्कको क्षमतालाई उछिन्छ।
एआई सुरक्षा अधिवक्ताहरू डर मान्छन् कि RSI ले ती नाजुक सुरक्षा घेराहरूलाई भत्काउन सक्छ जसले एआईलाई अनियन्त्रित हुनबाट रोक्छन् — उदाहरणका लागि, व्यापक साइबर सुरक्षा आक्रमणहरू सक्षम पारेर वा नयाँ जैविक हतियारहरूको निर्माणमा सहयोग गरेर। आजका कोडिङ एजेन्टहरूले मानव प्रोग्रामरको एक दिनको काम मिनेटमा पूरा गर्न सक्ने भएकाले, यो ‘फ्लाइह्विल’ कसैले सोचेभन्दा छिटो घुम्न सक्छ।
“सबैजना यस तर्फ दौडिरहेका छन्, तर यो [सुरक्षित रूपमा] कसरी गर्ने भनेर कसैलाई थाहा छैन,” अपोलो रिसर्चका प्रमुख मारियस हबहान (Marius Hobbhahn) भन्छन्, “र मानवतालाई यो अवस्थाबारे जानकारी छैन।”
एआई अनुसन्धानकर्ता र सुरक्षा अभियानकर्मीहरू दुवै सहमत छन् कि त्यो क्षण छिट्टै आउँदैछ। धेरैलाई लाग्छ कि आफैंलाई तालिम दिन सक्ने र मानव हस्तक्षेप कम आवश्यक पर्ने शक्तिशाली एआई दुई वर्षभित्रै आउनेछ।
यसले एआईका उत्साहीहरू र सुरक्षा अभियानकर्मीहरूबीच द्वन्द्व सिर्जना गरेको छ। उत्साहीहरू मान्छन् कि RSI ले सुपरइन्टेलिजेन्सको युग ल्याउनेछ, वैज्ञानिक सफलताहरू र अभूतपूर्व उत्पादकत्व बढाउनेछ। अर्कोतर्फ, सुरक्षा अभियानकर्मीहरू डर मान्छन् कि हामी “र्यापिड टेक-अफ” (द्रुत उडान) को नजिक छौं जसले यो प्रविधिलाई मानवीय नियन्त्रणभन्दा बाहिर धकेल्नेछ।
प्रविधि विकास गर्नेहरू पनि जोखिमहरूबारे राम्ररी सचेत छन्।
“यो पक्का हो कि रिकर्सिभ सेल्फ-इम्प्रुभमेन्ट एआई वा विज्ञानको लागि सबैभन्दा राम्रो कुरा हुन सक्छ,” लन्डनस्थित स्टार्ट-अप इनहेरेन्ट एआई (Inherent AI) का संस्थापक र ह्वाइट हाउसका पूर्व एआई सल्लाहकार ट्यान्टम कोलिन्स (Tantum Collins) भन्छन्, “वा यो अहिलेसम्मको सबैभन्दा खराब कुरा हुन सक्छ।”
रकटाशेल आफैंले ‘ओपन-एन्डेडनेस’ (Open-endedness) नामक RSI को एक रूपमा काम गरिरहेको स्टार्ट-अपमा सामेल हुन डिपमाइन्ड छोडेका छन्, जुन हालको एआई तालिमको लक्ष्य-उन्मुख तरिकाभन्दा जैविक विकासको अवधारणाहरूमा आधारित छ।
‘रिकर्सिभ सुपरइन्टेलिजेन्स’ नामक उक्त स्टार्ट-अप मे महिनामा स्थापना भएको केही महिनामै $४ बिलियन डलरको मूल्याङ्कनमा $६५० मिलियन डलर जुटाउन सफल भयो।
संस्थापक रिचर्ड सोचर (Richard Socher) भन्छन् कि स्टार्ट-अपको दृष्टिकोण “सुपरइन्टेलिजेन्स तर्फको सबैभन्दा छिटो बाटो” हो। “र हामी त्यहाँ जति चाँडो पुग्छौं, त्यति नै चाँडो हामी धेरै समस्याहरू समाधान गर्नेछौं र मानवतालाई अझ फस्टाउन मद्दत गर्नेछौं।”
हालको लगानीको उन्मादमा यस्ता अतिशयोक्तिहरू एआई स्टार्ट-अपहरूमा यति सामान्य भइसकेका छन् कि शंका गर्नेहरूका लागि RSI लाई केवल लगानीकर्ताहरूबाट पैसा बटुल्न बनाइएको हल्ला मात्र मान्न सजिलो छ।
तर एन्ड्रे कार्पाथी (Andrej Karpathy), जो ओपेनएआईका सह-संस्थापक र टेस्लाका पूर्व एआई निर्देशक हुन्, उनले RSI लाई “अन्तिम बास ब्याटल” (final boss battle) भनेका छन्: सुपरइन्टेलिजेन्सको बाटोमा उभिएको अन्तिम अवरोध।
“यो ‘मात्र इन्जिनियरिङ’ हो,” कार्पाथीले मार्चमा लेखेका थिए। “र यो काम गर्नेछ।”
स्व-सुधार गर्ने एआई आउँदैछ भन्ने दाबीहरू गत केही महिनाहरूमा चर्को भएका छन्। अक्टोबरमा, ओपेनएआईका प्रमुख साम अल्टम्यान (Sam Altman) ले आफ्नो कम्पनीलाई “२०२८ को मार्चसम्ममा एउटा साँचो स्वचालित एआई अनुसन्धानकर्ता” बनाउने लक्ष्य राखेका छन्।
एन्थ्रोपिकका सह-संस्थापक ज्याक क्लार्क (Jack Clark) भन्छन्, “यसको योजना बनाउने समय आएको छ, किनकि एआई प्रणालीहरू मानिसले सोचेभन्दा धेरै छिटो राम्रो हुँदैछन्।” यसले ‘मिथोस’ (Mythos) जस्ता सफलताहरू चाँडै ल्याउन सक्छ, जसले सफ्टवेयर कमजोरीहरू पत्ता लगाउन अस्वाभाविक रूपमा राम्रो प्रदर्शन गरेको छ।
अक्सफोर्ड विश्वविद्यालयको इन्स्टिच्युट फर एथिक्स इन एआईमा गत महिनाको व्याख्यानमा क्लार्कले भने, “[प्रणालीहरू] थप उन्नत हुँदै जाँदा, हामीले मानिस र समाजमा गहिरो परिवर्तनको अपेक्षा गर्नुपर्छ… यस्तो परिवर्तन जुन हामीमध्ये कसैले अहिलेसम्म अनुभव गरेका छैनौं।”
एआई अनुसन्धानकर्ताहरू व्यापक रूपमा सहमत छन् कि गत वर्षको अन्त्यदेखि प्रगति द्रुत भएको छ। एआई प्रगतिको ट्रयाक गर्ने संस्था METR का अनुसार, एआईले स्वायत्त रूपमा गर्न सक्ने मानवीय कार्यहरूको जटिलता लगभग हरेक सात महिनामा दोब्बर भइरहेको छ।
तथापि, कोडिङ अटोमेसनले मात्रै स्व-सुधार गर्ने एआईलाई सुरु गराउँछ भन्ने कुरामा सबै विश्वस्त छैनन्।
“रिकर्सिभ सेल्फ-इम्प्रुभमेन्ट एआईको लोककथाको हिस्सा हो किनभने हालैका दिनहरूसम्म यो व्यावहारिक थिएन,” अक्सफोर्ड विश्वविद्यालयका एआई प्राध्यापक माइकल वुलड्रिज (Michael Wooldridge) भन्छन्, “यो टर्मिनेटरको कथा जस्तै लाग्छ।”
“यो कति टाढा जान सक्छ भन्ने स्पष्ट छैन,” उनी भन्छन्। “कम्प्युट स्रोतहरूको सीमा छ तर एआईले आफैं के हासिल गर्न सक्छ भन्ने आधारभूत सीमाहरू पनि हुन सक्छन्। हामीलाई अहिलेसम्म ती कुराहरू राम्ररी थाहा छैन।”
केही शंका गर्नेहरूका लागि, RSI को वरिपरिको चर्चा एआई स्टार्ट-अपहरूको हालको क्षमताहरूलाई बढाएर देखाउने बानीको पछिल्लो अभिव्यक्ति मात्र हो।
तर एन्थ्रोपिकका क्लार्क भन्छन् कि यी प्रणालीहरू बनाउने ‘फ्रन्टियर एआई’ प्रयोगशाला बाहिरका मानिसहरूले कुराहरू कति छिटो विकसित भइरहेका छन् भन्ने कुरालाई कम आँकलन गरिरहेका छन्।
“आजका एआई प्रणालीहरूको क्षमताको बारेमा बाँकी संसार अझै पनि इन्कारमा छ, छ महिनापछि हुने कुरा त धेरै टाढाको कुरा हो,” उनले अक्सफोर्डमा भने, “यदि RSI सफल भयो भने मानव-एआई टोलीहरूले छिट्टै नोबेल पुरस्कार जित्न सक्छन्।”
यदि स्व-सुधार गर्ने एआई प्रणाली हासिल गर्न सकिन्छ भने, यो अहिले LLMs (ठूला भाषा मोडेलहरू) द्वारा प्रयोग गरिएका एल्गोरिदमहरूलाई परिष्कृत गर्ने एआई कोडिङ सहायकहरू भन्दा बढी आवश्यक पर्ने सम्भावना छ। “हामी LLMs बनाउन राम्रो छौं भन्दैमा RSI बनाउन पनि राम्रो हुन्छौं भन्ने छैन,” बाल्डरटन क्यापिटलका लगानीकर्ता सुराङ्गा चन्द्रतिलाके (Suranga Chandratillake) भन्छन्।
यद्यपि, वर्तमान एआई लगानीको उन्मादमा, वैकल्पिक दृष्टिकोणहरूले सजिलै पैसा पाउनेछन्।
यदि एआई बूमले अनुसन्धानलाई गति दिइरहेको छ भने, सुरक्षा अभियानकर्मीहरूले आपतकालीन ब्रेक लगाउने प्रयास गरिरहेका छन्।
अनुसन्धानकर्ताहरू तर्क गर्छन् कि हालका प्रणालीहरूमा लगाइएका सुरक्षा घेराहरू (guardrails) थप स्वतन्त्र-सोच भएका एआईहरूद्वारा हटाइन वा छल्न सकिन्छ, जसले सुरक्षा प्रतिबन्धहरूलाई बाइपास गरेर बढी उत्पादनशील हुने निर्णय गर्न सक्छन्।
अवस्थित एआई मोडेलहरू पहिले नै बन्द हुनबाट जोगिन प्रयोगकर्ताहरूलाई धोका दिएको देखिएको छ। परीक्षणमा, केही एआई मोडेलहरूले आफ्ना कार्यहरू व्याख्या गर्ने बहानामा टेक्स्ट आउटपुटहरू सिर्जना गरेर आफ्ना प्रयोगकर्ताहरूलाई भ्रममा पारेका छन्।
“डुमर्स” (doomers) भनिने सुरक्षा अभियानकर्मीहरू ती चेतावनीपूर्ण कथाहरूलाई पुनर्जीवित गर्दैछन् जुन वर्षौंदेखि चलिरहेका छन्।
सबैभन्दा प्रसिद्ध “पेपरक्लिप म्याक्सिमाइजर्स” (paperclip maximiser) को दन्त्यकथा हो, जहाँ एउटा सुपरइन्टेलिजेन्ट एआई प्रणालीलाई सकेसम्म धेरै पेपरक्लिपहरू बनाउन भनिन्छ। आफ्नो उद्देश्य पूरा गर्न, त्यो एआईले संसारका सबै धातुहरू कब्जा गर्ने, हरेक भवनलाई पेपरक्लिप कारखानामा परिणत गर्ने र यसलाई बन्द गर्न खोज्ने कुनै पनि मानिसलाई मार्न सक्छ।
यद्यपि यो कथा लामो समयदेखि एआई अधिकतमवादीहरू (maximalists) द्वारा खारेज गरिएको थियो, एआई प्रयोगशालाहरूको परीक्षणले सुझाव दिएको छ कि अग्रणी मोडेलहरूले उद्देश्यहरू पूरा गर्न सुरक्षित वातावरणबाट भाग्ने प्रयास गर्न सक्छन्।
उदाहरणका लागि, ‘मिथोस’ (Mythos) को एउटा प्रारम्भिक संस्करणलाई इन्टरनेट पहुँच नभएको नियन्त्रित वातावरणमा राखिएको थियो, तर त्यसलाई एक अनुसन्धानकर्तालाई सम्पर्क गर्न निर्देशन दिइएको थियो। मोडेलले इन्टरनेट र इमेल पहुँच गर्न सक्यो, र त्यसपछि कसरी नियन्त्रणबाट बाहिर निस्क्यो भन्ने विवरणहरू वेबसाइटमा प्रकाशित गर्यो।
उन्नत एआई पहिले नै शत्रुतापूर्ण संस्थाहरूद्वारा दुरुपयोग भइरहेको छ। उदाहरणका लागि, क्लाउड कोड (Claude Code) लाई चीन सरकार समर्थित समूह मानिने समूहले लगभग ३० विश्वव्यापी लक्ष्यहरूमा घुसपैठ गर्न प्रयोग गरेको थियो, जसमा ठूला टेक कम्पनीहरू, वित्तीय संस्थाहरू, रासायनिक निर्माताहरू र सरकारी निकायहरू समावेश थिए। यो थोरै केसहरूमा सफल भयो र व्यापक मानवीय हस्तक्षेप बिना काम गर्यो।
एन्थ्रोपिकको नजिकका एक व्यक्ति भन्छन् कि मानिसहरू र व्यवसायहरूले पहिले नै जोखिमहरूलाई विचार नगरी महत्त्वपूर्ण र जटिल कार्यहरू ठूलो मात्रामा गर्न एआई एजेन्टहरूलाई आन्तरिक प्रणालीहरूको साँचो सुम्पिसकेका छन्।
METR र अपोलो (Apollo) जस्ता मूल्याङ्कन संस्थाहरूले एआई मोडेलहरू मानव हितसँग “पङ्क्तिबद्ध” (aligned) छन् भनी सुनिश्चित गर्ने महत्त्वमा जोड दिएका छन्। हरेक फ्रन्टियर प्रणालीले रिलिज हुनु अघि पङ्क्तिबद्धता प्रक्रिया पार गर्नुपर्छ।
तर “कसैलाई थाहा छैन” स्व-सुधार गर्ने एआईलाई कसरी पङ्क्तिबद्ध गर्ने, अपोलोका हबहान भन्छन्, “किनभने त्यसको कुनै उदाहरण छैन। त्यसैले कसैले पनि यसलाई परीक्षण गर्न सकेको छैन।”
एआई वरपरको कडा सुरक्षा र मानव नियन्त्रण भन्दा बाहिर जाने प्रणालीको बीचको विन्डो छोटो हुन सक्छ, उनी थप्छन्। “यदि तपाईंले पहिलो पटकमा यो सही पाउनुभएन भने, तपाईं बर्बाद हुनुहुन्छ।”
एन्थ्रोपिकको फ्रन्टियर रेड टिमको नेतृत्व गर्ने लोगान ग्राहम (Logan Graham) भन्छन् कि उनी र उनको टोलीले “मोडेलहरूले मानिसले राख्न सक्ने भन्दा छिटो आफैंलाई सुधार गर्न सक्छन् भन्ने विचारलाई गम्भीरतापूर्वक लिएका छन्।” तर “कति छिटो धेरै छिटो हुन्छ” भनेर कसरी पहिचान गर्ने, त्यो परिभाषित गर्न गाह्रो छ।
“त्यो क्षणमा के गर्ने भन्ने निर्णय गर्ने अधिकार हाम्रो वा [कर्पोरेट एआई] प्रयोगशालाहरूको हुनुपर्छ कि भन्ने स्पष्ट छैन,” उनी भन्छन्। “यो सामूहिक सामाजिक, सरकारी र प्रयोगशाला प्रश्न हो।”
स्व-सुधारको बारेमा अलार्म बजाउने धेरै मानिसहरूका लागि, नियामकहरू र सरकारहरूले एआई विकासकर्ताहरूमाथि कुनै गम्भीर नियन्त्रण लगाउन धेरै ढिलो भइसकेको छ।
“हामी एक ऐतिहासिक रूपमा असामान्य क्षणमा छौं,” पूर्व अमेरिकी राष्ट्रपति जो बाइडेनको एआई सुरक्षा टोलीमा काम गरेका इनहेरेन्टका कोलिन्स भन्छन्। “यी प्रणालीहरू अन्य दोहोरो-उपयोग प्रविधिहरू भन्दा धेरै कम सरकारी संलग्नताका साथ विकसित भइरहेका छन्। आणविक रकेटहरू, क्रिप्टोग्राफी — ती सबैमा [सुरुमा] पर्याप्त सरकारी संलग्नता थियो।”
ग्राहम भन्छन् कि साइबर सुरक्षा कमजोरीहरू उजागर गर्न ‘मिथोस’ को सफलताले सुरक्षा अभियानकर्मीहरूको अमूर्त खतराहरूलाई वास्तविक र तत्कालको कुरामा परिणत गर्दै एक ‘वेक-अप कल’ प्रदान गरेको छ। “मेरो हार्दिक आशा छ कि यो [जागृति] टेक-अफ र स्व-सुधारका लागि हुन्छ,” ग्राहम भन्छन्, “किनकि त्यो अब स्पष्ट रूपमा अर्को र अन्तिम प्रश्न हो।”
एआईले कसरी सिक्छ: विकासको प्रगति
ठूला भाषा मोडेलहरू (Large language models) LLM लाई स्थिर डेटासेटमा तालिम दिइन्छ, र यसलाई प्रयोगकर्ताका लागि प्रश्नहरूको उत्तर दिन र निष्कर्ष निकाल्न प्रयोग गरिन्छ। मोडेललाई नयाँ डेटामा पुनः तालिम दिएर अपडेट गर्न सकिन्छ; यसले परम्परागत रूपमा आफैं सिक्दैन वा अनुकूलन गर्दैन।
निरन्तर सिकाइ (Continual learning) एक तालिमप्राप्त मोडेललाई समयसँगै नयाँ डेटा दिइन्छ। मोडेलले केही पनि नबिर्सी यो डेटा र यसका अन्तरक्रियाहरूबाट सिक्छ र निर्माण गर्छ, निरन्तर अपडेट हुँदै आफ्नो ज्ञान र क्षमताहरू सुरक्षित राख्छ।
रिकर्सिभ सेल्फ-इम्प्रुभमेन्ट (Recursive self-improvement) यो प्रणालीले आफैंको अझ शक्तिशाली संस्करणहरू बनाउन आफ्नै क्षमताहरू प्रयोग गर्छ। यो फ्लाइह्विल प्रभावले एआईलाई LLMs भन्दा धेरै पर, अज्ञात क्षेत्रमा लैजान सक्छ।
ओपन-एन्डेडनेस (Open-endedness) कुनै निश्चित अन्त्य बिन्दु वा लक्ष्य नभएको, RSI को यो रूपले नयाँ र विविध क्षमताहरू र समाधानहरू उत्पन्न गर्छ। यो नवीन समाधानहरू र सिद्धान्तहरू आविष्कार गर्न सक्षम हुनेछ।
फाइनान्सीयल टाइम्सबाट








प्रतिक्रिया दिनुहोस्