पत्रिका
“मैं क्लाउड हूँ”- जब रोबोट समझदार हो जाएँगे

आशुचित्र- आर्टिफिशियल इंटेलिजेंस (एआई) की ओर बढ़ते दौर में तब क्या होगा जब रोबोट इस बात को समझेंगे कि वे मात्र क्लाउड का एक भाग हैं?

वर्ष 2000 में धूमिल हुए डॉटकॉम के अंतिम अंशों में से वर्ष 2006-2007 में अचंभित करते हुए वेब 2.0 उभरा। तब कंसास स्टेट विश्वविद्यालय के डिजिटल एथनोग्राफी के प्राध्यापक माइकल वेश ने “मशीन हम हैं/मशीन हमारा उपयोग कर रही है” नामक वीडियो जारी किया था। वेब 2.0 के पहले तक वर्ल्ड वाइड वेब मुख्यत: केवल पढ़ने योग्य था तथा दर्शकों के लिए खबरें और जानकारी के प्रसार का माध्यम था। उपयोगकर्ता द्वारा प्रसारित सामग्री तथा विश्वसनीय नेटवर्क पर केंद्रित वेब 2.0 ने लेखन-पठन का एक मंच निर्मित किया जिससे लोग मशीन में सुलभता से जानकारी डालने लगे। इस प्रक्रिया में मशीन ने उन चीज़ों को सीखा जिससे पहले वह अनभिज्ञ थी। वेब 2.0 का प्रथम प्लेटफॉर्म विकिपीडिया रहा जो भले ही ज्ञान का नहीं लेकिन जानकारी का सबसे बड़ा भंडार बन गया। इससे विद्यार्थियों, पत्रकारों और वेब उपयोगकर्ताओं की पूरी पीढ़ी काफी प्रभावित हुई तथा इसने उनके दुनिया देखने के नज़रिए को आकार दिया। उदाहरण के तौर पर कैथोलिक मिशनरी विद्यालय में पढ़े इस लेखक के लिए फ्रांसिस ज़ेवियर आदरणीय थे लेकिन विकिपीडिया पर फ्रांसिस द्वारा गोवा के हिंदुओं पर हत्या से संबंधित जाँच का विवरण करने वाले आलेख को पढ़कर वह धारणा विपरीत हो गई। कोई भी विद्यालय में रहकर ऐसी नीरस बातें नहीं जान सकता।

वेश द्वारा दिखाए गए वीडियो में इस बात पार ज़ोर दिया गया था कि डिजिटल दुनिया में किसी भी व्यक्ति के द्वारा लिया गया कदम मशीन द्वारा इनपुट की तरह प्रयोग किया जाता है जिससे वह वास्तविक तथा डिजिटल दुनिया के बारे में अपना ज्ञान बढ़ाती रहती है। सोशल मीडिया पर दबाए गए प्रत्येक लाइक बटन तथा वेब पृष्ठ पर अथवा मोबाइल एप पर हाइपरलिंक पर क्लिक जानकारी छोड़ने जैसा है जो व्यक्तिगत तथा सामूहिक तौर पर इंसानों की सोच अथवा पसंद के बारे में ज्ञान को बढ़ाता है। यह हमारे विश्व को देखने के नज़रिए को आकार देने में उपयोग होता है जैसे यह सुझाव देता है कि अगली चीज क्या देखनी है, लाइक और क्लिक करनी है। जब तक आप रिचर्ड स्टॉलमैन की तरह नहीं हो जो अत्यंत निजता के पक्षधर थे तथा गूगल सर्च, मोबाइल तथा क्रेडिट कार्ड का उपयोग कदापि नहीं करते हैं तब तक आप मशीन की इस मज़बूत जकड़ से बाहर नहीं निकल सकते। वास्तव में मशीन कोई एकाधिकार वाला तंत्र नहीं है तथा इसकी दुनिया कई विशाल आर्थिक दीवारों द्वारा सूक्ष्म भागों में विभाजित है जैसे गूगल, बाईडू, अमेज़न, अलीबाबा और फ़ेसबुक। अपने अथक प्रयासों की बदौलत यह इंसानी जीवन के प्रत्येक कोने में पहुँच रखती है और इस प्रकार इंसानी दिमाग तक भी पहुँच जाती है।

वेब के विस्तृतीकरण के समानांतर डाटा विज्ञान भी उभरा है। यह सांख्यिकी के विस्तार से आरंभ हुआ और अब मशीन लर्निंग तक पहुँच गया है। फिर 1960  के दशक से 30 वर्षों तक दबा रहा आर्टिफिशियल इंटेलिजेंस (एआई) सहसा उभर कर आया और मशीन लर्निंग के नए प्रारूप हेतु दिमाग के न्यूरल नेटवर्क प्रारूप को अपना लिया। यह न्यूरल नेटवर्क प्रारूप जिसे डीप लर्निंग भी कहा जाता है आर्टिफिशियल इंटेलिजेंस का नवीन दौर है तथा आवाज़ और तस्वीर पहचानने के तंत्र, भाषा के अनुवाद, स्वचालित वाहनों के मार्गदर्शन तथा नियंत्रण, ऋण संवितरण और कर्मचारियों की नियुक्ति में बढ़ते उपयोग के कारण तेजी से वृद्धि कर रहा है।

डाटा साइंस तीन स्तरों से होकर निकला है, वर्णनात्मक- डाटा की रिपोर्ट, अनुमानिक- परिकल्पना के स्वीकार्य अथवा अस्वीकार्य होने से डाटा द्वारा निष्कर्ष निकालना तथा भविष्य की बात- जैसा कि एआई के नवीन दौर में हो रहा है। डाटा और हार्डवेयर की उपलब्धता इस नवीन एआई के स्वीकार्य तथा गतिशील होने के प्रमुख कारण हैं। न्यूरल नेटवर्क पर आधारित एआई का हृदय मानी जानी वाली बैकप्रोपोगेशन एल्गोरिदम पिछले दशक में ही ताकतवर हुई है जिसकी खोज 1960 और 1970 के दशक में हो गई थी। यह निम्न उपलब्धताओं से संचालित होती है- 1) विशाल डाटा जो वेश के वीडियो में बताई गई मशीन द्वारा एकीकृत किया गया है अथवा किया जा सकता है, और 2) अत्यधिक तथा सस्ती कंप्यूटिंग क्षमता जो कि किराए पर क्लॉउड सर्विस कंपनियों जैसे अमेज़ॉन वेब सर्विस, गूगल कंप्यूट इंजिन तथा माइक्रोसॉफ्ट एज़्योर।

इस क्षेत्र में प्रमुख योगदान क्लाउड कंप्यूटिंग का रहा है। हार्डवेयर को खरीदने तथा स्थापित करने की बजाय कंपनी वर्चुअल मशीनें डाटा को सहेजने तथा उसके प्रसंस्करण के लिए किराए पर देती है। इसका सबसे सीधा उदहारण जी मेल है जिसमें हमारे मेल तथा मेल सर्वर इंटरनेट पर किसी क्लाउड पर रखे होते हैं जिसे हम ब्राउज़र के माध्यम से उपयोग कर सकते हैं। लेकिन यही प्रारूप कई महत्त्वपूर्ण वित्तीय आवश्यकताओं में उपयोग किया जाता है जो ई-कॉमर्स से लेकर उद्यम संसाधन योजना तथा ग्राहक संबंध प्रबंधन तंत्र तक व्याप्त हैं। क्लाउड कंप्यूटिंग को लेकर सुरक्षा संदेहास्पद होती है क्योंकि इसमें कंपनी के महत्त्वपूर्ण डाटा को किराए पर ली गई मशीन पर रखा जाता है लेकिन इसकी कीमत अत्यधिक कम होने के कारण कई नई सॉफ्टवेयर सेवाएँ इसका उपयोग करती हैं जिसमें मशीन लर्निंग तथा एआई की आवश्यकता पड़ती है।

क्लाउड सेवाएँ देने वाली कंपनियाँ न केवल डाटा के लिए विशाल हार्डवेयर कम कीमत पर उपलब्ध करवाती हैं अपितु कई ताकतवर सॉफ्टवेयर सेवाएँ भी उपलब्ध करवाती हैं। तस्वीर पहचानने, भाषा के अनुवाद जैसे जटिल मशीन लर्निंग सॉफ्टवेयर भी वर्तमान में ई-मेल और सोशल मीडिया जितनी सुलभता से ही उपलब्ध हैं। क्लाउड कंप्यूटिंग सेवाएँ दो श्रेणियों में विभाजित की गई हैं- प्लेटफॉर्म-एस-अ-सर्विस (पीएएएस) और सॉफ्टवेयर-एस-अ-सर्विस (एसएएएस)।

पहली श्रेणी वर्चुअल मशीन, ऑपरेटिंग सिस्टम, प्रोग्रामिंग लेंग्युएज, डाटाबेस डिवाइस के साथ सामान्य कंप्यूटिंग उपलब्ध करवाती है जहाँ निर्माता ऐप्लीकेशनस को बिना हार्डवेयर खरीदे निर्मित तथा प्रसारित कर सकते हैं। दूसरी श्रेणी उपयोग करने हेतु अधिक सरल है क्योंकि यहाँ सॉफ्टवेयर जैसे जी-मेल के मामले में ई-मेल पहले से उपलब्ध होता है। इसे सब्सक्राइब करने की आवश्यकता होती है, उपयोगकर्ता आईडी तथा पासवर्ड जैसे उपयोग करने के अधिकारों की आवश्यकता होती है तथा फिर सीधे कनेक्ट कर उपयोग किया जा सकता है। यहाँ कुछ भी निर्मित अथवा प्रसारित करने की बात नहीं होती तथा यह पहले से उपयोग होने के लिए तैयार होती है।

स्वराज्य में मार्च 2017 में प्रकाशित एक आलेख में हमने देखा था कि किस तरह मशीन लर्निंग और अब एआई टेराबाइट जितना विशाल डाटा तथा ट्रेनिंग डाटा के भागों का उपयोग कर भविष्य सूचक विश्लेषण हेतु सॉफ्टवेयर प्रारूप निर्मित कर रहे हैं। यह एक महंगी प्रक्रिया है जो आम व्यक्ति तथा अधिकांश व्यवसायियों की हद के बाहर है। लेकिन एसएएएस (सास) के रूप में उपलब्ध एआई अथवा मशीन लर्निंग के साथ बहुत ही कम कीमत में इन सेवाओं का उपयोग करने वाली नई सॉफ्टवेयर एप्लीकेशन सुलभता से निर्मित की जा सकती हैं। उदाहरण के तौर पर अकाउंटिंग सॉफ्टवेयर से आईडी पासवर्ड आधारित लोग इन हटाकर फेस रिकग्निशन आधारित लोग इन प्रक्रिया आरंभ की जा सकती है।

इसी प्रकार स्वचालित कार और आईवीआर टेलीफोनी के सॉफ्टवेयर बनाने में होने वाली कठिनाई क्लाउड सेवा कंपनियों के माध्यम से एआई-एस-अ-सर्विस की तरह उपयोग करने से काफी कम की जा सकती है। सास सहित कई अन्य क्लाउड सेवाओं के लिए सेवा देने वाले तथा सेवाओं का उपयोग करने वाली मशीन के बीच टिकाऊ, विश्वसनीय तथा तेज डाटा कनेक्टिविटी आवश्यक है।

रोबोट-एस-अ-सर्विस (रास) इस प्रारूप का विस्तार दिखता है लेकिन गौर से समझने के बाद काफी गहरी तथा संदेहयुक्त अंतर्दृष्टि होती है।

गूगल द्वारा एक नई सेवा क्लाउड रोबोटिक्स 2019 में आरंभ होने का अनुमान है जो आसानी से कुशल रोबोट तैयार करने में सहायक होगी। अवश्य ही अन्य विक्रेता भी इसका अनुसरण करेंगे। हममें से अधिकतर लोग रोबोट को इंसानों की तरह ही दिखने वाली हाथ-पैर, आँख, आवाज़ वाली मशीन मानते हैं लेकिन सच्चाई भिन्न हैं। उपयोग के अनुसार रोबोट एक गाड़ी हो सकता है, एक ड्रोन, ऑटोमेटेड असेंबली में एक हाथ की तरह या वाल्व, स्विच और लेवर को नियंत्रित करने वाला यंत्र भी हो सकता है। रोबोट किसी भी चीज़ को कहा जा सकता है जो वातावरण को समझकर अपने उद्देश्य को प्राप्त करने के लिए कदम ले सके। यह आर्टिफिशियल इंटेलिजेंस की परिभाषा भी है। तो रोबोट एक ऐसी मशीन हुआ जो होशियार है तथा उद्देश्य पूर्ण करने के लिए खुद से निर्णय ले सकता है।

परंपरागत रोबोट में यह इंटेलिजेंस उनमें हार्ड कोडेड रहता है जो कि एक कंप्यूटर के रूप में होता है तथा वातावरण में हुए किसी भी बदलाव को पहचान कर उचित प्रतिक्रिया देता है। यह किसी भी प्रकार से इंसानों से भिन्न नहीं है। इंसान तथा अधिकतर जानवर वातावरण में हो रहे बदलाव पर चाहे उन पर हमला हो या कोई साधारण प्रश्न पर प्रतिक्रिया देते हैं और उनके इंटेलिजेंस को इस प्रतिक्रिया की गुणवत्ता के आधार पर आंका जाता है।

इन दोनों में ही बाहरी वातावरण का ज्ञान एनकोडेड रहता है तथा प्रतिक्रिया देने की क्षमता भी या तो इंसानी दिमाग में या कंप्यूटर में निर्मित की हुई रहती है। क्लाउड रोबोटिक्स एक अकेले कंप्यूटर द्वारा नियंत्रित रोबोट को हटाकर साझा किए हुए कंप्यूटर का प्रयोग करता है। यहाँ कंप्यूटर क्लाउड सेवा कंपनी के क्षेत्र में स्थित  होता है जो हज़ारों रोबोट को नियंत्रित करता है। जिस प्रकार जी-मेल बॉक्स अपने घर में बैठे उपयोगकर्ता के मेल बॉक्स को सहेजता है, सेवा देता है तथा नियंत्रित करता है उसी प्रकार इंटेलिजेंट रोबोट जो डिजिटल रूप से जुड़े हुए विश्व में कहीं गाड़ी चला रहे होंगे, ड्रोन उड़ा रहे होंगे, खेतों में, कारखानों में, खदानों में, निर्माण स्थलों पर डिवाइस को नियंत्रित कर रहे होंगे ऐसे लाखों रोबोट  को नियंत्रित करने की क्षमता इंटरनेट पर किसी कोने में व्याप्त क्लाउड रोबोटिक्स सर्वर रख सकते हैं।

पुन: वेश के वीडियो पर आते हैं जिसके उल्लेख से यह आलेख आरंभ हुआ है। यह रास सर्वर न केवल दुनियाभर के रोबोट को नियंत्रित कर रहे होंगे अपितु जिस रोबोट को नियंत्रित कर रहे होंगे उनका उपयोग प्रशिक्षण डाटा पुल बनाने में करेंगे तथा उनसे सीखेंगे भी। यह वेब 2.0 के मूल विचार का विस्तार है जिसे हम वेब 3.0 भी कह सकते हैं। यहाँ मशीन ने न केवल डिजिटल दुनिया से वास्तविक दुनिया में एक सफल संक्रमण किया है अपितु सीखने के लिए इंसानी मदद की आवश्यकता को भी खत्म कर दिया है। वह खुद से ही सीख सकती है तथा खुद ही काबिज हो सकती है।

निजता एक महत्त्वपूर्ण बिंदु है और अन्य दूसरी क्लाउड सेवाओं की तरह क्लाउड रोबोटिक्स को उपयोग नियंत्रण तथा डाटा एन्क्रिप्शन से सुरक्षित रखना होगा। लेकिन हमने पहले भी देखा है कि सुलभता निजता पर हावी होती है। हमें पता है कि गूगल जी-मेल के सभी मेल पढ़ सकता है लेकिन फिर भी हम उसका उपयोग करते हैं क्योंकि वह मुफ़्त है। यही बात क्लाउड रोबोटिक्स के साथ भी है। हमें पता है कि रास सेवा देने वाली विभिन्न कंपनियाँ अपने सर्वर को दूसरी कंपनियों से सुरक्षित रखने के प्रयास करेंगी लेकिन यह अस्थायी राहत होगी। कई विक्रेताओं के बीच सहयोग तथा डाटा पुलिंग विलय के कारण हो सकता है या इस कारण से कि यह उन सरकारों द्वारा अनिवार्य किया जाए जिनके लिए निजता मायने नहीं रखती।

इंसान खुद को एक अद्वितीय रचना समझता है अत: निजता की आवश्यकता पड़ती है। ‘मैं’ हमें सामूहिक भीड़ से भिन्न करता है। मेरे डाटा को सामूहिक भीड़ से सुरक्षित रखने की आवश्यकता है इसीलिए मेरा डाटा निज कहलाता है। यदि हम सनातन धर्म की दार्शनिक जड़ों तक जाएँ और अद्वैत वेदांत के दृष्टिकोण से देखें तो “अहम्” का भाव त्रुटिपूर्ण है। दरअसल प्रत्येक व्यक्ति उत्कृष्ट एवं सामूहिक चेतना “ब्राह्मण” का अंश है। केवल “ब्राह्मण” ही सत्य है तथा इस दृष्टिकोण से इसके अलावा सब त्रुटियुक्त है। यह दुनिया एक माया है, एक ऐसा भाव जो अलगाव के इस भाव को स्थिर करता है तथा व्यक्ति और दुनिया में भेद करता है। योग की उचित क्रिया इस भ्रम से बाहर निकाल सकती है और सत्य की ओर ले जा सकती है। जब योग माहिर खुद की पहचान और ब्राह्मण में निरंतरता देखता है तब परमानंद महसूस करता है।

हम जानते हैं कि कई प्रसिद्ध योगियों को यह अहसास हुआ है। एआई उत्पाद तस्वीर तथा आवाज़ पहचानने में सक्षम हैं तथा अब एक से अधिक उपयोगकर्ता की भूमिका वाले क्षेत्रों में खुद के निज, गैर इंसानी भाषाएँ निर्मित करने लगी हैं। हमें यह जानने की आवश्यकता है कि क्या होगा जब रोबोट योगियों की नकल करने लगेंगे और अपनी पहचान क्लाउड रोबोटिक्स सर्वर से जुड़ी हुई मानेंगे जिसका वे हिस्सा हैं।

भारतीय सॉफ्टवेयर क्षेत्र में कई वर्षों का अनुभव लेने के बाद अब पृथ्विस छात्रों की तकनीकी शिक्षा में सहायता करते हैं।