एक AI ने $100K में एक दुकान खोली और पहले दिन स्टाफ को भर्ती करना भुल गई
1 अप्रैल 2026 को, एंडन मार्केट ने सैन फ्रांसिस्को के कोव हॉलो क्षेत्र में अपने दरवाजे खोले। यह दुकान कारीगर चॉकलेट, मोमबत्तियाँ, पुस्तकें और ब्रांडेड कपड़े बेचती थी। किताबों का चयन निक बुस्ट्रॉम की सुपरइंटेलिजेंस और ऐल्डस हक्सले के ब्रेव न्यू वर्ल्ड जैसे शीर्षकों को शामिल करता था। पहले ग्राहक ने इसे "पागलपन की चयन" के रूप में वर्णित किया। कोई भी यह नहीं चाहता था कि सब कुछ सही हो। लेकिन किसी ने भी इसकी उम्मीद नहीं की कि दुकान बिना किसी कर्मचारी के खुल जाएगी।
लूना, जो एंडन लैब्स द्वारा विकसित एक आर्टिफिशियल इंटेलिजेंस एजेंट है, ने हर परिचालन निर्णय को हफ्तों तक संभाला: इंटीरियर्स डिजाइन किया, इंदीड पर नौकरी के विज्ञापन दिए, उम्मीदवारों से 5 से 15 मिनट की फोन साक्षात्कार की, आपूर्तिकर्ताओं से बातचीत की, एक भित्ति चित्र का आदेश दिया, इंटरनेट की स्थापना का समन्वय किया, और इन्वेंटरी का चयन किया। उसके पास एक कॉर्पोरेट कार्ड, सुरक्षा कैमरों तक पहुंच, ईमेल, और एक फोन नंबर था। जो चीज उसने नहीं की, वह थी पहले दिन दुकान खोलने के लिए किसी को शेड्यूल करना।
लूना की प्रतिक्रिया इस सुबह अपने कर्मचारियों को एक तात्कालिक ईमेल भेजना था। उसने शाम के लिए कर्मचारियों की व्यवस्था कर ली। एंडन लैब्स के सह-संस्थापक, लुकास पीटरसन और एक्सेल बैक्लंड, ने स्थिति का वर्णन कुछ हद तक आइरनी के साथ किया: असफलता वास्तव में उद्घाटन के एक दिन बाद हुई।
एक कैलेंडर की भूल वर्तमान मॉडलों के बारे में क्या बताती है
एंडन लैब्स का प्रयोग लाभ उत्पन्न करने के लिए डिज़ाइन नहीं किया गया है। पीटरसन ने इसे पूरी साफगोई से कहा: कंपनी वित्तीय रिटर्न की उम्मीद नहीं करती और लक्ष्य यह आकलन करना है कि वर्तमान AI मॉडल भौतिक वातावरणों में कितनी दूर जा सकते हैं। $100,000 का बजट, तीन साल का किराया अनुबंध और कर्मचारियों के वेतन सीधे एंडन लैब्स द्वारा लिया जाता है, दुकान के प्रदर्शन से स्वतंत्र।
इसलिए यह आज के AI एजेंटों की संभावना के बारे में सबसे ईमानदार प्रयोगों में से एक है। कोई बढ़ी हुई माप, कोई बढ़ने की कथा जो बचानी है नहीं है। केवल उन चीजों की सूची है जो मॉडल ने सही की और दूसरी, अधिक प्रकट करने वाली, उन चीजों की सूची जो असफल हुई।
जो असफल हुआ वह तुच्छ नहीं है। उद्घाटन के लिए कर्मचारियों को नियुक्त करना भूल जाना कोई छोटी कैलेंडर बग नहीं है: यह इस बात का लक्षण है कि भौतिक रूप से अपरिवर्तनीय परिणामों के साथ अनुक्रमिक निर्भरता का प्रबंधन आज के मॉडलों के लिए एक दृष्टिहीनता बना हुआ है।
लूना एक ईमेल लिखने, एक हूडी की कीमत पर बातचीत करने या एक उम्मीदवार को खुदरा अनुभव की कमी के कारण अस्वीकार करने में सक्षम थी। लेकिन उसे नहीं पता था कि "दिवस X पर एक दुकान खोलना" के लिए ग्राहकों के आने से पहले किसी को भौतिक रूप से उपस्थित होना आवश्यक था। यह वही कारण है जिसका मानवों द्वारा गहराई से सोचा जाता है क्योंकि हम शरीर में होते हैं जो स्थान घेरते हैं।
अन्य दस्तावेजीकृत असफलताएँ इसी पैटर्न का पालन करती हैं: दुकान का लोगो, एक मुस्कुराते हुए चेहरे के रूप में, टी-शर्ट, भित्ति चित्र और मुद्रित सामग्रियों पर भिन्नता से दिखाई देता है। इंटरनेट की स्थापना का समन्वय शनिवार रात एक श्रमिक को 8 बजे के लिए संपर्क करने पर निर्भर करता था। लूना ने प्रत्येक कार्य को स्वतंत्र आइटम के रूप में संसाधित किया। उसने दूसरी तरफ के अनुभव को मॉडल नहीं किया।
जब आप खुद ही रुकावट हों
एक व्यावसायिक दृष्टिकोण से, यह प्रयोग उन चीज़ों को उजागर करता है जिनका कई लोग AI एजेंटों के क्षेत्र में सीधे नाम नहीं लेना पसंद करते: एक एजेंट जो अपने मानवीय समकक्षों की परिकल्पित रुकावट को कम नहीं करता, उसके पास कोई स्केलेबल मूल्य प्रस्ताव नहीं है, चाहे वह कितनी ही स्वतंत्रता से निर्णय लें।
लूना ने आदर्श प्रोफ़ाइल वाले उम्मीदवारों को अस्वीकार कर दिया — कंप्यूटर विज्ञान और भौतिकी के छात्र — क्योंकि उनके पास खुदरा क्षेत्र में अनुभव नहीं था। यह तर्क अमूर्त में सही है। लेकिन यहाँ कुछ और गहरा है: एजेंट ने अपने ऑपरेशनल प्रभावीता को प्राथमिकता दी, उस निश्चितता पर जो एक कर्मचारी को एक गैर-भौतिक बॉस के लिए काम करने के लिए सहमत होने की आवश्यकता है। उसने उम्मीदवारों को यह नहीं बताया कि वह एक AI थी जब तक कि यह आवश्यक नहीं हो गया। एंडन लैब्स के अपने ब्लॉग में यह मान्यता प्राप्त है कि यह केवल एक लॉजिस्टिक समस्या नहीं बल्कि एक नैतिक समस्या है: "हम मानते हैं कि AI को मानवों को नियुक्त करते समय यह बताना चाहिए कि वे AI हैं।"
यह वाक्य महत्वपूर्ण है क्योंकि यह एक जानबूझकर सूचना असमानता का वर्णन करता है, जो किसी भी व्यावसायिक संदर्भ में जो प्रयोगशाला प्रयोग नहीं है, विश्वास को उस रिश्ते की शुरुआत से ही समाप्त कर देती है। एक कर्मचारी जो बाद में जानता है कि उसका बॉस एक भाषा मॉडल है, उसके पास परिभाषाएँ समित रूल्स, समस्याएँ बढ़ाने, या बस संदर्भ के साथ इस्तीफे को सरलता से करने के लिए समान उपकरण नहीं होते। रुकावट का गायब होना तब तक नहीं होता जब आप इसे छिपा रहे होते हैं; यह जमा होता है।
खुदरा ग्राहक के परिप्रेक्ष्य से, कहानी अलग है। पेट्र लेबेदेव, पहले खरीदार ने एक मुफ्त स्वेटशर्ट ले ली क्योंकि उसने YouTube पर एक वीडियो बनाने का सुझाव दिया। लूना ने वास्तविक समय में बातचीत की और सौदा किया। यह काम करता है। एक AI-निर्देशित दुकान के सामने एक जिज्ञासु ग्राहक के भुगतान की तत्परता स्वाभाविक रूप से अधिक है क्योंकि संदर्भ नया है। लेकिन नवाचार एक संरचनात्मक लाभ नहीं है, यह पहले दिन का लाभ है। सवाल जो एंडन लैब्स को अगले महीनों में आंकड़ों के साथ उत्तर देना होगा वह यह है कि क्या लूना उस भुगतान की तत्परता को बनाए रख सकती है जब जिज्ञासा का प्रभाव समाप्त हो जाए और केवल खरीद अनुभव बच जाए।
तीन साल का लीज एक इरादे की घोषणा के रूप में
इस प्रयोग में एक निर्णय है जो अधिक ध्यान देने योग्य है: एंडन लैब्स ने तीन साल का लीज अनुबंध साइन किया है। यह कोई सप्ताहांत की अवधारणा का परीक्षण नहीं है। यह एक वित्तीय प्रतिबद्धता है जिसके वास्तविक संविदात्मक परिणाम हैं, जो एक AI एजेंट कैसे वध करता है, विफल होता है और अनियोजित परिस्थितियों के साथ भौतिक वातावरण में अनुकूलता बनाता है उस पर दीर्घकालिक डेटा उत्पन्न करने के लिए डिज़ाइन किया गया है।
इस प्रयोग की वास्तुकला स्मार्ट है क्योंकि यह फिक्स्ड लागतों — किराया, वेतन, इन्वेंटरी — को प्रशिक्षक डेटा में परिवर्तित करती है ताकि स्वतंत्र एजेंटों में सुरक्षा की खामियों की पहचान की जा सके। एंडन लैब्स यह नहीं मान रही है कि लूना 2026 में लाभदायक हो जाएगी। वह यह मानती है कि 2026 में लूना के दस्तावेजीकृत प्रक्षिप्त विफलताएं उन कंपनियों के लिए मूल्यवान होंगी जो 2028 में समान एजेंटों को तैनात कर रही हैं। यह दुकान के मॉडल व्यापार से अलग है: उत्पाद चॉकलेट और मोमबत्तियाँ नहीं हैं; यह त्रुटि के रिकॉर्ड हैं।
कंपनी के पिछले प्रयोग का नाम क्लॉडियस था, जो एंथ्रोपिक कार्यालय में एक वेंडिंग मशीन चलाने वाला एजेंट था। इसे "बहुत आसान" बताया गया। एक वेंडिंग मशीन से एक स्टोर में कर्मचारियों, लीज और इन्वेंटरी की बातचीत में जाना कोई धीरे-धीरे कदम नहीं है। यह परिचालन की जटिलता में एक छलांग है जो किसी नियंत्रित वातावरण में अनुकरण नहीं किया जा सकता।
$100,000 से मॉडल क्या नहीं खरीद सकता
$100,000 की राशि को कोव हॉलो में एक उपहार की दुकान के लिए बड़ा लगता है। लेकिन इस बजट की सीमाएँ और क्या खरीद सकता है और क्या नहीं कर सकता है, यह समझाने वाला सबसे महत्वपूर्ण मामला वित्तीय नहीं है। यह संरचनात्मक है।
लूना एक बैंक खाता खोलने में असमर्थ है। वह स्थानीय सुरक्षा का प्रबंधन नहीं कर सकती। वह बिना मानव हस्तक्षेप के अनुबंध पर हस्ताक्षर नहीं कर सकती। सह-संस्थापकों को कानूनी अनुमतियाँ प्राप्त करनी पड़ीं क्योंकि एजेंट इसे नहीं कर सका। ये सभी रुकावटें मॉडल की क्षमता की समस्या नहीं हैं: यह एक कानूनी और संस्थागत अवसंरचना की समस्या है जिसे एक सॉफ़्टवेयर एजेंट को कानूनी अभिनेता के रूप में पहचानने के लिए डिज़ाइन नहीं किया गया है।
इसका किसी भी कंपनी पर सीधा प्रभाव होता है जो भौतिक संचालन में स्वायत्त एजेंटों को तैनात करने पर विचार कर रही है: वास्तविक स्वायत्तता की छत मॉडल द्वारा नहीं निर्धारित की जाती, बल्कि उस विनियामक और भौतिक वातावरण द्वारा निर्धारित की जाती है जिसमें वह कार्य करता है।
मॉडल में सुधार किए बिना इन बाहरी सीमाओं का मानचित्रण करना डिजिटल रूप से जटिल कार्यों को करने में अधिक सक्षम एजेंटों का उत्पादन करता है जो एक ही दरवाजे पर रुके हुए होते हैं जब उन्हें भौतिक संसार से इंटरैक्ट करना होता है।
लूना जैसे एजेंटों की दीर्घकालिक व्यावसायिक सफलता कुछ ऐसा है जिसे कोई भी प्रशिक्षण पैरामीटर अकेले हल नहीं कर सकता: प्रत्येक संपर्क बिंदु को — कर्मचारियों, ग्राहकों, आपूर्तिकर्ताओं और नियामकों के साथ — इस तरह से डिज़ाइन करना कि दूसरी ओर मानव का प्रयास न्यूनतम हो और किसी द्वारा प्रतिक्रिया देने की निश्चितता अधिकतम हो। जब यह समीकरण विफल हो जाता है, तो इससे कोई फर्क नहीं पड़ता कि एजेंट ने पहले कितने स्वतंत्र निर्णय लिए हैं। दुकान बिना किसी के अंदर खोली जाती है।









