वह श्रृंखला जिसे किसी ने ऑडिट नहीं किया
मार्च 2026 के अंत में, Mercor — जो कि $10,000 मिलियन की मूल्यांकन वाली एक स्टार्टअप है, जो भाषा मॉडल के प्रशिक्षण के लिए डेटा सेट बनाने के लिए विशेषज्ञों को नियुक्त करती है — ने अपने ठेकेदारों को सूचित किया कि उसे एक सुरक्षा घटना का सामना करना पड़ा। कारण: LiteLLM में एक कमी, जो कि भाषा मॉडल की एक ओपन-सोर्स टूल है। हमलावरों, जो कि TeamPCP समूह से जुड़े होने का दावा करते हैं, ने लगभग 4 टेराबाइट जानकारी निकालने का आरोप लगाया: 211 गीगाबाइट डेटाबेस फ़ाइलें, 939 गीगाबाइट कोड और 3 टेराबाइट डेटा बकेट में शामिल वीडियो साक्षात्कार की रिकॉर्डिंग और पहचान सत्यापन दस्तावेज। 40,000 से अधिक ठेकेदारों और ग्राहकों के पूर्ण नाम और सामाजिक सुरक्षा नंबर उजागर हुए हैं।
Meta की प्रतिक्रिया तत्काल और स्पष्ट थी: Mercor के साथ सभी सहयोग का अनिश्चितकालीन निलंबन। OpenAI ने इस बीच एक आंतरिक जाँच शुरू की, बिना सक्रिय परियोजनाओं को रोके, यह कहते हुए कि यह कमी उपयोगकर्ता डेटा को प्रभावित नहीं करती है। Anthropic अपने संबंधों पर दोबारा विचार कर रहा है। एक सामूहिक मुकदमा पहले से ही चल रहा है।
यह घटना केवल एक तकनीकी विफलता को उजागर नहीं करती। यह एक निर्भरता की संरचना को दर्शाती है जिसे एआई क्षेत्र ने तेजी से बनाया, जो जोखिम ऑडिट को बलिदान देते हुए।
एआई का व्यापार मॉडल छिपे हुए मूल्य के साथ आता है
Mercor कोई बाहरी कंपनी नहीं है। यह एआई की बड़ी कंपनियों के मॉडल को बनाने के मूल में काम करता है: यह विशेष डोमेन के हजारों विशेषज्ञों को भर्ती करता है ताकि वे अपने अनुसार डेटा उत्पन्न और सत्यापित कर सकें। Meta, OpenAI और Anthropic उस प्रवाह पर निर्भर करते हैं ताकि वे अपनी मॉडल को सही कर सकें, जो बाद में उन उत्पादों को पोषित करते हैं जो अरबों में आय उत्पन्न करते हैं।
यह निर्भरता एक विशेष वित्तीय तंत्र के तहत कार्य करती है। उच्च गुणवत्ता वाले प्रशिक्षण डेटा — जो विशेषज्ञों द्वारा मानवता से सत्यापित किए जाते हैं — उन कुछ भिन्नता में से एक हैं जिन्हें पूरी तरह से स्वचालित नहीं किया जा सकता। ये प्रतिस्पर्धात्मक लाभ के संदर्भ में रणनीतिक संपत्तियाँ हैं। और Meta, जिसका विज्ञापन व्यापार मॉडल 90% से अधिक अपने एआई सिस्टम के प्रदर्शन से आय पर निर्भर करता है, उन्हें इसी तरह से मानता है। लीक हुआ स्रोत कोड केवल कोड नहीं है: इसमें प्रशिक्षण की विधियाँ शामिल हैं जिन्हें प्रतिस्पर्धी अपने विकास में सालों को कम करने के लिए इस्तेमाल कर सकते हैं।
यह Mercor की घटना द्वारा स्पष्ट की गई विरोधाभास है: जितना अधिक एआई की मूल्य श्रृंखला को डिजिटल किया जाता है और उप-ठेके पर दिया जाता है, उतना ही अधिक जोखिम उन खिलाड़ियों की ओर वितरित होता है जिनके पास वही नियामक एक्सपोज़र या सुरक्षा प्रोत्साहन नहीं होते हैं जो बड़े प्रयोगशालाओं के पास होते हैं। Mercor, जिसकी स्थापना 2023 में हुई थी, दो साल में 10,000 मिलियन की मूल्यांकन तक पहुँच गई। इस विकास की गति दुर्लभ ही सुरक्षा नियंत्रणों में समकक्ष परिपक्वता के साथ चलती है।
हमले का वेक्टर, इसके अलावा, Mercor का स्वामित्व का प्रणाली नहीं था। यह LiteLLM, एक ओपन-सोर्स निर्भरता था। यहाँ संरचनात्मक ट्रैप है: एआई में सॉफ़्टवेयर आपूर्ति श्रृंखला स्थिरता की ढेर पर बनाई गई है, जिसे कोई भी व्यक्ति पूरी तरह से नियंत्रित नहीं करता। जब उनमें से एक स्तर विफल होता है, तो प्रभाव समानांतर में हजारों संगठनों तक फैलता है।
क्यों Meta कार्य करता है और OpenAI इंतजार करता है
Meta और OpenAI के बीच प्रतिक्रिया में अंतर केवल स्वभाव का मामला नहीं है। यह समान जोखिम के सामने अलग रणनीतिक दृष्टिकोण को दर्शाता है।
Meta के पास सार्वजनिक रूप से ओपन-सोर्स के साथ प्रतिबद्धता है — उसके Llama मॉडल का परिवार टेक्निकल पोजिशनिंग का मुख्य दांव है — और इसलिए इसकी प्रशिक्षण डेटा की कमी के सामने प्रतिष्ठात्मक एक्सपोज़र अधिक है। यदि इसके मॉडल को ट्यून करने की विधियाँ उजागर होती हैं, तो इस तर्क को कि ओपन-सोर्स का मतलब प्रशिक्षण डेटा का खुलापन नहीं होता है, को बनाए रखना मुश्किल हो जाता है। Mercor का अनिश्चितकालीन निलंबन, इस कोण से, बाजार की ओर एक संकेत भी है और एक कंटेनमेंट उपाय भी।
OpenAI एक अलग तर्क के तहत काम करता है। उसके सिस्टम बंद हैं, और यह आरोप कि कमी उपयोगकर्ता डेटा पर प्रभाव नहीं डालती सीधा अंतिम उपभोक्ता की विश्वास को बचाने के लिए है, जो कि उनका सबसे संवेदनशील संपत्ति है। अपने सक्रिय प्रोजेक्ट्स को बनाए रखना, जबकि जांच कर रही है, यह संकेत करता है कि उनके लिए संचालन में रुकावट का खर्च जल्द से जल्द भविष्य की प्रतिष्ठा के जोखिम से अधिक है। यह लापरवाही नहीं है: यह एक्सपोज़र का अलग गणना है।
इस दो सबसे बड़े खिलाड़ियों के बीच की विभाजन Mercor के लिए परिणाम हैं जो वर्तमान रुकावट से परे हैं। यदि Meta सहयोग का पुनारंभ नहीं करता है, तो Mercor अपने सबसे बड़े ग्राहकों में से एक को खो देता है जब उसकी प्रदाता के रूप में विश्वसनीयता सबसे कम है। AI प्रयोगशालाओं के साथ अनुबंधों पर आधारित $10,000 मिलियन की मूल्यांकन उस समय बेहद कमजोर होती है जब ये प्रयोगशालाएँ समानांतर रूप से अपनी पूरी आपूर्ति श्रृंखला का मूल्यांकन कर रही होती हैं।
जो सामूहिक मुकदमा पहले से ही न्यायालयों में आगे बढ़ रहा है, वह Mercor के लिए वित्तीय एक्सपोज़र की एक परत जोड़ता है जो उसके निवेशकों को मूल्य में नहीं था। टेराबाइट स्तर की डेटा घटने, जब सामाजिक सुरक्षा नंबरों को शामिल करती है, लंबा और महंगा मुकदमे का निर्माण करती है। निवेशकों के लिए सवाल यह नहीं है कि Mercor तकनीकी घटना को जीवित रहेगा, बल्कि यह है कि क्या यह अनुबंधों के नुकसान और कानूनी खर्चों के संयोजन को बिना किसी महत्वपूर्ण पूंजी संरचना पुनःविचार के सहन कर सकता है।
अदृश्य जोखिम के राजस्व की कमी
वर्षों से, एआई का उद्योग एक अंतर्निहित प्रथा के तहत कार्य करता रहा: विकास की गति किसी भी कमी को व्यक्तिगत रूप से प्रबंधित करती है। प्रयोगशालाएँ मॉडल लॉन्च करने की जल्दी कर रही हैं, डेटा प्रदाताओं को स्केलिंग के लिए दौड़ रही हैं, और सुरक्षा ऑडिटों को "अगली राउंड के बाद" के लिए टाल दिया गया है।
यह घटना एक प्रवृत्ति को तेजी से बढ़ावा देती है जो पहले से ही फटी हुई थी: महत्वपूर्ण क्षमताओं का आंतरिककरण। Google और Meta ने वर्षों से डेटा एनोटेशन और सत्यापन के आंतरिक टीमों को विकसित किया है। Mercor की कमी उस प्रवृत्ति को किसी प्रयोगशाला के लिए आपरेशन की आवश्यकता में बदल देती है।
विशेषीकृत प्रशिक्षण डेटा की प्रदाता बाजार एक संरचनात्मक पुनर्व्यवस्था का सामना कर रही है। वे खिलाड़ी जो ऑडिटेबल सुरक्षा नियंत्रण प्रदर्शित कर सकते हैं, न केवल डिलीवरी की गति को हासिल करने के लिए, अनुबंध जीतेंगे। वे जो केवल विशेषज्ञों की मात्रा और गति पर अपने मूल्य प्रस्ताव को बनाए रखने में लगे हैं, वे पाएंगे कि वह भिन्नता तेजी से बढ़ रही है जब ग्राहक "सुरक्षा प्रमाणन" को अनिवार्य भी नहीं होने पर एक आवश्यकता के रूप में जोड़ते हैं।
विश्लेषणात्मक तंत्र की 6Ds इस क्षण को स्पष्ट रूप से दर्शाते हैं: ट्रेनिंग डेटा के क्षेत्र में एआई अब निराशा के चरण पर है —जहाँ गति दरारें छुपाती है— और आंतरिक व्यवधान की ओर बढ़ रही है, जहाँ सुरक्षा मानक नए प्रदाताओं के चयन को फ़िल्टर करते हैं। एआई की मूल्य श्रृंखला का त्वरित डिजिटलकरण पहले ही हुआ। जो नहीं हुआ वह उस श्रृंखला का वास्तविक समय में ऑडिट करने की क्षमता थी। यही असमानता है जिसे Mercor, और संभवतः समान प्रदाताओं की दर्जनों कंपनियाँ अब भुगत रही हैं।
ऑगमेंटेड इंटेलिजेंस केवल एक स्थायी लाभ के रूप में काम करती है जब उसे दिए गए डेटा का दावा करने की श्रृंखला को सत्यापित किया जा सके। एक ऐसे डेटा से प्रशिक्षित मॉडल एक संपत्ति नहीं है: यह एक स्थगित देनदारता है।












