वह समस्या जिसे कोई अस्पताल अकेले हल नहीं कर सका
महामारी के सबसे बुरे महीनों के दौरान, दुनिया भर के अस्पतालों ने एक ही संचालनात्मक विरोधाभास का सामना किया: उनके पास उस डेटा की भरपूर मात्रा थी जिसका उपयोग वे AI मॉडल को प्रशिक्षित करने के लिए कर सकते थे, ताकि यह भविष्यवाणी की जा सके कि कौन से रोगी खराब होंगे, लेकिन वे इसे साझा नहीं कर सकते थे। अमेरिका में HIPAA, यूरोप में GDPR, और दर्जनों देशों में समकक्ष नियम हर डेटा ट्रांसफर को एक कानूनी जोखिम में बदल रहे थे, जिसके लिए करोड़ों डॉलर की जिम्मेदारी हो सकती थी। इसका परिणाम एक बेतुकी विखंडन था: हर संस्था अपने छोटे नमूनों के साथ अपने मॉडल को प्रशिक्षित कर रही थी, जिससे ऐसे उपकरण बनते थे जो उनके चारों ओर तो अच्छी तरह काम करते थे, पर सड़क पार करते ही विफल हो जाते थे।
EXAM—जो 20 अस्पतालों के बीच में सहयोगात्मक रूप से विकसित किया गया था—इस विरोधाभास से अपने आर्किटेक्चर के द्वारा निपटा। इसने डेटा नहीं मांगा। इसने कुछ और बुद्धिमान मांगा: उन पाठों को जो उन डेटा ने उत्पन्न किए थे।
फेडरेटेड लर्निंग का उपयोग करते हुए, प्रत्येक अस्पताल ने अपने अपने छाती के एक्स-रे और चिकित्सा इतिहास पर स्थानीय रूप से मॉडल को प्रशिक्षित किया, और फिर केवल मॉडल के गणितीय अपडेट साझा किए, रोगी रिकॉर्ड नहीं। वैश्विक मॉडल ने 20 भिन्न स्रोतों से वितरित सीखने को आत्मसात किया, बिना किसी डेटा को संस्थागत सीमाओं को पार किए। परिणाम यह हुआ कि 16% अधिक सटीकता और 38% अधिक सामान्यीकरण मिला, जब केंद्रीकृत तरीकों से प्रशिक्षित मॉडल की तुलना की जाए। यह अंतर सांख्यिकीय रूप से तुच्छ नहीं है: तीव्र देखभाल में, प्रत्येक प्रतिशत सटीकता का नाम और चेहरा होता है।
सामान्यीकरण क्यों अधिक महत्वपूर्ण है
EXAM के संदर्भ में सबसे अधिक रुचिकर सूचकांक 16% की सटीकता में सुधार नहीं है। यह 38% की सामान्यीकरण में सुधार है। वहीं पर रणनीतिक तर्क है जिसे अधिकांश विश्लेषण इस उपकरण के बारे में नजरअंदाज करते हैं।
एक स्वास्थ्य AI मॉडल जो उस अस्पताल में अच्छी तरह कार्य करता है जहां इसे प्रशिक्षित किया गया था, लेकिन दूसरे केंद्र में विफल हो जाता है, बाहर के संदर्भ में लगभग शून्य वाणिज्यिक मूल्य रखता है। यह, व्यावहारिक रूप से कहें, तो एक हस्तांतरणीय संपत्ति नहीं है। जब NYU Langone ने 5,200 एक्स-रे के साथ अपना मॉडल विकसित किया और COVID-19 के गंभीर प्रगति की भविष्यवाणी में 80% तक सटीकता हासिल की, तो उन्होंने NYU Langone के लिए एक शक्तिशाली उपकरण बनाया। प्रश्न यह है कि क्या इस प्रदर्शन का कितना हिस्सा रोगी के जनसांख्यिकी, इमेजिंग प्रोटोकॉल या एक्स-रे उपकरण बदलने पर जीवित रहता है।
EXAM, जिसने 20 विभिन्न संस्थाओं की विविधताएं देखने के लिए पार्श्वीय रूप से प्रशिक्षित किया गया है, एक ऐसा मॉडल बनाता है जो पहले से ही विविधता देख चुका है। अब इसे सामान्यीकरण की आवश्यकता नहीं है क्योंकि इसने इसे प्रशिक्षण के दौरान सही चीज़ों के साथ ग्रहण कर लिया है। इसका एक सीधा प्रभाव है कि कोई भी अस्पताल जो इस तरह के उपकरणों को अपनाने पर विचार कर रहा है: 38% अधिक सामान्यीकरण वाले मॉडल से स्थानीय पुन: प्रशिक्षण की लागत को काफी कम किया जा सकता है, जो चिकित्सा AI परियोजनाओं में कार्यान्वयन के बजट का 30% से 60% तक हो सकता है।
फेडरेटेड आर्किटेक्चर केवल एक गोपनीयता तंत्र नहीं है। यह प्रत्येक भागीदार नोड के लिए परिवर्तनशील लागतों को कम करने का एक माध्यम है।
विश्वास के बिना सहयोग की अर्थव्यवस्था
EXAM ने जो बनाया है, वह प्रोत्साहनों की संरचना के मामले में कुछ ऐसा है जो दवा उद्योग दशकों से करने की कोशिश कर रहा है: प्रतिस्पर्धीय सहयोग बिना रणनीतिक संपत्तियों को छोड़ने के। प्रत्येक अस्पताल ने सीखने में योगदान दिया लेकिन उन्होंने डेटा को बनाए रखा, जो कि उनके भविष्य के मॉडलों के लिए मालिकाना कच्चे माल हैं।
यह आर्किटेक्चर एक शासन की समस्या का समाधान करता है जिसने समान पहल के दर्जनों पहलों को रोक दिया है। विश्वविद्यालय अस्पताल प्रतिस्पर्धी संस्थाओं के साथ क्लिनिकल डेटा साझा नहीं करते हैं, न कि इसलिए कि वे दुष्ट संगठन हैं, बल्कि इसलिए कि रोगी डेटा एक साथ एक नियामित संपत्ति, एक शोध संपत्ति और एक कानूनी देनदारी होता है। कोई भी सहयोगात्मक मॉडल जो उस संपत्ति को छोड़ने की मांग करता है, एक संस्थागत बाधा का सामना करता है जिसे कोई भी अच्छे इरादे का अनुबंध पार नहीं कर सकता।
फेडरेटेड लर्निंग इस बाधा को समाप्त करता है। और इसे समाप्त करके, यह एक वैश्विक पैमाने पर ऐसे मॉडल बनाने की संभावना खोलता है जिनके लिए डेटा को स्थायी साइलो में रखा गया होता। मैसाचुसेट्स जनरल अस्पताल ने 224,000 एक्स-रे के CheXpert डेटासेट पर अपना पहले से प्रशिक्षित गंभीरता स्कोरिंग सिस्टम विकसित किया और COVID मामलों पर 314 केसों को ठीक किया। EXAM के संदर्भ में, यह एक नोड बन जाता है।
पैमाने की यह भिन्नता केवल तकनीकी नहीं है। यह उन प्रकार के प्रश्नों में भिन्नता है जो प्रत्येक मॉडल विश्वसनीय रूप से उत्तर दे सकता है। एक ही स्रोत से हजारों एक्स-रे पर प्रशिक्षित मॉडल उस स्रोत के प्रश्नों का सही उत्तर देते हैं। लेकिन 20 विभिन्न अस्पतालों के सिस्टम में विविधता के साथ प्रशिक्षित मॉडल मानव स्थिति पर सामान्यतः प्रश्न उठाते हैं।
COVID-19 के लिए छाती के एक्स-रे पर लागू AI पर नौ अध्ययनों का एक मेटा-विश्लेषण ने 0.98 की एरिया अंडर द कर्व की रिपोर्ट की, एक संख्या जो किसी अन्य निदान संदर्भ में अद्भुत होगी। यह विश्लेषण यह भी बताता है कि केवल 22% अध्ययन में बाहरी मान्यता का उपयोग किया गया। बाकी 78% ने ऐसे उपकरण बनाए जो कभी भी उस संदर्भ से बाहर परीक्षण नहीं हुए जहां वे जन्मे थे।
स्वास्थ्य क्षेत्र को कॉपी करने की आवश्यकता वाला मॉडल
स्वास्थ्य का डिजिटलीकरण अक्सर विफल होने का एक संरचनात्मक पैटर्न होता है, जिसे EXAM सीधे बाधित करता है। सामान्य अवरोध यह है कि प्रत्येक बड़े अस्पताल केंद्र में अपनी अपनी AI उपकरण विकसित करता है, आमतौर पर ऐसे अनुसंधान वित्तपोषण के साथ जो अनुत्पादक होता है, बिना किसी मौद्रीकरण आर्किटेक्चर के और प्रकाशित होने के बाद कम रखरखाव क्षमता होती है। इसका परिणाम एक ऐसे मॉडल का कब्रिस्तान होता है जो अकादमिक रूप से ठोस है लेकिन संचालनात्मक रूप से मृत है।
फेडरेटेड आर्किटेक्चर एक अलग तर्क खोलता है। एक अस्पतालों का संघ जो अपडेट साझा करता है—डेटा नहीं—एक सामूहिक संपत्ति बनाए रख सकता है जिसका रखरखाव का खर्च सभी भागीदारों में वितरित हो जाता है जबकि लाभ हर नए नोड के साथ बढ़ता है। यह इस प्रकार की लागत का मॉडल है जिसमें स्वामीकरण विकसित होते समय अलग होती हैं।
स्वास्थ्य क्षेत्र के अधिकारियों के लिए जो नैदानिक AI में निवेश की समीक्षा कर रहे हैं, ऑपरेशनल प्रश्न यह नहीं है कि क्या इन उपकरणों को अपनाया जाए। यह है कि क्या उनकी संस्था इन उपकरणों को इस तरह से डिज़ाइन कर रही है कि यह उन दीवारों के भीतर बंद हो जाए या प्रत्येक नए साथी के साथ अधिक सटीक बने। एक ऐसा मॉडल जो समय के साथ विकसित होता है बिना रोगी की गोपनीयता को चुराए, यह केवल एक तकनीकी लाभ नहीं है; यह दीर्घकालिक में चिकित्सा AI के लिए एकमात्र मौद्रिक रूप से टिकाऊ आर्किटेक्चर है।
जो नेता आज स्वास्थ्य में तकनीकी आर्किटेक्चर के निर्णय लेते हैं, वे यह चुन रहे हैं कि क्या वे ऐसे संपत्तियों का निर्माण कर रहे हैं जो अलगाव में घटती हैं या सहयोग के साथ मूल्यवृद्धि। EXAM के प्रमाण के अनुसार, दूसरा विकल्प अधिक उपज देता है, रखरखाव में कम लागत आती है और इसे प्राप्त करने के लिए कोई संवेदनशील संपत्ति को बलिदान करने की आवश्यकता नहीं होती। यही वह ऑडिट है जो हर C-Level को स्वास्थ्य क्षेत्र में अगले AI अनुबंध पर हस्ताक्षर करने से पहले स्वयं से पूछना चाहिए: क्या उनका तकनीकी निवेश मॉडल रोगी के डेटा का उपयोग एक निष्क्रिय संसाधन के रूप में करता है, या उनके पास उस जानकारी को दुनिया भर की नैदानिक क्षमता बढ़ाने के लिए ईंधन में बदलने की आर्किटेक्चर है?












