EXAMとは何ですか？

EXAMは20の病院協力により開発されたAIモデルで、患者データを使わずに酸素必要量を予測します。

連邦学習はどのように機能しますか？

連邦学習では、各病院が地元データでローカルにモデルを訓練し、更新情報のみを共有します。

なぜ一般化が重要なのですか？

一般化は、異なる施設でモデルが正確に機能するための能力であり、地域ごとの再訓練コストを削減します。

このAIモデルの経済的利点は何ですか？

相互にデータを共有せずに協力ができるため、維持管理コストが分散され、全体的な効率が向上します。

EXAMが医療業界に与える影響は何ですか？

EXAMは、医療AI開発における新しい協力モデルを提供し、持続可能な技術成長を促進します。

誰のデータも見ずに学習したAIの秘密

病院が単独では解決できなかった問題

パンデミックの最悪の時期、世界中の病院は同じ運営上の矛盾に直面していました。十分なデータがあっても、患者が悪化する予測モデルを訓練できなかったのです。アメリカのHIPAA、ヨーロッパのGDPR、そして多くの国における同様の規制が、医療記録の転送を法的リスクに変えてしまったからです。結果として、各機関は小規模なサンプルで独自のモデルを訓練し、そのツールは自施設内では機能するが、他の施設では崩壊するという無意味な状況が生まれました。

EXAM — 20の病院が共同で開発したモデル — は、この矛盾に対処しました。データを要求するのではなく、データから得られた教訓を求めたのです。

連邦学習を使用して、各病院は自らの胸部X線画像と臨床歴に基づきモデルをローカルで訓練し、患者の記録ではなく、モデルの数学的更新のみを共有しました。グローバルモデルは、20の異なるソースから分散学習を吸収し、データがどの機関の境界を越えることもありませんでした。その結果、精度が16%向上し、一般化が38%向上しました。これは統計的に無視できない差であり、集中型データセットで訓練されたモデルに対して明確な優位性を示します。

精度より一般化が重要な理由

私がEXAMから最も注目している指標は、16%の精度向上ではなく、38%の一般化の改善です。この部分は、多くの分析が見落としがちな戦略的な議論です。

健康分野でAIが上手く機能している病院を出ても、他の施設ではうまくいかないモデルであれば、そのビジネス価値はほぼゼロです。実質的には移転不可能な資産ということです。NYU Langoneが5,200のX線を利用して自身のモデルを開発し、COVID-19の重篤な進行予測で80%の精度に達した際、NYU Langoneにとって非常に強力なツールが構築されました。しかし、患者の人口統計、画像プロトコル、放射線機器が変わることで、その精度がどれほど残るのかは未解決の問いです。

EXAMは20の異なる病院の中で訓練されたため、すでに様々な変動を経験しています。そのため、再度一般化を行う必要はなく、訓練中にすでに取り込んでいます。これにより、38%の一般化が進むことで、地域での再訓練コストが大幅に削減されます。医療AIプロジェクトにおいては、再訓練コストが導入予算の30%から60%を占めることがあります。

連邦アーキテクチャは単にプライバシーのメカニズムだけではなく、参加者各自の変動コストを削減する仕組みです。

信頼なしの協力経済

EXAMが構築したものは、製薬業界が数十年試みて達成できなかったインセンティブ構造の一形態です。戦略資産の譲渡なく競争的に協力することです。各病院は学習を授けましたが、データは保持しました。データは、将来のモデルにおける立場を支える所有権のある原材料です。

このアーキテクチャは、同様のイニシアティブを麻痺させていたガバナンスの問題を解決します。大学病院のデータは、互いに競争する機関と共有されません。これは悪意のある組織だからではなく、患者データが同時に規制資産、研究資産、法的負債であるからです。この資産を譲渡することを求める協力モデルは、どんな善意の契約も超える制度的障壁に直面します。

連邦学習はその障壁を排除します。そして、除去することで、別のサイロに残るデータを基にしたグローバル・スケールのモデルを構築する可能性を開きます。マサチューセッツ総合病院は、スタンフォードのCheXpertデータセットから224,000以上のX線を用いて肺の重症度評価システムを開発しました。EXAMのコンテキストでは、これはネットワーク内のノードに過ぎません。

スケールの違いは単に技術的なものではありません。各モデルが信頼性を持って答えられる質問の種類の違いです。単一のソースから数万のX線で訓練されたモデルは、そのソースに関する質問にしか効果的に答えられないのに対し、20の異なる病院システムの異質性で訓練されたモデルは、人間の状態に関する一般的な質問に答えることができます。

9つの研究に関するメタアナリシスが、COVID-19の胸部X線に適用されたAIについて、曲線下面積0.98を報告しました。診断においては非常に素晴らしい数字ですが、調査された研究のうち、外部検証を使用したのは22%だけです。残りの78%は、発生したコンテキスト外でのテストを受けていないツールを構築しました。

医療業界が模倣すべきモデル

EXAMが直接中断する健康デジタル化の失敗パターンがあります。一般的な慣習によって、各大病院が独自のAIツールを開発し、通常は回収不能の研究資金で行いますが、収益化のアーキテクチャも不十分で、公開後の維持管理能力も乏しいためです。結果として、学問的には堅固でも運用上は失敗するモデルの墓場が生まれます。

連邦アーキテクチャは異なる論理を開きます。モデルの更新を共有する病院のコンソーシアムは、共通の資産を維持することができ、その維持コストを全参加者で分担することができます。これにより、追加ノードごとに利益が拡大します。これは、孤立した所有開発とは異なるコストの特性を持つモデルです。

医療業界のエグゼクティブが臨床AIへの投資を評価する際のオペレーショナルな質問は、これらのツールを導入するかどうかではありません。自らの機関が、そのツールを壁の中に閉じ込めておくのか、それともネットワークに参加するたびに精度が向上するように設計しているのか、ということです。患者のプライバシーを損なうことなく時間と共に改善されるモデルは、単なる技術的利点ではなく、長期的に持続可能な医療AIの唯一のアーキテクチャです。

今日、健康分野でテクノロジーのアーキテクチャを決定するリーダーは、孤立しましたが資産が減価するものを構築するか、協力によって資産が増価するものを構築するかを選択しています。EXAMの証拠は、二つ目の選択肢がより良い結果をもたらし、維持コストも低く、どのような機密資産も犠牲にせずに実現可能であることを示しています。これはすべての健康分野のCレベルが次のAI契約を締結する前に自己監査を行うべき点です：自らの技術投資モデルが患者データを閉じ込められた抽出材料として扱っているのか、それともその情報をネットワーク全体の診断能力を高める燃料に変えるアーキテクチャを持っているのか。