クリーンルームとマルチパーティーデータ分析

Azure Confidential Computing (ACC) では、複数のパーティーがデータを共同で作業できるようにするソリューションの基盤を提供します。ソリューションに対するさまざまなアプローチとパートナーの拡大中のエコシステムが用意され、Azure の顧客、研究者、データサイエンティスト、データプロバイダーがプライバシーを維持しながらデータに対して共同作業を行うことができます。この概要では、ACC で実行され、使用できるアプローチと既存のソリューションのいくつかについて説明します。

データ保護とモデル保護とは?

通常、データクリーンルームソリューションでは、1 つ以上のデータプロバイダーがデータを組み合わせて処理する手段を提供します。一般に、プロバイダーや他の参加者 (研究者やソリューションプロバイダーなど) のいずれかが作成したコード、クエリ、またはモデルについては合意がなされています。多くの場合、データは機密を要し、別のデータプロバイダー、研究者、ソリューションベンダーなどの他の参加者と直接共有することは望ましくないと考えられます。データクリーンルーム内で使用されるデータとモデルの両方のセキュリティとプライバシーを確保するため、コンフィデンシャルコンピューティングを使用して、参加者が処理中もデータやモデルにアクセスできないことを暗号化によって確証することができます。ソリューションでは、ACC を使用することで、クラウドオペレーター、ソリューションプロバイダー、データコラボレーション参加者から、データとモデル IP を保護できます。

業界のユースケースの例は?

顧客とパートナーは ACC を使用して、きわめて機密性の高い真新しいソリューションと、ACC で機密性を高めた既存のクリーンルームソリューションの両方を備えた、プライバシーを保護するマルチパーティーデータ分析ソリューション ("機密クリーンルーム" とも呼ばれることもあります) を構築します。

Scotiabank – Azure Confidential Computing とソリューションパートナーである Opaque を使用して、銀行間の金銭フローに AI を活用することにより、マネーロンダリングを特定し、人身売買事例にフラグを設定できたことを証明しました。
Novartis Biome – ACC で実行する BeeKeeperAI のパートナーソリューションを使用して、希少疾病の臨床試験の候補者を見つけました。
大手決済プロバイダーでは、不正行為や異常の検出のために銀行間でデータを接続しています。
データ分析サービスとクリーンルームソリューションでは、ACC を使用して、データ保護を強化し、ヨーロッパの顧客コンプライアンスのニーズとプライバシー規制を満たしています。

コンフィデンシャルコンピューティングを使用する理由とは?

データクリーンルームは、真新しい概念ではありませんが、コンフィデンシャルコンピューティングの進歩により、より広範なデータセットを持ち、AI モデルの IP をセキュリティで保護し、データプライバシー規制をより適切に満たすことができるというクラウドの規模を利用する機会が増えています。以前のケースでは、次のような理由で特定のデータにアクセスできないことがありました

業界の企業間でのデータの共有が競争上不利になったり、規制で禁止されているため。
匿名化により、データの分析情報の品質が低下したり、非常に多くのコストや時間がかかるため。
データが特定の場所に結び付けられ、セキュリティ上の問題のためにクラウドでの処理が抑制されているため。
データが流出または悪用された場合に責任を負う法的プロセスのコストまたは時間がかかるため

これらの現実は、不完全なデータセットや効果のないデータセットを招き、その結果、分析情報が不十分になったり、AI モデルのトレーニングと使用に必要な時間が長くなる可能性があります。

クリーンルームソリューションを構築するときの考慮事項とは?

一括分析とリアルタイムデータパイプライン: クリーンルームソリューションを設計または使用するときに、データセットのサイズと分析情報取得の速度を考慮する必要があります。データを "オフライン" で使用できる場合、データセット全体ではなく、データの大部分に対してデータ分析処理を行うために、セキュリティで保護された検証済みのコンピューティング環境にデータを読み込むことができます。この一括分析を使用すると、すぐに結果を得られるとは予想されていないモデルとアルゴリズムを使用して、大規模なデータセットを評価することができます。たとえば、一括分析は、何百万もの医療記録にわたって ML 推論を実行して、臨床試験に最適な候補者を見つける場合に効果的です。複数のエンティティ間のほぼリアルタイムのトランザクションに対する不正行為をアルゴリズムやモデルで特定しようとするときなど、他のソリューションでは、データに対するリアルタイムの分析情報が必要になります。

ゼロトラスト参加: 機密クリーンルームの主要な差別化要因は、すべてのデータプロバイダー、コードおよびモデル開発者、ソリューションプロバイダー、インフラストラクチャオペレーター管理者から信頼されたパーティーを含める必要がないことです。データとモデル IP の両方をすべてのパーティーから保護できるソリューションを提供できます。ソリューションをオンボードまたは構築する場合、参加者は、何を保護する必要があるかと、コード、モデル、データのそれぞれを誰から保護するかの両方を考慮する必要があります。

フェデレーション学習: フェデレーション学習には、ソリューションの作成または使用が含まれますが、モデルはデータ所有者のテナントで処理され、分析情報は中央テナントに集約されます。場合によっては、Azure 外部のデータでモデルを実行しながら、そのまま Azure でモデルの集約を行うこともできます。分析情報の集計後にモデルのパラメーターが向上するたびに何度も、データに対してフェデレーション学習が繰り返されます。モデルの繰り返しのコストと品質を、ソリューションと予想される結果に組み込む必要があります。

データ所在地とソース: 顧客は、複数のクラウドとオンプレミスにデータを格納しています。コラボレーションには、さまざまなソースからのデータとモデルを含めることができます。クリーンルームソリューションでは、このような他の場所から Azure 送られたデータとモデルに対応できます。オンプレミスのデータストアから Azure にデータを移動できない場合、データが存在するサイトで一部のクリーンルームソリューションを実行できます。使用可能な場合は、管理とポリシーに共通のソリューションプロバイダーを利用できます。

コードの整合性と Confidential Ledger: Azure Confidential Computing で実行されている分散型台帳テクノロジ (DLT) を使用すると、組織間のネットワーク上で実行されるソリューションを構築できます。コードロジックと分析ルールは、さまざまな参加者にわたって合意がある場合にのみ追加できます。コードに対するすべての更新は、Azure Confidential Computing で有効になっている改ざん防止ログを使用して監査要に記録されます。

使用を開始するためのオプションはどのようなものですか?

Azure Confidential Clean Rooms (プレビュー)

Azure Confidential Clean Rooms (ACCR) は、個人を特定できる情報 (PII) や保護された正常性情報 (PHI) などのプライバシーに関する機密データを他の組織と安全に共有する必要がある組織向けに設計されています。これにより、ビジネスクリティカルな分析情報を得ることができます。これにより、ML モデルを他の組織の機密データで安全に微調整し、精度を向上させたり、パートナー組織との共同データに対して安全な分析を実行したりできます。 ACCR では、Azure Container Instances 上の機密コンテナーを使用して、他のコラボレーターや Azure オペレーターからデータが確実に保護されるようにします。医療、広告、銀行、金融サービス、小売など、複数の業界にまたがるアプリケーションがあります。

このフォームを送信することで、ACCR プレビューに登録できます。

機密クリーンルームを有効にするために役立つ ACC プラットフォームオファリング

気を引き締めて、これらのコンフィデンシャルコンピューティングサービスオファリングに直接データクリーンルールソリューションを構築します。

Azure Container Instances (ACI) 上の機密コンテナーとアプリケーションエンクレーブを備えた Intel SGX VM により、機密クリーンルームソリューションを構築するためのコンテナーソリューションがもたらされます。

機密仮想マシン (VM) では、機密クリーンルームソリューション用の VM プラットフォームが提供されます。

セキュリティで保護されたエンクレーブでの Azure SQL AE では、マルチパーティーデータ分析や機密クリーンルームで使用できる SQL でデータとクエリを暗号化するためのプラットフォームサービスを提供します。

Confidential Consortium Framework は、分散型信頼を提供しながら、使いやすさとパフォーマンスを高めるために一元化されたコンピューティングを使用する高可用性ステートフルサービスを構築するためのオープンソースフレームワークです。これにより、複数のパーティーが相互に信頼したり特権オペレーターを使用したりすることなく、機密データに対して監査可能なコンピューティングを実行できます。

機密クリーンルームに対応する ACC パートナーソリューション

Azure Confidential Computing プラットフォームに基づいてマルチパーティーデータ分析ソリューションを構築するパートナーを使用します。

Anjuna では、セキュリティで保護されたクリーンルームを含むさまざまなユースケースを可能にするコンフィデンシャルコンピューティングプラットフォームを提供しており、組織は、機密情報を流出させることなく、信用リスクスコアの計算や機械学習モデルの開発などの共同分析用にデータを共有することができます。
Beekeeper AI では、アルゴリズム所有者やデータスチュワードのためのセキュリティで保護されたコラボレーションプラットフォームを使用して医療 AI を実現します。 BeeKeeperAI™ では、コンフィデンシャルコンピューティング環境内の保護されたデータの複数機関のソースに対してプライバシー保護分析を使用します。このソリューションは、エンドツーエンド暗号化、セキュアコンピューティングエンクレーブ、Intel の最新の SGX 対応プロセッサをサポートして、データとアルゴリズムの IP を保護します。
Decentriq では、コンフィデンシャルコンピューティングに基づいて構築された SaaS データクリーンルームを提供し、データを共有せずに、セキュリティで保護されたデータコラボレーションを実現します。データサイエンスクリーンルームを使用すると、柔軟なマルチパーティー分析が実現し、メディアおよび広告用のノーコードクリーンルームを使用すると、ファーストパーティーユーザーデータに基づく、準拠した対象ユーザーのアクティブ化と分析が可能になります。機密クリーンルームの詳細については、Microsoft ブログのこの記事を参照してください。
Fortanix では、機密 AI を有効にできるコンフィデンシャルコンピューティングプラットフォーム (複数の組織によるマルチパーティー分析のための共同作業を含む) を提供します。
Habu では、企業がスマートで安全でスケーラブルでシンプルな方法で集合知をロック解除できるようにする、相互運用可能なデータクリーンルームプラットフォームを提供します。 Habu では、部署、パートナー、顧客、プロバイダー間で分散データを結び付け、コラボレーション、意思決定、結果を向上させます。
Mithril Security では、SaaS ベンダーがセキュリティで保護されたエンクレーブ内で AI モデルを提供するのに役立つツールを提供し、オンプレミスレベルのセキュリティと制御をデータ所有者に提供します。データ所有者は、コンプライアンスを保ちつつ、またデータの制御を保ちつつ、SaaS AI ソリューションを使用できます。
Opaque では、コラボレーション分析と AI のためのコンフィデンシャルコンピューティングプラットフォームを提供することにより、データをエンドツーエンドで保護し、組織が法律および規制上の要件に準拠できるようにしながら共同的でスケーラブルな分析を実行する機能を提供します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2023-11-15

クリーンルームとマルチパーティー データ分析

データ保護とモデル保護とは?

業界のユース ケースの例は?

コンフィデンシャル コンピューティングを使用する理由とは?

クリーンルーム ソリューションを構築するときの考慮事項とは?