Cleanroom i multi-party Data Analytics

Poufne przetwarzanie na platformie Azure (ACC) stanowi podstawę dla rozwiązań, które umożliwiają wielu stronom współpracę nad danymi. Istnieją różne podejścia do rozwiązań i rosnącego ekosystemu partnerów, które ułatwiają klientom platformy Azure, badaczom, analitykom danych i dostawcom danych współpracę nad danymi przy zachowaniu prywatności. W tym omówieniu omówiono niektóre podejścia i istniejące rozwiązania, których można użyć— wszystkie uruchomione na platformie ACC.

Jakie są zabezpieczenia danych i modeli?

Rozwiązania do czyszczenia danych zwykle oferują środki dla co najmniej jednego dostawcy danych do łączenia danych do przetwarzania. Zazwyczaj kod, zapytania lub modele tworzone przez jednego z dostawców lub innego uczestnika, takie jak badacz lub dostawca rozwiązań, są zwykle uzgadniane. W wielu przypadkach dane mogą być traktowane jako poufne i niepożądane, aby bezpośrednio udostępniać innym uczestnikom — niezależnie od tego, czy inny dostawca danych, badacz czy dostawca rozwiązań. Aby zapewnić bezpieczeństwo i prywatność zarówno danych, jak i modeli używanych w czystych salach danych, poufne przetwarzanie może służyć do kryptograficznego weryfikowania, czy uczestnicy nie mają dostępu do danych lub modeli, w tym podczas przetwarzania. Korzystając z acc, rozwiązania mogą zapewnić ochronę danych i adresu IP modelu od operatora chmury, dostawcy rozwiązań i uczestników współpracy danych.

Jakie są przykłady przypadków użycia w branży?

Dzięki programowi ACC klienci i partnerzy tworzą ochronę prywatności chroniące wielostronne rozwiązania do analizy danych, czasami określane jako "poufne toalety" — zarówno nowe rozwiązania netto, które są unikatowo poufne, jak i istniejące rozwiązania do czyszczenia, które są poufne za pomocą acc.

  1. Royal Bank of Canada - Virtual clean room solution łącząc dane handlowe z danymi bankowymi w celu zapewnienia spersonalizowanych ofert przy użyciu maszyn wirtualnych do przetwarzania poufnego platformy Azure i usługi Azure SQL AE w bezpiecznych enklawach.
  2. Scotiabank — udowodniono wykorzystanie sztucznej inteligencji w przepływach pieniężnych między bankami w celu zidentyfikowania prania pieniędzy w celu flagowania wystąpień handlu ludźmi, przy użyciu poufnego przetwarzania na platformie Azure i partnera rozwiązań, nieprzezroczystego.
  3. Novartis Biome — użył rozwiązania partnerskiego firmy BeeKeeperAI działającego na acc w celu znalezienia kandydatów do badań klinicznych w przypadku rzadkich chorób.
  4. Wiodący dostawcy płatności łączący dane między bankami w celu wykrycia oszustw i anomalii.
  5. Usługi analityczne danych i rozwiązania do czyszczenia pomieszczeń korzystające z acc w celu zwiększenia ochrony danych i spełnienia wymagań w zakresie zgodności klientów z UE i regulacji prywatności.

Dlaczego poufne przetwarzanie?

Czyszczenie danych nie jest zupełnie nową koncepcją, jednak dzięki postępom w przetwarzaniu poufnym istnieje więcej możliwości wykorzystania skali chmury z szerszymi zestawami danych, zabezpieczaniem adresów IP modeli sztucznej inteligencji i możliwością lepszego spełnienia przepisów dotyczących prywatności danych. W poprzednich przypadkach niektóre dane mogą być niedostępne z powodów, takich jak

  • Wady konkurencyjne lub regulacje uniemożliwiające udostępnianie danych między firmami branżowymi.
  • Anonimizacja zmniejszająca jakość szczegółowych informacji na temat danych lub zbyt kosztowna i czasochłonna.
  • Dane powiązane z określonymi lokalizacjami i powstrzymały się od przetwarzania w chmurze ze względu na obawy dotyczące zabezpieczeń.
  • Kosztowne lub długie procesy prawne obejmują odpowiedzialność, jeśli dane są narażone lub nadużywane

Te realia mogą prowadzić do niekompletnych lub nieskutecznych zestawów danych, które powodują słabsze szczegółowe informacje lub więcej czasu potrzebnego do trenowania i używania modeli sztucznej inteligencji.

Jakie kwestie należy wziąć pod uwagę podczas kompilowania rozwiązania do czyszczenia?

Analiza wsadowa a potoki danych w czasie rzeczywistym: rozmiar zestawów danych i szybkość szczegółowych informacji należy wziąć pod uwagę podczas projektowania lub używania rozwiązania do czyszczenia pomieszczeń. Gdy dane są dostępne "offline", można je załadować do zweryfikowanego i zabezpieczonego środowiska obliczeniowego na potrzeby przetwarzania analitycznego danych na dużych częściach danych, jeśli nie do całego zestawu danych. Ta analiza wsadowa umożliwia ocenę dużych zestawów danych za pomocą modeli i algorytmów, które nie powinny zapewniać natychmiastowego wyniku. Na przykład analiza wsadowa działa dobrze podczas wnioskowania uczenia maszynowego w milionach rekordów zdrowia, aby znaleźć najlepszych kandydatów do badania klinicznego. Inne rozwiązania wymagają wglądu w dane w czasie rzeczywistym, na przykład gdy algorytmy i modele mają na celu zidentyfikowanie oszustw dotyczących transakcji niemal w czasie rzeczywistym między wieloma jednostkami.

Udział w zerowym zaufaniu: Głównym wyróżnikiem w poufnych pomieszczeniach sprzątania jest możliwość braku zaufania zainteresowanych stron — od wszystkich dostawców danych, deweloperów kodu i modelu, dostawców rozwiązań i administratorów operatorów infrastruktury. Rozwiązania mogą być udostępniane w przypadku, gdy zarówno dane, jak i adres IP modelu mogą być chronione przed wszystkimi stronami. Podczas dołączania lub tworzenia rozwiązania uczestnicy powinni wziąć pod uwagę zarówno to, co jest potrzebne do ochrony, jak i od kogo chronić każdy kod, modele i dane.

Uczenie federacyjne: uczenie federacyjne obejmuje tworzenie lub używanie rozwiązania, natomiast modele przetwarzają w dzierżawie właściciela danych, a szczegółowe informacje są agregowane w dzierżawie centralnej. W niektórych przypadkach modele mogą być nawet uruchamiane na danych spoza platformy Azure, a agregacja modelu nadal występuje na platformie Azure. Wiele razy uczenie federacyjne iteruje dane wiele razy, gdy parametry modelu są ulepszane po zagregowaniu szczegółowych informacji. Koszty iteracji i jakość modelu powinny być uwzględniane w rozwiązaniu i oczekiwane wyniki.

Miejsce przechowywania danych i źródła: klienci mają dane przechowywane w wielu chmurach i lokalnie. Współpraca może obejmować dane i modele z różnych źródeł. Rozwiązania do czyszczenia mogą ułatwić korzystanie z danych i modeli pochodzących z platformy Azure z tych innych lokalizacji. Gdy dane nie mogą przejść na platformę Azure z lokalnego magazynu danych, niektóre rozwiązania do czyszczenia mogą działać w lokacji, w której znajdują się dane. Zarządzanie i zasady mogą być obsługiwane przez wspólnego dostawcę rozwiązań, jeśli jest dostępny.

Integralność kodu i poufne rejestry: w przypadku technologii rozproszonej księgi (DLT) działającej w ramach poufnego przetwarzania na platformie Azure można tworzyć rozwiązania działające w sieci między organizacjami. Logika kodu i reguły analityczne można dodawać tylko wtedy, gdy istnieje konsensus między różnymi uczestnikami. Wszystkie aktualizacje kodu są rejestrowane w celu przeprowadzania inspekcji za pośrednictwem rejestrowania sprawdzającego naruszenia włączonego w przypadku poufnego przetwarzania na platformie Azure.

Jakie są opcje rozpoczęcia pracy?

Oferty platformy ACC, które ułatwiają włączanie poufnych pomieszczeń czystych

Zwijaj rękawy i twórz rozwiązanie do czyszczenia danych bezpośrednio na tych poufnych ofertach usług obliczeniowych.

Poufne kontenery w usłudze Azure Container Instances (ACI) i maszynach wirtualnych Intel SGX z enklawami aplikacji zapewniają rozwiązanie kontenera do tworzenia poufnych rozwiązań do czyszczenia.

Poufne maszyny wirtualne zapewniają platformę maszyn wirtualnych dla poufnych rozwiązań do czyszczenia.

Usługa Azure SQL AE w bezpiecznych enklawach udostępnia usługę platformy do szyfrowania danych i zapytań w języku SQL, które mogą być używane w wielostronnej analizie danych i poufnych pomieszczeniach.

Confidential Consortium Framework to platforma typu open source służąca do tworzenia usług stanowych o wysokiej dostępności, które używają scentralizowanych obliczeń w celu ułatwienia użycia i wydajności, zapewniając jednocześnie zdecentralizowane zaufanie. Umożliwia wielu podmiotom wykonywanie danych podlegających inspekcji za pośrednictwem poufnych danych bez zaufania do siebie lub uprzywilejowanego operatora.

Rozwiązania partnerskie ACC, które umożliwiają poufne czyszczenie pomieszczeń

Użyj partnera, który utworzył wielopartyjne rozwiązanie do analizy danych na platformie Azure poufnego przetwarzania.

  • Anjuna udostępnia poufne platformy obliczeniowe w celu umożliwienia różnych przypadków użycia, w tym bezpiecznych pomieszczeń, w celu udostępniania danych do wspólnej analizy, takich jak obliczanie wyników ryzyka kredytowego lub opracowywanie modeli uczenia maszynowego bez ujawniania poufnych informacji.
  • Usługa BeeKeeperAI umożliwia korzystanie ze sztucznej inteligencji opieki zdrowotnej za pośrednictwem bezpiecznej platformy współpracy dla właścicieli algorytmów i stewardów danych. Usługa BeeKeeperAI™ korzysta z analizy chroniącej prywatność w wieloinstytucjonalnych źródłach chronionych danych w poufnym środowisku obliczeniowym. Rozwiązanie obsługuje kompleksowe szyfrowanie, bezpieczne enklawy obliczeniowe i najnowsze procesory SGX firmy Intel w celu ochrony danych i adresu IP algorytmu.
  • Usługa Decentriq udostępnia czyszczenie danych SaaS oparte na poufnych obliczeniach, które umożliwiają bezpieczną współpracę danych bez udostępniania danych. Czyste sale do nauki o danych umożliwiają elastyczną analizę wielopartyjną, a czyszczenie bez kodu dla multimediów i reklam umożliwia zgodną aktywację i analizę odbiorców na podstawie danych użytkownika pierwszej firmy. Poufne toalety zostały szczegółowo opisane w tym artykule na blogu firmy Microsoft.
  • Fortanix udostępnia platformę przetwarzania poufnego, która umożliwia poufne korzystanie ze sztucznej inteligencji, w tym wiele organizacji współpracujących ze sobą na potrzeby analizy wielostronnej.
  • Habu zapewnia międzyoperacyjną platformę do czyszczenia danych, która umożliwia firmom odblokowanie współpracy analizy w inteligentny, bezpieczny, skalowalny i prosty sposób. Habu łączy zdecentralizowane dane między działami, partnerami, klientami i dostawcami w celu lepszej współpracy, podejmowania decyzji i wyników.
  • Rozwiązanie Mithril Security zapewnia narzędzia ułatwiające dostawcom SaaS obsługę modeli sztucznej inteligencji wewnątrz bezpiecznych enklaw oraz zapewnienie lokalnego poziomu zabezpieczeń i kontroli właścicielom danych. Właściciele danych mogą używać swoich rozwiązań SaaS AI, zachowując zgodność i kontrolę nad danymi.
  • Nieprzezroczyste zapewnia platformę do przetwarzania poufnego na potrzeby wspólnej analizy i sztucznej inteligencji, umożliwiając wykonywanie skalowalnych analiz przy jednoczesnym ochronie danych na kompleksowej platformie i umożliwieniu organizacjom przestrzegania przepisów prawnych i prawnych.
  • Sejf LiShare Zapewnia zaszyfrowane przez zasady pokoje czyszczenia danych, w których dostęp do danych można przeprowadzać inspekcję, śledzić i widoczny, jednocześnie zachowując ochronę danych podczas udostępniania danych wielostronnych.