Delen via


Cleanroom en Data Analytics met meerdere partijen

Azure Confidential Computing (ACC) biedt een basis voor oplossingen waarmee meerdere partijen kunnen samenwerken aan gegevens. Er zijn verschillende benaderingen voor oplossingen en een groeiend ecosysteem van partners om Azure-klanten, onderzoekers, gegevenswetenschappers en gegevensproviders in staat te stellen samen te werken aan gegevens, terwijl de privacy behouden blijft. In dit overzicht worden enkele van de benaderingen en bestaande oplossingen beschreven die kunnen worden gebruikt, allemaal die op ACC worden uitgevoerd.

Wat zijn de gegevens- en modelbeveiligingen?

Data cleanroom-oplossingen bieden doorgaans een middel voor een of meer gegevensproviders om gegevens te combineren voor verwerking. Er zijn doorgaans code, query's of modellen overeengekomen die zijn gemaakt door een van de providers of een andere deelnemer, zoals een onderzoeker of oplossingsprovider. In veel gevallen kunnen de gegevens worden beschouwd als gevoelig en ongewenst om rechtstreeks te delen met andere deelnemers, ongeacht of een andere gegevensprovider, onderzoeker of leverancier van oplossingen. Om te zorgen voor beveiliging en privacy op zowel de gegevens als modellen die worden gebruikt in cleanrooms voor gegevens, kan vertrouwelijke computing worden gebruikt om cryptografisch te verifiëren dat deelnemers geen toegang hebben tot de gegevens of modellen, ook tijdens de verwerking. Door ACC te gebruiken, kunnen de oplossingen bescherming bieden voor de gegevens en het model-IP van de cloudoperator, oplossingsprovider en deelnemers aan gegevenssamenwerking.

Wat zijn voorbeelden van gebruiksvoorbeelden in de branche?

Met ACC bouwen klanten en partners privacy met behoud van gegevensanalyseoplossingen van meerdere partijen, ook wel 'vertrouwelijke cleanrooms' genoemd: zowel nieuwe oplossingen die uniek vertrouwelijk zijn als bestaande cleanroomoplossingen die vertrouwelijk zijn gemaakt met ACC.

  1. Royal Bank of Canada - Virtual Virtual clean room solution combineert handelsgegevens met bankgegevens om persoonlijke aanbiedingen te bieden, met behulp van Vm's van Azure Confidential Computing en Azure SQL AE in beveiligde enclaves.
  2. Scotiabank – Bewezen dat AI wordt gebruikt op geldstromen op meerdere banken om witwassen te identificeren om exemplaren van mensenhandel te markeren, met behulp van Azure Confidential Computing en een oplossingspartner, ondoorzichtig.
  3. Novartis Biome – gebruikte een partneroplossing van BeeKeeperAI die op ACC wordt uitgevoerd om kandidaten te vinden voor klinische studies voor zeldzame ziekten.
  4. Toonaangevende betalingsproviders verbinden gegevens tussen banken voor fraude en anomaliedetectie.
  5. Gegevensanalytische services en clean room-oplossingen met ACC om de gegevensbescherming te vergroten en te voldoen aan de behoeften van de EU-klantnaleving en privacyregelgeving.

Waarom confidential computing?

Data cleanrooms zijn geen gloednieuw concept, maar met sprongen in confidential computing zijn er meer mogelijkheden om te profiteren van cloudschaal met bredere gegevenssets, het beveiligen van IP-modellen van AI-modellen en de mogelijkheid om beter te voldoen aan regelgeving voor gegevensprivacy. In eerdere gevallen zijn bepaalde gegevens mogelijk niet toegankelijk om redenen zoals

  • Concurrerende nadelen of regelgeving die het delen van gegevens tussen bedrijven in de branche verhindert.
  • Anonimisering vermindert de kwaliteit van inzichten over gegevens of is te kostbaar en tijdrovend.
  • Gegevens die zijn gebonden aan bepaalde locaties en zich onthouden van verwerking in de cloud vanwege beveiligingsproblemen.
  • Kostbare of langdurige juridische processen dekken aansprakelijkheid als gegevens worden blootgesteld of misbruikt

Deze realiteiten kunnen leiden tot onvolledige of ineffectieve gegevenssets die leiden tot zwakkere inzichten, of meer tijd die nodig is voor het trainen en gebruiken van AI-modellen.

Wat zijn overwegingen bij het bouwen van een cleanroom-oplossing?

Batch-analyse versus realtime gegevenspijplijnen: de grootte van de gegevenssets en de snelheid van inzichten moet worden overwogen bij het ontwerpen of gebruiken van een cleanroom-oplossing. Wanneer gegevens 'offline' beschikbaar zijn, kunnen ze worden geladen in een geverifieerde en beveiligde rekenomgeving voor gegevensanalytische verwerking op grote delen van gegevens, als dat niet de hele gegevensset is. Met deze batchanalyse kunnen grote gegevenssets worden geëvalueerd met modellen en algoritmen die naar verwachting geen onmiddellijk resultaat opleveren. Batchanalyse werkt bijvoorbeeld goed bij het uitvoeren van ML-deductie in miljoenen gezondheidsrecords om de beste kandidaten voor een klinische studie te vinden. Voor andere oplossingen zijn realtime inzichten nodig voor gegevens, zoals wanneer algoritmen en modellen tot doel hebben fraude te identificeren bij bijna realtime transacties tussen meerdere entiteiten.

Zero-trust deelname: Een belangrijke differentiator in vertrouwelijke cleanrooms is de mogelijkheid om geen enkele partij te laten vertrouwen, van alle gegevensproviders, code- en modelontwikkelaars, oplossingsproviders en beheerders van infrastructuuroperators. Er kunnen oplossingen worden geboden waarbij zowel de gegevens als het model-IP van alle partijen kunnen worden beveiligd. Bij het onboarden of bouwen van een oplossing moeten deelnemers rekening houden met zowel wat u wilt beveiligen als tegen wie elk van de code, modellen en gegevens moet worden beschermd.

Federatief leren: Federatief leren omvat het maken of gebruiken van een oplossing, terwijl modellen in de tenant van de gegevenseigenaar worden verwerkt en inzichten worden samengevoegd in een centrale tenant. In sommige gevallen kunnen de modellen zelfs worden uitgevoerd op gegevens buiten Azure, waarbij modelaggregatie nog steeds plaatsvindt in Azure. Vaak worden federatieve learning-iteraten op gegevens wanneer de parameters van het model worden verbeterd nadat inzichten zijn samengevoegd. De iteratiekosten en kwaliteit van het model moeten worden meegenomen in de oplossing en de verwachte resultaten.

Gegevenslocatie en bronnen: klanten hebben gegevens opgeslagen in meerdere clouds en on-premises. Samenwerking kan bestaan uit gegevens en modellen uit verschillende bronnen. Cleanroom-oplossingen kunnen gegevens en modellen die vanaf deze andere locaties naar Azure komen, faciliteren. Wanneer gegevens niet naar Azure kunnen worden verplaatst vanuit een on-premises gegevensarchief, kunnen sommige cleanroom-oplossingen worden uitgevoerd op de site waar de gegevens zich bevinden. Beheer en beleid kunnen worden mogelijk gemaakt door een algemene oplossingsprovider, indien beschikbaar.

Code-integriteit en vertrouwelijke grootboeken: Met gedistribueerde grootboektechnologie (DLT) die wordt uitgevoerd op Azure Confidential Computing, kunnen oplossingen worden gebouwd die worden uitgevoerd op een netwerk binnen organisaties. De codelogica en analyseregels kunnen alleen worden toegevoegd als er consensus is tussen de verschillende deelnemers. Alle updates van de code worden vastgelegd voor controle via manipulatiebestendige logboekregistratie die is ingeschakeld met Azure Confidential Computing.

Wat zijn opties om aan de slag te gaan?

ACC-platformaanbiedingen waarmee vertrouwelijke cleanrooms kunnen worden ingeschakeld

Steek uw mouwen op en bouw een data clean room-oplossing rechtstreeks op deze confidential computing-serviceaanbiedingen.

Vertrouwelijke containers op Azure Container Instances (ACI) en Intel SGX-VM's met toepassings-enclaves bieden een containeroplossing voor het bouwen van vertrouwelijke cleanroom-oplossingen.

Confidential Virtual Machines (VM's) bieden een VM-platform voor vertrouwelijke cleanroom-oplossingen.

Azure SQL AE in beveiligde enclaves biedt een platformservice voor het versleutelen van gegevens en query's in SQL die kunnen worden gebruikt in gegevensanalyses van meerdere partijen en vertrouwelijke cleanrooms.

Confidential Consortium Framework is een opensource-framework voor het bouwen van stateful services met hoge beschikbaarheid die gecentraliseerde berekeningen gebruiken voor gebruiksgemak en prestaties, terwijl gedecentraliseerde vertrouwensrelatie wordt geboden. Hiermee kunnen meerdere partijen controlebare berekeningen uitvoeren op vertrouwelijke gegevens zonder elkaar of een bevoegde operator te vertrouwen.

ACC-partneroplossingen die vertrouwelijke cleanrooms mogelijk maken

Gebruik een partner die een analyseoplossing voor gegevens van meerdere partijen heeft gebouwd op het Azure Confidential Computing-platform.

  • Anjuna biedt een confidential computing-platform om verschillende use cases, waaronder veilige schone ruimten, in te schakelen, zodat organisaties gegevens kunnen delen voor gezamenlijke analyse, zoals het berekenen van kredietrisicoscores of het ontwikkelen van machine learning-modellen, zonder gevoelige informatie bloot te leggen.
  • BeeKeeperAI maakt ai in de gezondheidszorg mogelijk via een beveiligd samenwerkingsplatform voor algoritmeeigenaren en gegevensstewards. BeeKeeperAI™ maakt gebruik van analyses met privacybehoud op multi-institutionele bronnen van beveiligde gegevens in een vertrouwelijke computingomgeving. De oplossing ondersteunt end-to-end-versleuteling, beveiligde computing-enclaves en intels nieuwste SGX-processors om de gegevens en het ALGORITME-IP te beveiligen.
  • Decentriq biedt SaaS-gegevens-cleanrooms die zijn gebouwd op vertrouwelijke computing die veilige samenwerking van gegevens mogelijk maken zonder gegevens te delen. Data science-cleanrooms bieden flexibele analyse van meerdere partijen en cleanrooms zonder code voor media en reclame maken compatibele activering en analyse van doelgroepen mogelijk op basis van gebruikersgegevens van de eerste partij. Vertrouwelijke cleanrooms worden uitgebreid beschreven in dit artikel op de Microsoft-blog.
  • Fortanix biedt een confidential computing-platform waarmee vertrouwelijke AI kan worden ingeschakeld, waaronder meerdere organisaties die samenwerken voor analyses van meerdere partijen.
  • Habu biedt een interoperabel data clean room-platform waarmee bedrijven samenwerkingsinformatie op een slimme, veilige, schaalbare en eenvoudige manier kunnen ontgrendelen. Habu verbindt gedecentraliseerde gegevens tussen afdelingen, partners, klanten en providers voor betere samenwerking, besluitvorming en resultaten.
  • Mithril Security biedt hulpprogramma's om SaaS-leveranciers te helpen AI-modellen in beveiligde enclaves te bedienen en een on-premises niveau van beveiliging en controle te bieden aan eigenaren van gegevens. Gegevenseigenaren kunnen hun SaaS AI-oplossingen gebruiken terwijl ze voldoen aan het beleid en de controle over hun gegevens.
  • Ondoorzichtig biedt een vertrouwelijk computingplatform voor gezamenlijke analyses en AI, waardoor het mogelijk is om schaalbare analyses voor samenwerking uit te voeren en tegelijkertijd end-to-end gegevens te beschermen en organisaties in staat te stellen te voldoen aan wettelijke en wettelijke mandaten.
  • SafeLiShare biedt op beleid gebaseerde versleutelde ruimten voor versleutelde gegevens, waar toegang tot gegevens controleerbaar, traceerbaar en zichtbaar is, terwijl gegevens beveiligd blijven tijdens het delen van gegevens van meerdere partijen.