Cleanroom en Data Analytics met meerdere partijen

Azure Confidential Computing (ACC) biedt een basis voor oplossingen waarmee meerdere partijen kunnen samenwerken aan gegevens. Er zijn verschillende benaderingen voor oplossingen en een groeiend ecosysteem van partners om Azure-klanten, onderzoekers, gegevenswetenschappers en gegevensproviders in staat te stellen samen te werken aan gegevens, terwijl de privacy behouden blijft. In dit overzicht worden enkele van de benaderingen en bestaande oplossingen beschreven die kunnen worden gebruikt, allemaal die op ACC worden uitgevoerd.

Wat zijn de gegevens- en modelbeveiligingen?

Data cleanroom-oplossingen bieden doorgaans een middel voor een of meer gegevensproviders om gegevens te combineren voor verwerking. Er zijn doorgaans code, query's of modellen overeengekomen die zijn gemaakt door een van de providers of een andere deelnemer, zoals een onderzoeker of oplossingsprovider. In veel gevallen kunnen de gegevens worden beschouwd als gevoelig en ongewenst om rechtstreeks te delen met andere deelnemers, ongeacht of een andere gegevensprovider, onderzoeker of leverancier van oplossingen. Om te zorgen voor beveiliging en privacy op zowel de gegevens als modellen die worden gebruikt in cleanrooms voor gegevens, kan vertrouwelijke computing worden gebruikt om cryptografisch te verifiëren dat deelnemers geen toegang hebben tot de gegevens of modellen, ook tijdens de verwerking. Door ACC te gebruiken, kunnen de oplossingen bescherming bieden voor de gegevens en het model-IP van de cloudoperator, oplossingsprovider en deelnemers aan gegevenssamenwerking.

Wat zijn voorbeelden van gebruiksvoorbeelden in de branche?

Met ACC bouwen klanten en partners privacybeschermende oplossingen voor gegevensanalyse tussen meerdere partijen, ook wel 'vertrouwelijke cleanrooms' genoemd – zowel nieuwe, uniek vertrouwelijke oplossingen als bestaande cleanroomoplossingen die met ACC vertrouwelijk zijn gemaakt.

Scotiabank – AI-gebruik bewezen voor het analyseren van geldstromen tussen banken om witwassen te detecteren en gevallen van mensenhandel te signaleren, met behulp van Azure Confidential Computing en de oplossingspartner Opaque.
Novartis Biome – gebruikte een partneroplossing van BeeKeeperAI die op ACC wordt uitgevoerd om kandidaten te vinden voor klinische studies voor zeldzame ziekten.
Toonaangevende betalingsproviders verbinden gegevens tussen banken voor fraude en anomaliedetectie.
Gegevensanalytische services en clean room-oplossingen met ACC om de gegevensbescherming te vergroten en te voldoen aan de behoeften van de EU-klantnaleving en privacyregelgeving.

Waarom confidential computing?

Data cleanrooms zijn geen gloednieuw concept, maar met sprongen in confidential computing zijn er meer mogelijkheden om te profiteren van cloudschaal met bredere gegevenssets, het beveiligen van IP-modellen van AI-modellen en de mogelijkheid om beter te voldoen aan regelgeving voor gegevensprivacy. In eerdere gevallen zijn bepaalde gegevens mogelijk niet toegankelijk om redenen zoals

Concurrerende nadelen of regelgeving die het delen van gegevens tussen bedrijven in de branche verhindert.
Anonimisering vermindert de kwaliteit van inzichten over gegevens of is te kostbaar en tijdrovend.
Gegevens die zijn gebonden aan bepaalde locaties en niet in de cloud worden verwerkt vanwege beveiligingsproblemen.
Kostbare of langdurige juridische processen dekken aansprakelijkheid als gegevens worden blootgesteld of misbruikt

Deze realiteiten kunnen leiden tot onvolledige of ineffectieve gegevenssets die leiden tot zwakkere inzichten, of meer tijd die nodig is voor het trainen en gebruiken van AI-modellen.

Wat zijn overwegingen bij het bouwen van een cleanroom-oplossing?

Batch-analyse versus realtime gegevenspijplijnen: De grootte van de gegevenssets en de snelheid van inzichten moet worden overwogen bij het ontwerpen of gebruiken van een cleanroom-oplossing. Wanneer gegevens 'offline' beschikbaar zijn, kunnen ze worden geladen in een geverifieerde en beveiligde rekenomgeving voor gegevensanalytische verwerking op grote delen van gegevens, als dat niet de hele gegevensset is. Met deze batchanalyse kunnen grote gegevenssets worden geëvalueerd met modellen en algoritmen die naar verwachting geen onmiddellijk resultaat opleveren. Batchanalyse werkt bijvoorbeeld goed bij het uitvoeren van ML-deductie in miljoenen gezondheidsrecords om de beste kandidaten voor een klinische studie te vinden. Voor andere oplossingen zijn realtime inzichten nodig voor gegevens, zoals wanneer algoritmen en modellen tot doel hebben fraude te identificeren bij bijna realtime transacties tussen meerdere entiteiten.

Deelname aan zero-trust: Een belangrijke onderscheidende factor in vertrouwelijke cleanrooms is het vermogen om geen enkele partij te hoeven vertrouwen: van alle gegevensaanbieders, code- en modelontwikkelaars, oplossingsaanbieders tot beheerders van infrastructuur. Er kunnen oplossingen worden geboden waarbij zowel de gegevens als het model-IP van alle partijen kunnen worden beveiligd. Bij het onboarden of bouwen van een oplossing moeten deelnemers rekening houden met zowel wat u wilt beveiligen als tegen wie elk van de code, modellen en gegevens moet worden beschermd.

Federatief leren: Federatief leren houdt in het creëren of gebruiken van een oplossing waarbij modellen in de tenant van de gegevenseigenaar worden verwerkt, en inzichten in een centrale tenant worden samengevoegd. In sommige gevallen kunnen de modellen zelfs worden uitgevoerd op gegevens buiten Azure, waarbij modelaggregatie nog steeds plaatsvindt in Azure. Vaak worden federatieve learning-iteraten op gegevens wanneer de parameters van het model worden verbeterd nadat inzichten zijn samengevoegd. De iteratiekosten en kwaliteit van het model moeten worden meegenomen in de oplossing en de verwachte resultaten.

Gegevenslocatie en bronnen: Klanten hebben gegevens opgeslagen in meerdere clouds en on-premises. Samenwerking kan bestaan uit gegevens en modellen uit verschillende bronnen. Cleanroom-oplossingen kunnen gegevens en modellen die vanaf deze andere locaties naar Azure komen, faciliteren. Wanneer gegevens niet naar Azure kunnen worden verplaatst vanuit een on-premises gegevensarchief, kunnen sommige cleanroom-oplossingen worden uitgevoerd op de site waar de gegevens zich bevinden. Beheer en beleid kunnen worden mogelijk gemaakt door een algemene oplossingsprovider, indien beschikbaar.

Code-integriteit en vertrouwelijke grootboeken: Met gedistribueerde grootboektechnologie (DLT) die wordt uitgevoerd op Azure Confidential Computing, kunnen oplossingen worden gebouwd die worden uitgevoerd op een netwerk in organisaties. De codelogica en analyseregels kunnen alleen worden toegevoegd als er consensus is tussen de verschillende deelnemers. Alle updates van de code worden vastgelegd voor controle via manipulatiebestendige logboekregistratie die is ingeschakeld met Azure Confidential Computing.

Wat zijn opties om aan de slag te gaan?

Azure Confidential Clean Rooms (preview)

Azure Confidential Clean Rooms (ACCR) is ontworpen voor organisaties die privacygevoelige gegevens, zoals persoonlijk identificeerbare informatie (PII) of beschermde gezondheidsinformatie (PHI), veilig moeten delen met andere organisaties om bedrijfskritieke inzichten af te leiden die veilig kunnen worden afgestemd op uw ML-model met gevoelige gegevens van andere organisaties voor verbeterde nauwkeurigheid of het uitvoeren van veilige analyses op gezamenlijke gegevens met uw partnerorganisaties. ACCR maakt gebruik van vertrouwelijke containers in Azure Container Instances om ervoor te zorgen dat uw gegevens beschermd blijven van andere medewerkers en van Azure-operators. Het heeft toepassingen die betrekking hebben op meerdere branches, zoals gezondheidszorg, reclame, bankzaken en financiële dienstverlening en detailhandel.

U kunt zich inschrijven voor de ACCR-preview door dit formulier in te dienen.

ACC-platformoplossingen die vertrouwelijke cleanrooms mogelijk maken

Rol uw mouwen op en bouw een datacleanroom-oplossing rechtstreeks op deze vertrouwelijke computingdiensten.

Vertrouwelijke containers op Azure Container Instances (ACI) en Intel SGX-VM's met toepassings-enclaves bieden een containeroplossing voor het bouwen van vertrouwelijke cleanroom-oplossingen.

Confidential Virtual Machines (VM's) bieden een VM-platform voor vertrouwelijke cleanroom-oplossingen.

Azure SQL AE in beveiligde enclaves biedt een platformservice voor het versleutelen van gegevens en query's in SQL die kunnen worden gebruikt in gegevensanalyses van meerdere partijen en vertrouwelijke cleanrooms.

Confidential Consortium Framework is een opensource-framework voor het bouwen van stateful services met hoge beschikbaarheid die gecentraliseerde berekeningen gebruiken voor gebruiksgemak en prestaties, terwijl gedecentraliseerde vertrouwensrelatie wordt geboden. Hiermee kunnen meerdere partijen controlebare berekeningen uitvoeren op vertrouwelijke gegevens zonder elkaar of een bevoegde operator te vertrouwen.

ACC-partneroplossingen die vertrouwelijke cleanrooms mogelijk maken

Gebruik een partner die een analyseoplossing voor gegevens van meerdere partijen heeft gebouwd op het Azure Confidential Computing-platform.

Anjuna biedt een confidential computing-platform om verschillende use cases, waaronder veilige schone ruimten, in te schakelen, zodat organisaties gegevens kunnen delen voor gezamenlijke analyse, zoals het berekenen van kredietrisicoscores of het ontwikkelen van machine learning-modellen, zonder gevoelige informatie bloot te leggen.
BeeKeeperAI maakt ai in de gezondheidszorg mogelijk via een beveiligd samenwerkingsplatform voor algoritmeeigenaren en gegevensstewards. BeeKeeperAI™ maakt gebruik van analyses met privacybehoud op multi-institutionele bronnen van beveiligde gegevens in een vertrouwelijke computingomgeving. De oplossing ondersteunt end-to-end-versleuteling, beveiligde computing-enclaves en intels nieuwste SGX-processors om de gegevens en het ALGORITME-IP te beveiligen.
Decentriq biedt SaaS-gegevens-cleanrooms die zijn gebouwd op vertrouwelijke computing die veilige samenwerking van gegevens mogelijk maken zonder gegevens te delen. Data science-cleanrooms bieden flexibele analyse door meerdere partijen en cleanrooms zonder code voor media en reclame maken compliante activering en analyse van doelgroepen mogelijk op basis van first-party gebruikersgegevens. Vertrouwelijke cleanrooms worden uitgebreid beschreven in dit artikel op de Microsoft-blog.
Fortanix biedt een confidential computing-platform waarmee vertrouwelijke AI kan worden ingeschakeld, waaronder meerdere organisaties die samenwerken voor analyses van meerdere partijen.
Habu biedt een interoperabel data clean room-platform waarmee bedrijven samenwerkingsinformatie op een slimme, veilige, schaalbare en eenvoudige manier kunnen ontgrendelen. Habu verbindt gedecentraliseerde gegevens tussen afdelingen, partners, klanten en providers voor betere samenwerking, besluitvorming en resultaten.
Mithril Security biedt hulpprogramma's om SaaS-leveranciers te helpen AI-modellen in beveiligde enclaves te bedienen en een on-premises niveau van beveiliging en controle te bieden aan eigenaren van gegevens. Gegevenseigenaren kunnen hun SaaS AI-oplossingen gebruiken terwijl ze voldoen aan het beleid en de controle over hun gegevens.
Opaque biedt een vertrouwelijk computingplatform voor gezamenlijke analyses en AI, waarmee het mogelijk is om gezamenlijke schaalbare analyses uit te voeren, terwijl gegevens end-to-end worden beschermd en organisaties in staat worden gesteld te voldoen aan wettelijke en reglementaire verplichtingen.

Feedback

Is deze pagina nuttig?

Last updated on 2025-05-03