Cleanroom és több féltől származó Adatelemzés

Az Azure bizalmas számítástechnika (ACC) olyan megoldások alapja, amelyek lehetővé teszik, hogy több fél együttműködjön az adatokon. A megoldások különböző megközelítései és a partnerek egyre bővülő ökoszisztémája segíti az Azure-ügyfeleket, kutatókat, adattudósokat és adatszolgáltatókat abban, hogy együttműködjenek az adatokon az adatvédelem megőrzése mellett. Ez az áttekintés az ACC-n futó megközelítések és meglévő megoldások némelyikét ismerteti.

Mik az adatok és a modellek védelme?

Az adattisztítási megoldások általában egy vagy több adatszolgáltató számára kínálnak módot az adatok feldolgozására való kombinálására. Általában olyan kódokat, lekérdezéseket vagy modelleket fogadnak el, amelyeket az egyik szolgáltató vagy egy másik résztvevő, például egy kutató vagy egy megoldásszolgáltató hoz létre. Az adatok sok esetben bizalmasnak tekinthetők, és nem szeretnének közvetlenül megosztani más résztvevőket – akár egy másik adatszolgáltatóval, akár egy kutatóval vagy megoldásszállítóval. Az adattisztítási helyiségekben használt adatok és modellek biztonságának és adatvédettségének biztosítása érdekében a bizalmas számítástechnika segítségével kriptográfiailag ellenőrizheti, hogy a résztvevők nem férnek-e hozzá az adatokhoz vagy modellekhez, beleértve a feldolgozás során is. Az ACC használatával a megoldások védelmet nyújtanak az adatok és a modell IP-címén a felhőszolgáltató, a megoldásszolgáltató és az adat-együttműködés résztvevői számára.

Milyen példák vannak az iparági használati esetekre?

Az ACC-vel az ügyfelek és a partnerek adatvédelmi szempontból megőrzik a több féltől származó adatelemzési megoldásokat, más néven "bizalmas tisztaszobákat" – mind az új, egyedileg bizalmas, mind az ACC-vel bizalmassá tett meglévő tisztaszoba-megoldásokat.

  • Scotiabank – Bebizonyította, hogy az AI bankközi pénzáramlásokon való felhasználásával képes azonosítani a pénzmosást, így megjelöli az emberkereskedelmi eseteket az Azure bizalmas számítástechnikája és a megoldáspartner, Opaque használatával.
  • Novartis Biome – az ACC-n futó BeeKeeperAI partnermegoldását használta annak érdekében, hogy ritka betegségek klinikai vizsgálatára jelölteket találjon.
  • Vezető fizetési szolgáltatók , amely csalás és anomáliadetektálás céljából összekapcsolja az adatokat a bankok között.
  • Adatelemzési szolgáltatások és tisztaszoba-megoldások az ACC használatával az adatvédelem növelése és az eu ügyfélmegfelelőségi igényeinek és adatvédelmi szabályozásának kielégítése érdekében.

Miért érdemes bizalmas számítástechnikát használni?

Az adattisztítás nem teljesen új fogalom, azonban a bizalmas számítástechnika terén való fejlődéssel több lehetőség van arra, hogy szélesebb körű adathalmazokkal, az AI-modellek IP-címének biztosításával és az adatvédelmi előírásoknak való jobb megfeleléssel kihasználhassák a felhőbeli skálázás előnyeit. A korábbi esetekben előfordulhat, hogy bizonyos adatok nem érhetők el olyan okok miatt, mint például a

  • Versenyhátrányok vagy szabályozás, amelyek megakadályozzák az adatok iparági vállalatok közötti megosztását.
  • Az anonimizálás csökkenti az adatokra vonatkozó megállapítások minőségét, vagy túl költséges és időigényes.
  • Az adatok bizonyos helyekhez vannak kötve, és biztonsági okokból nem dolgoznak fel a felhőben.
  • Költséges vagy hosszadalmas jogi eljárások fedezik a felelősséget, ha az adatok nyilvánosságra kerülnek vagy visszaélnek

Ezek a valóságok hiányos vagy hatástalan adathalmazokhoz vezethetnek, amelyek gyengébb elemzéseket eredményeznek, vagy több időt igényelnek az AI-modellek betanításához és használatához.

Milyen szempontokat kell figyelembe venni egy tisztaszoba-megoldás létrehozásakor?

Batch-elemzések és valós idejű adatfolyamok: A tisztaszoba-megoldás tervezésekor vagy használatakor figyelembe kell venni az adathalmazok méretét és az elemzések sebességét. Ha az adatok elérhetőek "offline" állapotban, akkor egy ellenőrzött és biztonságos számítási környezetbe tölthetők be, ahol az adatok elemzési feldolgozása nagy mennyiségű adaton, ha nem a teljes adatkészleten történik. Ez a kötegelemzés lehetővé teszi a nagy adathalmazok kiértékelését olyan modellekkel és algoritmusokkal, amelyek várhatóan nem biztosítanak azonnali eredményt. A kötegelt elemzések például jól működnek, amikor több millió egészségügyi rekordon végeznek gépi tanulási következtetést, hogy megtalálják a legjobb jelölteket egy klinikai vizsgálatra. Más megoldások valós idejű adatelemzést igényelnek, például amikor az algoritmusok és modellek célja a csalások azonosítása több entitás közötti közel valós idejű tranzakciók során.

Nulla megbízhatósági részvétel: A bizalmas tisztasági helyiségek egyik fő különbsége az, hogy nincs olyan fél, amely megbízhatóan részt vesz volna – minden adatszolgáltatótól, kód- és modellfejlesztőtől, megoldásszolgáltatóktól és infrastruktúra-üzemeltető rendszergazdától. Olyan megoldások is rendelkezésre állnak, amelyekben az adatok és a modell IP-címe egyaránt védhető az összes féltől. A megoldás előkészítésekor vagy létrehozásakor a résztvevőknek figyelembe kell venniük, hogy mit kívánnak védeni, és hogy kitől védjék az egyes kódokat, modelleket és adatokat.

Összevont tanulás: Az összevont tanulás magában foglalja egy megoldás létrehozását vagy használatát, míg a modellek feldolgozása az adattulajdonos bérlőjében történik, az elemzések pedig egy központi bérlőben vannak összesítve. Bizonyos esetekben a modellek akár az Azure-on kívüli adatokon is futtathatók, és a modellek összesítése továbbra is az Azure-ban történik. Az összevont tanulás sokszor ismétlődik az adatokon, mivel a modell paraméterei javulnak az elemzések összesítése után. A modell iterációs költségeit és minőségét figyelembe kell venni a megoldásban és a várt eredményekben.

Adattárolás és források: Az ügyfelek több felhőben és a helyszínen tárolt adatokkal rendelkeznek. Az együttműködés különböző forrásokból származó adatokat és modelleket tartalmazhat. A tisztaszoba-megoldások megkönnyítik az Azure-ba érkező adatokat és modelleket ezekről a más helyekről. Ha az adatok nem helyezhetők át az Azure-ba egy helyszíni adattárból, bizonyos tisztaszoba-megoldások olyan helyen futhatnak, ahol az adatok találhatók. A felügyeletet és a szabályzatokat egy közös megoldásszolgáltató működtetheti, ahol elérhető.

Kódintegritás és bizalmas naplók: Az azure-beli bizalmas számítástechnikán futó elosztott főkönyv-technológia (DLT) segítségével olyan megoldások hozhatók létre, amelyek a szervezetek hálózatán futnak. A kódlogika és az elemzési szabályok csak akkor vehetők fel, ha a résztvevők között egyetértés van. A kód összes frissítése rögzítésre kerül ellenőrzés céljából az Azure bizalmas számítástechnikával engedélyezett hamisításbiztos naplózás révén.

Milyen lehetőségek állnak rendelkezésre az első lépésekhez?

Azure Confidential Clean Rooms (előzetes verzió)

Az Azure Confidential Clean Rooms (ACCR) olyan szervezetek számára készült, amelyeknek bizalmas adatokat kell megosztaniuk, például a személyazonosításra alkalmas adatokat (PII) vagy a védett egészségügyi információkat (PHI) biztonságosan más szervezetekkel, hogy üzletileg kritikus megállapításokat nyerjenek, amelyek biztonságosan finomhangolhatják az ML-modellt más szervezetek bizalmas adataival a jobb pontosság érdekében, vagy biztonságos elemzéseket végezhetnek a partnerszervezetekkel közös adatokon. Az ACCR bizalmas tárolókat használ az Azure Container Instancesben annak biztosítására, hogy az adatok védve legyenek más közreműködőktől és az Azure-operátoroktól. Több iparágra kiterjedő alkalmazásokkal rendelkezik, mint például az egészségügy, a reklám, a banki és pénzügyi szolgáltatások, valamint a kiskereskedelem.

Az ACCR előzetes verziójára az űrlap elküldésével lehet jelentkezni.

ACC-platformajánlatok, amelyek segítenek a bizalmas tisztaszobák engedélyezésében

Fogj hozzá, és hozz létre egy adatvédelmi megoldást közvetlenül ezeken a bizalmas számítási szolgáltatásokon.

Az Azure Container Instances (ACI) és az alkalmazás-enklávékkal rendelkező Intel SGX virtuális gépek bizalmas tárolói tárolómegoldást biztosítanak a bizalmas tisztaszoba-megoldások létrehozásához.

A bizalmas virtuális gépek (VM-ek) virtuálisgép-platformot biztosítanak a bizalmas tisztatéri megoldásokhoz.

A biztonságos enklávékban található Azure SQL AE platformszolgáltatást biztosít az adatok és lekérdezések titkosításához az SQL-ben, amely több féltől származó adatelemzésben és bizalmas tisztaszobákban használható.

A Confidential Consortium Framework egy nyílt forráskódú keretrendszer, amely magas rendelkezésre állású, központosított számítást használó állapotalapú szolgáltatásokat hoz létre a könnyű használat és a teljesítmény érdekében, ugyanakkor decentralizált megbízhatóságot biztosít. Lehetővé teszi több fél számára, hogy bizalmas adatokon keresztül naplózható számításokat hajtsanak végre anélkül, hogy megbíznak egymásban vagy egy kiemelt operátorban.

ACC-partnermegoldások, amelyek lehetővé teszik a bizalmas tisztaszobák használatát

Használjon olyan partnert, aki több féltől származó adatelemzési megoldást épített az Azure bizalmas számítási platformjára.

  • Az Anjuna egy bizalmas számítástechnikai platformot biztosít, amely lehetővé teszi a különböző használati eseteket, köztük a biztonságos tiszta helyiségeket, hogy a szervezetek közös elemzés céljából megoszthassák az adatokat, például a hitelkockázati pontszámok kiszámításához vagy gépi tanulási modellek fejlesztéséhez, bizalmas információk felfedése nélkül.
  • A BeeKeeperAI biztonságos együttműködési platformon keresztül teszi lehetővé az egészségügyi AI használatát az algoritmustulajdonosok és az adatgondnokok számára. A BeeKeeperAI™ bizalmas számítástechnikai környezetben a védett adatok több intézményes forrásainak adatmegőrzési analitikáit használja. A megoldás támogatja a végpontok közötti titkosítást, a biztonságos számítási enklávékat és az Intel legújabb SGX-kompatibilis processzorait az adatok és az algoritmus IP-címének védelme érdekében.
  • A Decentriq bizalmas számítástechnikára épülő SaaS-adatletisztaságokat biztosít, amelyek lehetővé teszik az adatok megosztása nélküli biztonságos adatmegosztást. Az adatelemzési tisztaszobák rugalmas, több féltől származó elemzést tesznek lehetővé, a média- és reklámkód nélküli tisztaszobák pedig lehetővé teszik a célközönség megfelelő aktiválását és elemzését a belső felhasználói adatok alapján. A bizalmas tisztaszobákról a Microsoft blogjának ebben a cikkében olvashat részletesebben.
  • A Fortanix egy bizalmas számítástechnikai platformot biztosít, amely lehetővé teszi a bizalmas AI-t, beleértve a több féltől származó elemzésekért együttműködő több szervezetet is.
  • A Habu egy interoperábilis adattisztítási platformot biztosít, amely lehetővé teszi, hogy a vállalatok intelligens, biztonságos, skálázható és egyszerű módon oldják fel az együttműködésen alapuló intelligenciát. A Habu decentralizált adatokat kapcsol össze a részlegek, partnerek, ügyfelek és szolgáltatók között a jobb együttműködés, a döntéshozatal és az eredmények érdekében.
  • A Mithril Security olyan eszközöket biztosít, amelyekkel az SaaS-szállítók biztonságos enklávékban szolgálják ki az AI-modelleket, valamint helyszíni szintű biztonságot és ellenőrzést biztosítanak az adattulajdonosok számára. Az adattulajdonosok az SaaS AI-megoldásaikat használhatják, miközben megfelelőek maradnak, és felügyelhetik az adataikat.
  • Az Opaque egy bizalmas számítástechnikai platformot biztosít az együttműködésen alapuló elemzésekhez és az AI-hoz, amely lehetővé teszi az együttműködésen alapuló skálázható elemzések elvégzését az adatok teljes körű védelme mellett, és lehetővé teszi a szervezetek számára, hogy megfeleljenek a jogi és szabályozási előírásoknak.