Cleanroom és több féltől származó Adatelemzés
Az Azure bizalmas számítástechnika (ACC) olyan megoldások alapja, amelyek lehetővé teszik, hogy több fél együttműködjön az adatokon. A megoldások különböző megközelítései és a partnerek egyre bővülő ökoszisztémája segíti az Azure-ügyfeleket, kutatókat, adattudósokat és adatszolgáltatókat abban, hogy együttműködjenek az adatokon az adatvédelem megőrzése mellett. Ez az áttekintés az ACC-n futó megközelítések és meglévő megoldások némelyikét ismerteti.
Mik az adatok és a modellek védelme?
Az adattisztítási megoldások általában egy vagy több adatszolgáltató számára kínálnak módot az adatok feldolgozására való kombinálására. Általában olyan kódokat, lekérdezéseket vagy modelleket fogadnak el, amelyeket az egyik szolgáltató vagy egy másik résztvevő, például egy kutató vagy egy megoldásszolgáltató hoz létre. Az adatok sok esetben bizalmasnak tekinthetők, és nem szeretnének közvetlenül megosztani más résztvevőket – akár egy másik adatszolgáltatóval, akár egy kutatóval vagy megoldásszállítóval. Az adattisztítási helyiségekben használt adatok és modellek biztonságának és adatvédettségének biztosítása érdekében a bizalmas számítástechnika segítségével kriptográfiailag ellenőrizheti, hogy a résztvevők nem férnek-e hozzá az adatokhoz vagy modellekhez, beleértve a feldolgozás során is. Az ACC használatával a megoldások védelmet nyújtanak az adatok és a modell IP-címén a felhőszolgáltató, a megoldásszolgáltató és az adat-együttműködés résztvevői számára.
Milyen példák vannak az iparági használati esetekre?
Az ACC-vel az ügyfelek és a partnerek adatvédelmi szempontból megőrzik a több féltől származó adatelemzési megoldásokat, más néven "bizalmas tisztaszobákat" – mind az új, egyedileg bizalmas, mind az ACC-vel bizalmassá tett meglévő tisztaszoba-megoldásokat.
- A Royal Bank of Canada - virtual clean room megoldás a kereskedelmi adatokat banki adatokkal kombinálva személyre szabott ajánlatokat kínál az Azure bizalmas számítási virtuális gépeivel és az Azure SQL AE-vel biztonságos enklávékban.
- Scotiabank – Bebizonyította, hogy az AI bankközi pénzáramlásokon való felhasználásával azonosítja a pénzmosást, hogy megjelölje az emberkereskedelem példányait az Azure bizalmas számítástechnikája és egy átlátszatlan megoldáspartner használatával.
- Novartis Biome – az ACC-n futó BeeKeeperAI partnermegoldását használta annak érdekében, hogy ritka betegségek klinikai vizsgálatára jelölteket találjon.
- Vezető fizetési szolgáltatók , amely csalás és anomáliadetektálás céljából összekapcsolja az adatokat a bankok között.
- Adatelemzési szolgáltatások és tisztaszoba-megoldások az ACC használatával az adatvédelem növelése és az eu ügyfélmegfelelőségi igényeinek és adatvédelmi szabályozásának kielégítése érdekében.
Miért érdemes bizalmas számítástechnikát használni?
Az adattisztítás nem teljesen új fogalom, azonban a bizalmas számítástechnika terén való fejlődéssel több lehetőség van arra, hogy szélesebb körű adathalmazokkal, az AI-modellek IP-címének biztosításával és az adatvédelmi előírásoknak való jobb megfeleléssel kihasználhassák a felhőbeli skálázás előnyeit. A korábbi esetekben előfordulhat, hogy bizonyos adatok nem érhetők el olyan okok miatt, mint például a
- Versenyhátrányok vagy szabályozás, amelyek megakadályozzák az adatok iparági vállalatok közötti megosztását.
- Az anonimizálás csökkenti az adatokra vonatkozó megállapítások minőségét, vagy túl költséges és időigényes.
- Az adatok bizonyos helyekhez vannak kötve, és biztonsági okokból nem dolgoznak fel a felhőben.
- Költséges vagy hosszadalmas jogi eljárások fedezik a felelősséget, ha az adatok nyilvánosságra kerülnek vagy visszaélnek
Ezek a valóságok hiányos vagy hatástalan adathalmazokhoz vezethetnek, amelyek gyengébb elemzéseket eredményeznek, vagy több időt igényelnek az AI-modellek betanításához és használatához.
Milyen szempontokat kell figyelembe venni egy tisztaszoba-megoldás létrehozásakor?
Batch-elemzés és valós idejű adatfolyamok: Az adathalmazok méretét és az elemzések sebességét figyelembe kell venni egy tisztaszoba-megoldás tervezésekor vagy használatakor. Ha az adatok elérhetőek "offline" állapotban, akkor egy ellenőrzött és biztonságos számítási környezetbe tölthetők be, ahol az adatok elemzési feldolgozása nagy mennyiségű adaton, ha nem a teljes adatkészleten történik. Ez a kötegelemzés lehetővé teszi a nagy adathalmazok kiértékelését olyan modellekkel és algoritmusokkal, amelyek várhatóan nem biztosítanak azonnali eredményt. A kötegelt elemzések például jól működnek, amikor ml-következtetést végeznek több millió egészségügyi rekordon, hogy megtalálják a legjobb jelölteket egy klinikai vizsgálatra. Más megoldások valós idejű adatelemzést igényelnek, például amikor az algoritmusok és modellek célja a csalások azonosítása több entitás közötti közel valós idejű tranzakciók során.
Zéró megbízhatóságú részvétel: A bizalmas tisztaszobák egyik fő különbsége, hogy nincs olyan fél, aki megbízható lenne – minden adatszolgáltatótól, kód- és modellfejlesztőtől, megoldásszolgáltatótól és infrastruktúra-üzemeltető rendszergazdától. Olyan megoldások is rendelkezésre állnak, amelyekben az adatok és a modell IP-címe egyaránt védhető az összes féltől. A megoldás előkészítésekor vagy létrehozásakor a résztvevőknek figyelembe kell venniük, hogy mit kívánnak védeni, és hogy kitől védjék az egyes kódokat, modelleket és adatokat.
Összevont tanulás: Az összevont tanulás magában foglalja egy megoldás létrehozását vagy használatát, míg a modellek feldolgozása az adattulajdonos bérlőjében történik, az elemzések pedig egy központi bérlőben vannak összesítve. Bizonyos esetekben a modellek akár az Azure-on kívüli adatokon is futtathatók, és a modellek összesítése továbbra is az Azure-ban történik. Az összevont tanulás sokszor ismétlődik az adatokon, mivel a modell paraméterei javulnak az elemzések összesítése után. A modell iterációs költségeit és minőségét figyelembe kell venni a megoldásban és a várt eredményekben.
Adattárolás és -források: Az ügyfelek több felhőben és helyszínen tárolt adatokkal rendelkeznek. Az együttműködés különböző forrásokból származó adatokat és modelleket tartalmazhat. A tisztaszoba-megoldások megkönnyítik az Azure-ba érkező adatokat és modelleket ezekről a más helyekről. Ha az adatok nem helyezhetők át az Azure-ba egy helyszíni adattárból, bizonyos tisztaszoba-megoldások olyan helyen futhatnak, ahol az adatok találhatók. A felügyeletet és a szabályzatokat egy közös megoldásszolgáltató működtetheti, ahol elérhető.
Kódintegritás és bizalmas naplók: Az Azure bizalmas számítástechnikán futó elosztott főkönyv-technológiával (DLT) olyan megoldások hozhatók létre, amelyek a szervezetek hálózatán futnak. A kódlogika és az elemzési szabályok csak akkor vehetők fel, ha a résztvevők között egyetértés van. A kód összes frissítése naplózáshoz rögzítve lesz az Azure bizalmas számítástechnika által engedélyezett illetéktelen hozzáférés-ellenőrző naplózással.
Milyen lehetőségek állnak rendelkezésre az első lépésekhez?
ACC-platformajánlatok, amelyek segítenek a bizalmas tisztaszobák engedélyezésében
Gördítsd fel a tarsolyodat, és hozzon létre egy adattiszta helyiségmegoldást közvetlenül ezekre a bizalmas számítástechnikai szolgáltatásajánlatokra.
Az Azure Container Instances (ACI) és az alkalmazás-enklávékkal rendelkező Intel SGX virtuális gépek bizalmas tárolói tárolómegoldást biztosítanak a bizalmas tisztaszoba-megoldások létrehozásához.
A bizalmas virtuális gépek (VM-ek) virtuálisgép-platformot biztosítanak a bizalmas tisztatéri megoldásokhoz.
A biztonságos enklávékban található Azure SQL AE platformszolgáltatást biztosít az adatok és lekérdezések titkosításához az SQL-ben, amely több féltől származó adatelemzésben és bizalmas tisztaszobákban használható.
A Confidential Consortium Framework egy nyílt forráskódú keretrendszer, amely magas rendelkezésre állású, központosított számítást használó állapotalapú szolgáltatásokat hoz létre a könnyű használat és a teljesítmény érdekében, ugyanakkor decentralizált megbízhatóságot biztosít. Lehetővé teszi több fél számára, hogy bizalmas adatokon keresztül naplózható számításokat hajtsanak végre anélkül, hogy megbíznak egymásban vagy egy kiemelt operátorban.
ACC-partnermegoldások, amelyek lehetővé teszik a bizalmas tisztaszobák használatát
Használjon olyan partnert, aki több féltől származó adatelemzési megoldást épített az Azure bizalmas számítási platformjára.
- Az Anjuna egy bizalmas számítástechnikai platformot biztosít, amely lehetővé teszi a különböző használati eseteket, köztük a biztonságos tiszta helyiségeket, hogy a szervezetek közös elemzés céljából megoszthassák az adatokat, például a hitelkockázati pontszámok kiszámításához vagy gépi tanulási modellek fejlesztéséhez, bizalmas információk felfedése nélkül.
- A BeeKeeperAI biztonságos együttműködési platformon keresztül teszi lehetővé az egészségügyi AI használatát az algoritmustulajdonosok és az adatgondnokok számára. A BeeKeeperAI™ bizalmas számítástechnikai környezetben a védett adatok több intézményes forrásainak adatmegőrzési analitikáit használja. A megoldás támogatja a végpontok közötti titkosítást, a biztonságos számítási enklávékat és az Intel legújabb SGX-kompatibilis processzorait az adatok és az algoritmus IP-címének védelme érdekében.
- A Decentriq bizalmas számítástechnikára épülő SaaS-adatletisztaságokat biztosít, amelyek lehetővé teszik az adatok megosztása nélküli biztonságos adatmegosztást. Az adatelemzési tisztaszobák rugalmas, több féltől származó elemzést tesznek lehetővé, a média- és reklámkód nélküli tisztaszobák pedig lehetővé teszik a célközönség megfelelő aktiválását és elemzését a belső felhasználói adatok alapján. A bizalmas tisztaszobákról a Microsoft blogjának ebben a cikkében olvashat részletesebben.
- A Fortanix egy bizalmas számítástechnikai platformot biztosít, amely lehetővé teszi a bizalmas AI-t, beleértve a több féltől származó elemzésekért együttműködő több szervezetet is.
- A Habu egy interoperábilis adattisztítási platformot biztosít, amely lehetővé teszi, hogy a vállalatok intelligens, biztonságos, skálázható és egyszerű módon oldják fel az együttműködésen alapuló intelligenciát. A Habu decentralizált adatokat kapcsol össze a részlegek, partnerek, ügyfelek és szolgáltatók között a jobb együttműködés, a döntéshozatal és az eredmények érdekében.
- A Mithril Security olyan eszközöket biztosít, amelyekkel az SaaS-szállítók biztonságos enklávékban szolgálják ki az AI-modelleket, valamint helyszíni szintű biztonságot és ellenőrzést biztosítanak az adattulajdonosok számára. Az adattulajdonosok az SaaS AI-megoldásaikat használhatják, miközben megfelelőek maradnak, és felügyelhetik az adataikat.
- Az Opaque egy bizalmas számítástechnikai platformot biztosít az együttműködésen alapuló elemzésekhez és az AI-hoz, amely lehetővé teszi az együttműködésen alapuló skálázható elemzések elvégzését az adatok teljes körű védelme mellett, és lehetővé teszi a szervezetek számára, hogy megfeleljenek a jogi és szabályozási előírásoknak.
- Széf LiShare szabályzatalapú titkosított adattisztítási helyiségeket biztosít, ahol az adatokhoz való hozzáférés naplózható, nyomon követhető és látható, miközben az adatok védettek maradnak a több féltől származó adatmegosztás során.