Lamna Healthcare-forgatókönyv felhőalapú elemzésekhez az Azure-ban

Ez a referenciaarchitektúra olyan ügyfelek számára készült, akik nem csak a méretezhetőség, hanem az adataik védelme érdekében is felhőalapú elemzéseket szeretnének használni. Bemutatja, hogyan szabályozható a bizalmas adatokhoz való hozzáférés, és hogyan oszthatók meg az elemzők a megfelelő deszenzitizált adatokkal.

Ügyfélprofil

A Lamna Healthcare (Lamna) betegkezelési szolgáltatásokat nyújt az egészségügyi szolgáltatóknak. Az üzletmenet során rendkívül érzékeny betegadatokat kezelnek. A részletes adatokhoz való hozzáférést gondosan korlátozni kell. A Lamna azonban az adatok bizonyos verzióit is biztonságosan szeretné használni az üzleti gyakorlataik tájékoztatásához. Olyan mechanizmusra van szükségük, amely az adatokat olyan elemzőkkel osztja meg, amelyek nem sértik a beteg bizalmát vagy az adatvédelmi törvényeket.

Jelenlegi helyzet

Ma a Lamna a helyszínen tárolja az összes adatát. A betegadatok tárolása egy hagyományos adatbázisrendszerben történik. A vállalatnak azonban a vállalkozás növekedésével és az adatok mennyiségének növekedésével a betegalkalmazásokat a felhőbe kell migrálnia. Ennek az áttűnésnek a részeként egy felhőalapú elemzési platformba szeretnék átmásolni az adatokat az alkalmazásból, amely lehetővé teszi az elemzők számára, hogy jobban használják az adatokat anélkül, hogy extra terhelést helyeznének az alkalmazás-adatbázisba.

Lamna számára kritikus fontosságú a betegadatok biztonsága. Egészségügyi vállalatként számos különböző adatvédelmi törvény vonatkozik rájuk.

Architekturális megoldás

A Lamna felhőalapú elemzési megoldást fog implementálni egy felhőalapú elemzési platformhoz. Több célzónára is támaszkodnak a nagyobb méretezhetőség és a bizalmas adattermékek egyértelmű elkülönítése érdekében.

Adatkezelési célzóna

Minden felhőalapú elemzési implementáció egyik kritikus koncepciója, hogy egyetlen adatkezelési célzónát kell létrehozni. Ez az előfizetés olyan erőforrásokat tartalmaz, amelyek az összes kezdőzónában meg lesznek osztva. Ez magában foglalja a megosztott hálózati összetevőket, például a tűzfalat és a privát DNS-zónákat. Emellett adat- és felhőszabályozási erőforrásokat is tartalmaz, például Azure Policy és Azure Purview.

Betegadatok kezdőzónája

A Lamna szervezeti diagramján a betegfelügyeleti csoport az operatív csoport része. Az általuk használt adatok rendkívüli érzékenysége miatt azonban saját adat-kezdőzónájuk lesz a felhőalapú elemzési architektúrában.

Ez a célzóna a vállalat betegkezelési alkalmazásából és a kapcsolódó adattermékekből származó részletes betegadatok és állapotadatok másolatát tárolja. Ezeket az adattermékeket az adatalkalmazások töltik be a célzónába, amelyek rendszeresen betöltik az adatokat a felhőbe, és Azure Data Lake Storage.

Műveleti adatok kezdőzónája

A Lamna üzemeltetési csoportja felelős a vállalat fő üzletágáért, nevezetesen tanácsadási szolgáltatások nyújtásáért az egészségügyi szolgáltatók számára. Az üzemeltetési adatok kezdőzónájában ezekhez az egészségügyi szolgáltatókhoz és azokhoz a szolgáltatásokhoz kapcsolódó adatokat tárolják, amelyekkel kapcsolatban részt vesznek.

Mint minden üzleti adat, itt is van egy elem, amely érzékeny ezekre az adattermékekre, és a Lamna is meg szeretné védeni az ügyfelek listáját. Mivel azonban ezek az adatok nem tartalmaznak egészségügyi információkat az egyénekről, nem vonatkoznak rá a legszigorúbb adatvédelmi törvények.

Adatalkalmazások

Az operatív célzóna egy olyan adatalkalmazással rendelkezik, amely betölti az egészségügyi szolgáltató adatait a Lamna helyszíni üzemeltetési rendszeréből. Mint minden adatalkalmazás, ez is a felhőbe nyitja az adatokat, és nem alkalmaz átalakításokat az adattermékekre.

Adattermékek

A Lamna-szerte az elemzőknek hozzáférésre van szükségük az adatokhoz, hogy jelentéseket készíthessenek a vállalat számára. Az adatok nagy része azonban túl érzékeny a széles közönség számára. A rendkívül érzékeny betegadatokhoz való biztonságos hozzáférés érdekében az operatív csapat létrehozott egy tokenizált betegadatkészlet-terméket a célzónában. A Azure Data Factory használatával kimásolják a betegadatokat a betegek célzónájából. A csapat azonban óvatos volt a személyes adatokat tartalmazó oszlopok eltávolításával vagy tokenizálásával. Ez lehetővé teszi az elemzők számára, hogy üzleti célokra használják az adatokat anélkül, hogy felfedik a betegek személyes adatait.

Marketingadat-célzóna

A marketingcsoport az új ügyfelek beszerzésére és a Lamna piaci pozícióinak kezelésére összpontosít. Marketing célzónájuk elsősorban külső adattermékek tárolására és elemzésére szolgál az általuk kiszolgált piacokról és az egészségügyi ágazatról.

Azonban, hogy támogassa az új marketing push, a csoport szeretne végezni egy tanulmányt az egészségügyi eredmények a betegek által kiszolgált Lamna ügyfelei. Azt remélik, hogy olyan tényalapú jelentést fognak készíteni, amelyet erős statisztikai bizonyítékok támasztanak alá, amelyek azt mutatják, hogy az egészségügyi megközelítésük jobb eredményekhez vezet.

Ennek az új erőfeszítésnek a támogatásához a marketingcsoport kutatóinak biztonságosan és megfelelő módon kell hozzáférniük a rendkívül érzékeny betegadatokhoz, miközben továbbra is hozzájuthatnak a szükséges információkhoz.

Ennek az igénynek való megfelelés érdekében a marketingcsapat összesített adattermékeket hoz létre az operatív csapat által létrehozott tokenizált betegadatkészletből. Ezek az adattermékek nem tartalmaznak egyedi állapotrekordokat. Ehelyett a rekordokat különböző tengelyek között csoportosítják. Ez segít a kutatóknak a populáció egészére vonatkozó vizsgálatok elvégzésében anélkül, hogy az egyén egészségügyi információihoz való hozzáférést kockáztatják.

Architektúradiagram.

1. ábra: Architektúradiagram. Nem minden Azure-szolgáltatás szerepel a diagramon. Egyszerűbb volt kiemelni az erőforrások architektúrán belüli rendszerezésének alapfogalmait.

Logika

Minden bizalmas adatnak mindig saját adat-célzónát kell kapnia?

Nem. Csak az adott védelmet igénylő korlátozott adatokhoz, például az igény szerinti hozzáféréshez vagy az ügyfél által felügyelt kulcsokhoz van szükség saját célzónára. Más forgatókönyvek esetén az Azure egyéb adatvédelmi funkciói rendkívül biztonságos környezetet biztosítanak az adatok számára. Ez magában foglalja a sorszintű biztonságot, az oszlopszintű biztonságot és a titkosított oszlopokat.

Üzembehelyezési sablonok

Az architektúrák üzembe helyezéséhez használja az adatkezelési célzónát és az adat-kezdőzóna referencia-implementálási sablonjait az alábbi GitHub-adattárakban:

Az alábbi sablonokkal más adatalkalmazásokat és adattermékeket helyezhet üzembe a Lamna adat-kezdőzónáiban:

Name Adat-kezdőzóna Típus Sablon
Betegek Betegek Adatalkalmazás Adattermék kötegsablonja
Állapotrekordok Betegek Adatalkalmazás Adattermék kötegsablonja
Szolgáltatók Üzemeltetés Adatalkalmazás Adattermék kötegsablonja
Tokenizált betegek Üzemeltetés Adattermék Adattermék kötegsablonja
Összesített betegadatok Marketing Adattermék Adattermék kötegsablonja

Fontos

Nem kell mindent üzembe helyezni a fenti referencia-implementálási sablonokban a Lamna igényeinek megfelelően. A sablonokhoz bizonyos szintű testreszabásra lesz szükség. A nem szükséges szolgáltatásokat az üzembe helyezés előtt el kell távolítani a sablonokból.

Következő lépések