Toto řešení pro datové konsorcium používá komponenty Azure. Splňuje tyto cíle:
- Umožňuje více organizacím sdílet data.
- Centralizované úsilí o orchestraci dat
- Zajistěte zabezpečení dat.
- Zaručte soukromí pacientů.
- Podpora interoperability dat
- Nabízí možnosti přizpůsobení pro splnění konkrétních požadavků organizací.
Architektura
Stáhněte si soubor aplikace Visio s touto architekturou.
Tok dat
Nezpracovaná data pocházejí z místních zdrojů a zdrojů třetích stran. Členové konsorcia načítají tato data do některé z těchto služeb úložiště ve službě Azure Data Share:
Konsorcium žádá členy, aby sdíleli data. Jako producenti dat můžou členové buď sdílet snímky, nebo používat místní sdílení.
Jako příjemce dat obdrží konsorcium sdílená data členů. Tato data zadávají data Lake Storage do sdílené datové složky konsorcia pro další transformaci.
Azure Data Factory a Azure Databricks vyčistí data členů a transformují je do společného formátu.
Konsorcium kombinuje data členů a ukládá je ve službě. Struktura dat a svazek určují typ služby úložiště, která je nejvhodnější. Mezi možnosti patří:
- Azure Synapse Analytics
- Azure SQL Database
- Azure Data Lake Storage
- Průzkumník dat Azure
Jako producent sdílených složek dat konsorcium vyzývá členy, aby dostávali data. Členové můžou přijímat data snímků nebo místní sdílení dat.
Jako příjemci dat členové obdrží sdílená data. Data zadávají úložiště dat členů pro výzkum a analýzu.
V celém systému:
- Microsoft Entra ID, Azure Key Vault a Microsoft Defender for Cloud spravují přístup a poskytují zabezpečení.
- Azure Pipelines, služba Azure DevOps, sestavení, testy a vydání kódu.
Komponenty
Toto řešení používá následující komponenty:
Zdravotnické platformy
Elektronické zdravotní záznamy (EHRS) jsou digitální verze informací o pacientech v reálném čase.
Fast Healthcare Interoperability Resources (FHIR) je standard pro výměnu zdravotních dat, kterou publikuje Health Level Seven International (HL7).
Internet věcí pro zdravotnictví (IoMT) je kolekce zdravotnických zařízení a aplikací, které se připojují k IT systémům prostřednictvím online počítačových sítí.
Data Genomics poskytují informace o vzájemné interakci s geny a prostředí.
Data o obrázcích zahrnují obrázky, které vytvářejí radiologie, kardiologie, radioterapie a další zařízení.
Řízení vztahů se zákazníky (CRM), fakturace a systémy třetích stran poskytují údaje o pacientech.
Komponenty Azure
Azure Data Share poskytuje způsob, jak více organizacím bezpečně sdílet data. S touto službou můžou poskytovatelé dat mít kontrolu nad daty, která sdílejí. Je jednoduché spravovat a monitorovat, kdo v jakém okamžiku sdílel jaká data. Služba Data Share také usnadňuje rozšiřování analýz a scénářů umělé inteligence kombinováním dat z různých členů.
Azure Synapse Analytics je analytická služba pro datové sklady a systémy pro velké objemy dat. S tímto produktem můžete dotazovat data pomocí bezserverových prostředků, prostředků na vyžádání nebo zřízených prostředků. Azure Synapse Analytics dobře funguje s velkým objemem strukturovaných dat.
Azure SQL Database je databázový stroj PaaS (platforma jako služba). Díky automatizovaným funkcím využívajícím AI služba SQL Database zpracovává funkce správy databází, jako je upgrade, opravy, zálohování a monitorování. Tato služba je vhodná pro strukturovaná data.
Data Lake Storage je široce škálovatelné a zabezpečené datové jezero pro vysoce výkonné analytické úlohy. Tato služba může spravovat více petabajtů informací a současně udržovat stovky gigabitů propustnosti. Data Lake Storage poskytuje způsob, jak ukládat strukturovaná a nestrukturovaná data z více členů na jednom místě.
Azure Data Explorer je rychlá plně spravovaná služba pro analýzu dat. Tuto službu můžete použít k analýze velkých objemů dat v reálném čase. Azure Data Explorer dokáže zpracovávat různorodé datové proudy z aplikací, webů, zařízení IoT a dalších zdrojů. Azure Data Explorer je vhodný pro místní sdílení streamovaných telemetrických dat a dat protokolů.
Azure Data Factory je hybridní služba pro integraci dat. Toto plně spravované bezserverové řešení můžete použít pro pracovní postupy integrace a transformace dat. Data Factory nabízí uživatelské rozhraní bez kódu a snadno použitelný monitorovací panel. V tomto řešení kanály Data Factory ingestují data z různorodých sdílených složek dat členů.
Azure Databricks je platforma pro analýzu dat. V závislosti na nejnovějším systému distribuovaného zpracování Apache Spark podporuje Azure Databricks bezproblémovou integraci s opensourcovými knihovnami. Toto řešení používá poznámkové bloky Azure Databricks k transformaci všech členských dat do společného formátu.
Microsoft Entra ID je víceklientová cloudová služba pro správu identit a přístupu.
Azure Key Vault bezpečně ukládá a řídí přístup k tajným kódům, jako jsou klíče rozhraní API, hesla, certifikáty a kryptografické klíče. Tato cloudová služba také spravuje certifikáty zabezpečení.
Azure Pipelines automaticky sestaví a testuje projekty kódu. Tato služba Azure DevOps kombinuje kontinuální integraci a průběžné doručování (CI/CD). Pomocí těchto postupů Azure Pipelines neustále a konzistentně testuje a sestavuje kód a dodává ho do libovolného cíle.
Defender for Cloud poskytuje jednotnou správu zabezpečení a pokročilou ochranu před hrozbami napříč hybridními cloudovými úlohami.
Alternativy
U služby Data Share existuje mnoho alternativ pro ukládání dat. Volba služby závisí na způsobu sdílení a objemu a typu dat:
Ke sdílení snímků dávkových dat použijte některou z těchto služeb:
- Azure Synapse Analytics
- SQL Database
- Data Lake Storage
- Azure Blob Storage
Pro místní sdílení streamovaných telemetrických dat a dat protokolů použijte Azure Data Explorer. Další informace o analýze dat z různých zdrojů najdete v tématu [Interaktivní analýzy Azure Data Exploreru][Interaktivní analýzy Azure Data Exploreru].
Některé datové sady jsou velké nebo nerelační. Některé neobsahují data ve standardizovaných formátech. Pro tyto typy datových sad, Blob Storage nebo Azure Data Lake Storage fungují lépe než Azure Synapse Analytics a SQL Database pro výměnu dat se službou Data Share. Další informace o efektivním ukládání lékařských dat najdete v tématu Řešení pro ukládání lékařskýchdatch
Pokud datová sdílená složka není volbou, zvažte místo toho virtuální privátní síť (VPN). K přenosu dat mezi členy a úložišti dat konsorcia můžete použít síť VPN typu site-to-site.
Podrobnosti scénáře
Tradiční klinické studie mohou být složité, časově náročné a nákladné. Aby se tyto problémy vyřešily, rostoucí počet zdravotnických organizací spolupracuje na vytváření datových konsorcií pro provádění klinických studií.
Konsorcia pro data využívají zdravotní péči mnoha způsoby:
- Zpřístupnit výzkumná data
- Poskytování nových datových proudů výnosů
- Vést k nákladově efektivním regulačním rozhodnutím tím, že poskytuje rychlý přístup k datům.
- Udržujte pacienty v bezpečí a zdraví tím, že urychlíte inovace.
Potenciální případy použití
Toto řešení může využívat celá řada typů odborníků na zdravotnictví:
- Organizace, které k určení léčby používají data pozorování z reálného světa, jako jsou výsledky pacientů.
- Lékaři, kteří se specializují na personalizované nebo přesné léky.
- Poskytovatelé telemedicinu, kteří potřebují snadný přístup k datům pacientů.
- Výzkumní pracovníci, kteří pracují s genomickými daty
Důležité informace
Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které je možné použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.
Technologie v tomto řešení splňují většinu požadavků společností na zabezpečení, škálovatelnost a dostupnost.
Zabezpečení
Zabezpečení poskytuje záruky proti záměrným útokům a zneužití cenných dat a systémů. Další informace najdete v tématu Přehled pilíře zabezpečení.
Kvůli citlivosti lékařských informací hraje několik komponent roli při zabezpečení dat:
Funkce zabezpečení ve službě Data Share chrání data těmito způsoby:
- Šifrování neaktivních uložených dat, kde podkladové úložiště dat podporuje šifrování neaktivních uložených dat.
- Šifrování přenášených dat pomocí protokolu TLS (Transport Layer Security) 1.2
- Šifrování metadat o neaktivních uložených uložených datových složce a přenosu
- Neukládat obsah sdílených zákaznických dat.
Azure Synapse Analytics nabízí komplexní model zabezpečení. Pomocí jemně odstupňovaných ovládacích prvků můžete data zabezpečit na všech úrovních– od jednotlivých buněk po celé databáze.
SQL Database používá k ochraně zákaznických dat vícevrstvý přístup . Strategie se zabývá těmito oblastmi:
- Zabezpečení sítě
- Správa přístupu
- Ochrana před hrozbami
- Ochrana informací
Data Lake Storage poskytuje řízení přístupu. Model podporuje tyto typy ovládacích prvků:
- Řízení přístupu na základě role Azure
- Seznamy řízení přístupu (ACL) rozhraní POSIX (Portable Operating System Interface)
Azure Data Explorer chrání data těmito způsoby:
- Používá identity spravované id Microsoft Entra pro prostředky Azure.
- Používá RBAC k oddělení povinností a omezení přístupu.
- Blokuje provoz pocházející ze síťových segmentů mimo Azure Data Explorer.
- Chrání data a pomáhá plnit závazky pomocí služby Azure Disk Encryption. Tato služba poskytuje šifrování svazků pro datové disky virtuálních počítačů a operační systém. Azure Disk Encryption se také integruje se službou Key Vault, která šifruje tajné kódy pomocí klíčů spravovaných Microsoftem nebo klíčů spravovaných zákazníkem.
Dostupnost
Toto řešení používá nasazení v jedné oblasti. Některé scénáře vyžadují nasazení ve více oblastech pro zajištění vysoké dostupnosti, zotavení po havárii nebo blízkosti. V těchto případech nabízejí následující služby spárované oblasti Azure pro zajištění vysoké dostupnosti:
Azure Synapse Analytics poskytuje vysokou dostupnost skladu pomocí snímků databáze.
Architektura služby SQL Database s vysokou dostupností poskytuje záruku 99,99% doby provozu.
Azure Data Explorer nabízí vysokou dostupnost prostřednictvím vrstvy trvalosti, výpočetní vrstvy a konfigurace sledování výsledků.
Optimalizace nákladů
Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.
Ceny pro toto řešení závisí na několika faktorech:
- Vámi zvolené služby
- Kapacita a propustnost vašeho systému
- Transformace, které používáte u dat
- Úroveň provozní kontinuity
- Úroveň zotavení po havárii
Další informace najdete v podrobnostech o cenách.
Přispěvatelé
Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.
Hlavní autoři:
- Matt Hansen | Vedoucí architekt cloudových řešení
- Aruna Ranganathan | Hlavní manažer zákaznického inženýrství
Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.
Další kroky
Zjistěte, jak přizpůsobit řešení tím, že objasníte tyto body:
- Dostupné zdroje dat
- Umístění každého zdroje dat
- Které členy služeb Azure můžou použít k příjmu zdrojových dat
- Kteří členové dat mohou sdílet s konsorciem
- Jak můžou členové sdílet data: V dávkách jako snímky nebo jako datové proudy s využitím místního sdílení
- Které služby Azure může konsorcium použít k příjmu sdílených dat
- Formát dat členů a to, zda je potřeba vyčistit nebo transformovat
- Která data může konsorcium sdílet se členy
Dokumentace k produktu:
- Co je Microsoft Cloud for Healthcare?
- Co je Azure Data Share?
- Co je Azure Synapse Analytics?
- Co je Azure SQL Database?
- Seznámení se službou Azure Data Lake Storage
- Co je Azure Data Explorer?
- Co je služba Azure Data Factory?
- Co je Databricks?
- Co je MICROSOFT Entra ID?
- O Azure Key Vault
- Co je Azure Pipelines?