Konsortium för hälsodata i Azure

Azure Data Factory
Azure Data Lake Storage
Azure Data Share
Azure Databricks
Azure SQL Database

Den här lösningen för ett datakonsortium använder Azure-komponenter. Den uppfyller följande mål:

  • Ge flera organisationer ett sätt att dela data.
  • Centralisera arbetet med dataorkestrering.
  • Se till att datasäkerheten är säker.
  • Garantera patientens integritet.
  • Stöd för datakompatibilitet.
  • Erbjud anpassningsalternativ för att uppfylla specifika organisationers krav.

Arkitektur

Architecture diagram showing how members of a consortium share data.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. Rådata kommer från lokala källor och tredjepartskällor. Medlemmar i konsortiet läser in dessa data i någon av dessa lagringstjänster i Azure Data Share:

  2. Konsortiet ber medlemmarna att dela data. Som dataproducenter kan medlemmar antingen dela ögonblicksbilder eller använda delning på plats.

  3. Som datakonsument får konsortiet delade medlemsdata. Dessa data går in i Data Lake Storage i konsortiets dataresurs för ytterligare omvandling.

  4. Azure Data Factory och Azure Databricks rensar medlemsdata och omvandlar dem till ett gemensamt format.

  5. Konsortiet kombinerar medlemsdata och lagrar dem i en tjänst. Datans struktur och volym avgör vilken typ av lagringstjänst som passar bäst. Här är några av möjligheterna:

    • Azure Synapse Analytics
    • Azure SQL Database
    • Azure Data Lake Storage
    • Öppna Azure-datautforskaren
  6. Som dataresursproducent bjuder konsortiet in medlemmar att ta emot data. Medlemmar kan acceptera antingen ögonblicksbildsdata eller delningsdata på plats.

  7. Som datakonsumenter får medlemmarna delade data. Datan anger medlemsdatalager för forskning och analys.

I hela systemet:

Komponenter

Den här lösningen använder följande komponenter:

Sjukvårdsplattformar

  • Elektroniska patientjournaler (EHR) är digitala versioner av realtidsinformation om patienter.

  • FHIR (Fast Healthcare Interoperability Resources) är en standard för utbyte av sjukvårdsdata som Health Level Seven International (HL7) publicerar.

  • IoMT (Internet of Medical Things) är en samling medicintekniska enheter och appar som ansluter till IT-system via datornätverk online.

  • Genomics-data ger information om hur gener interagerar med varandra och miljön.

  • Bilddata innehåller bilder som radiologi, kardiologiavbildning, strålbehandling och andra enheter producerar.

  • Kundrelationshantering (CRM), fakturering och tredjepartssystem tillhandahåller data om patienter.

Azure-komponenter

  • Azure Data Share är ett sätt för flera organisationer att dela data på ett säkert sätt. Med den här tjänsten har dataleverantörerna kontroll över data som de delar. Det är enkelt att hantera och övervaka vem som delade vilka data vid vilken tidpunkt. Data Share gör det också enkelt att berika analys- och AI-scenarier genom att kombinera data från olika medlemmar.

  • Azure Synapse Analytics är en analystjänst för informationslager och stordatasystem. Med den här produkten kan du fråga data med serverlösa resurser, resurser på begäran eller med etablerade. Azure Synapse Analytics fungerar bra med en stor mängd strukturerade data.

  • Azure SQL Database är en fullständigt hanterad paaS-databasmotor (Plattform som en tjänst). Med AI-baserade, automatiserade funktioner hanterar SQL Database databashanteringsfunktioner som uppgradering, korrigering, säkerhetskopiering och övervakning. Den här tjänsten passar bra för strukturerade data.

  • Data Lake Storage är en massivt skalbar och säker datasjö för arbetsbelastningar med hög prestandaanalys. Den här tjänsten kan hantera flera petabyte med information samtidigt som hundratals gigabit dataflöde bibehålls. Data Lake Storage är ett sätt att lagra strukturerade och ostrukturerade data från flera medlemmar på en plats.

  • Azure Data Explorer är en snabb, fullständigt hanterad dataanalystjänst. Du kan använda den här tjänsten för realtidsanalys på stora mängder data. Azure Data Explorer kan hantera olika dataströmmar från program, webbplatser, IoT-enheter och andra källor. Azure Data Explorer passar bra för delning av strömmande telemetri och loggdata på plats.

  • Azure Data Factory är en hybridtjänst för dataintegrering. Du kan använda den här fullständigt hanterade, serverlösa lösningen för arbetsflöden för dataintegrering och transformering. Data Factory erbjuder ett kodfritt användargränssnitt och en lätthanterad övervakningspanel. I den här lösningen matar Data Factory-pipelines in data från olika medlemsdataresurser.

  • Azure Databricks är en plattform för dataanalys. Baserat på det senaste distribuerade Apache Spark-bearbetningssystemet stöder Azure Databricks sömlös integrering med bibliotek med öppen källkod. Den här lösningen använder Notebook-filer i Azure Databricks för att omvandla alla medlemsdata till ett gemensamt format.

  • Microsoft Entra ID är en molnbaserad tjänst för identitets- och åtkomsthantering för flera klientorganisationer.

  • Azure Key Vault lagrar och styr åtkomsten till hemligheter som API-nycklar, lösenord, certifikat och kryptografiska nycklar på ett säkert sätt. Den här molntjänsten hanterar även säkerhetscertifikat.

  • Azure Pipelines skapar och testar kodprojekt automatiskt. Den här Azure DevOps-tjänsten kombinerar kontinuerlig integrering (CI) och kontinuerlig leverans (CD). Med hjälp av dessa metoder testar och skapar Azure Pipelines ständigt och konsekvent kod och skickar den till alla mål.

  • Defender för molnet ger enhetlig säkerhetshantering och avancerat skydd mot hot i hybridmolnarbetsbelastningar.

Alternativ

Med Data Share finns det många alternativ för datalagring. Ditt val av tjänst beror på din delningsmetod och din volym och typ av data:

  • För delning av ögonblicksbilder av batchdata använder du någon av dessa tjänster:

    • Azure Synapse Analytics
    • SQL Database
    • Data Lake Storage
    • Azure Blob Storage

    Information om hur du kombinerar olika typer av data finns i Modern informationslagerarkitektur.

  • För delning på plats av strömmande telemetri och loggdata använder du Azure Data Explorer. Mer information om hur du analyserar data från olika källor finns i Interaktiv analys i Azure Data Explorer.

  • Vissa datauppsättningar är stora eller icke-relationella. Vissa innehåller inte data i standardiserade format. För dessa typer av datauppsättningar fungerar Blob Storage eller Azure Data Lake Storage bättre än Azure Synapse Analytics och SQL Database för utbyte av data med Data Share. Mer information om hur du lagrar medicinska data effektivt finns i Medicinska datalagringslösningar.

Om Data Share inte är ett alternativ bör du överväga ett virtuellt privat nätverk (VPN) i stället. Du kan använda ett plats-till-plats-VPN för att överföra data mellan medlems- och konsortiumdatalager.

Information om scenario

Traditionella kliniska prövningar kan vara komplexa, tidskrävande och kostsamma. För att lösa dessa problem samarbetar ett växande antal sjukvårdsorganisationer för att skapa datakonsortium för att utföra kliniska prövningar.

Datakonsortium gynnar hälso- och sjukvården på många sätt:

  • Gör forskningsdata tillgängliga.
  • Ange nya intäktsströmmar.
  • Leda till kostnadseffektiva regleringsbeslut genom att ge snabb åtkomst till data.
  • Håll patienterna säkrare och friskare genom att påskynda innovationen.

Potentiella användningsfall

Många typer av sjukvårdspersonal kan dra nytta av den här lösningen:

  • Organisationer som använder verkliga observationsdata som patientresultat för att fastställa behandlingar.
  • Läkare som specialiserar sig på personlig eller precisionsmedicin.
  • Telemedicinleverantörer som behöver enkel åtkomst till patientdata.
  • Forskare som arbetar med genomiska data.

Överväganden

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

Teknikerna i den här lösningen uppfyller de flesta företags krav på säkerhet, skalbarhet och tillgänglighet.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i Översikt över säkerhetspelare.

På grund av känsligheten hos medicinsk information spelar flera komponenter en roll för att skydda data:

  • Säkerhetsfunktioner i Data Share skyddar data på följande sätt:

    • Kryptera vilande data, där det underliggande datalagret stöder vilande kryptering.
    • Kryptera data under överföring med hjälp av TLS (Transport Layer Security) 1.2.
    • Kryptera metadata om en dataresurs i vila och under överföring.
    • Lagrar inte innehållet i delade kunddata.
  • Azure Synapse Analytics erbjuder en omfattande säkerhetsmodell. Du kan använda dess detaljerade kontroller för att skydda dina data på alla nivåer, från enskilda celler till hela databaser.

  • SQL Database använder en metod i flera lager för att skydda kunddata. Strategin omfattar följande områden:

    • Nätverkssäkerhet
    • Åtkomsthantering
    • Hotskydd
    • Informationsskydd
  • Data Lake Storage ger åtkomstkontroll. Modellen stöder följande typer av kontroller:

    • Rollbaserad åtkomstkontroll (RBAC) i Azure
    • Portabel operativsystemets gränssnitt (POSIX) åtkomstkontrollistor (ACL: er)
  • Azure Data Explorer skyddar data på följande sätt:

    • Använder Microsoft Entra ID–hanterade identiteter för Azure-resurser.
    • Använder RBAC för att separera uppgifter och begränsa åtkomsten.
    • Blockerar trafik som kommer från nätverkssegment utanför Azure Data Explorer.
    • Valv skyddar data och hjälper dig att uppfylla åtaganden med hjälp avAzure Disk Encryption. Den här tjänsten tillhandahåller volymkryptering för virtuella datordatadiskar och operativsystemet. Azure Disk Encryption integreras också med Key Vault, som krypterar hemligheter med Microsoft-hanterade nycklar eller kundhanterade nycklar.

Tillgänglighet

Den här lösningen använder en distribution med en region. Vissa scenarier kräver en distribution i flera regioner för hög tillgänglighet, haveriberedskap eller närhet. I dessa fall erbjuder följande tjänster länkade Azure-regioner för hög tillgänglighet:

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i Översikt över kostnadsoptimeringspelare.

Prissättningen för den här lösningen beror på flera faktorer:

  • De tjänster du väljer
  • Systemets kapacitet och dataflöde
  • De transformeringar som du använder för data
  • Din affärskontinuitetsnivå
  • Din haveriberedskapsnivå

Mer information finns i prisinformation.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudsakliga författare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg

Ta reda på hur du anpassar lösningen genom att klargöra följande punkter:

  • De datakällor som är tillgängliga
  • Platsen för varje datakälla
  • Vilka Azure-tjänstmedlemmar kan använda för att ta emot källdata
  • Vilka data medlemmar kan dela med konsortiet
  • Hur medlemmar kan dela data: I batchar som ögonblicksbilder eller som dataströmmar med delning på plats
  • Vilka Azure-tjänster som konsortiet kan använda för att ta emot delade data
  • Formatet på medlemsdata och om de behöver rensas eller transformeras
  • Vilka data som konsortiet kan dela med medlemmar

Produktdokumentation: