Statusgegevensconsortium in Azure

Azure Data Factory
Azure Data Lake Storage
Azure Data Share
Azure Databricks
Azure SQL Database

Deze oplossing voor een gegevensconsortium maakt gebruik van Azure-onderdelen. Het voldoet aan deze doelstellingen:

  • Een manier bieden voor meerdere organisaties om gegevens te delen.
  • Centraliseer inspanningen voor gegevensindeling.
  • Zorg voor gegevensbeveiliging.
  • Zorg voor patiëntprivacy.
  • Ondersteuning voor interoperabiliteit van gegevens.
  • Bied aanpassingsopties aan om te voldoen aan de vereisten van specifieke organisaties.

Architectuur

Architecture diagram showing how members of a consortium share data.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

  1. Onbewerkte gegevens zijn afkomstig uit on-premises bronnen en bronnen van derden. Leden van het consortium laden deze gegevens in een van deze opslagservices in Azure Data Share:

  2. Het consortium vraagt leden om gegevens te delen. Als gegevensproducenten kunnen leden momentopnamen delen of in-place delen.

  3. Als gegevensconsumer ontvangt het consortium de gedeelde lidgegevens. Met deze gegevens wordt Data Lake Storage ingevoerd in de Data Share van het consortium voor verdere transformatie.

  4. Azure Data Factory en Azure Databricks schonen de lidgegevens op en transformeren deze in een gemeenschappelijke indeling.

  5. Het consortium combineert de lidgegevens en slaat deze op in een service. De structuur en het volume van de gegevens bepalen het type opslagservice dat het meest geschikt is. Tot de mogelijkheden behoren:

    • Azure Synapse Analytics
    • Azure SQL-database
    • Azure Data Lake Storage
    • Azure Data Explorer
  6. Als producent van gegevensshares nodigt het consortium leden uit om gegevens te ontvangen. Leden kunnen momentopnamegegevens of in-place gegevens voor delen accepteren.

  7. Als gegevensgebruikers ontvangen leden de gedeelde gegevens. De gegevens voeren lidgegevensarchieven in voor onderzoek en analyse.

In het hele systeem:

Onderdelen

Deze oplossing maakt gebruik van de volgende onderdelen:

Zorgplatforms

  • Elektronische gezondheidsdossiers (EHR's) zijn digitale versies van realtime informatie over patiënten.

  • Fast Healthcare Interoperability Resources (FHIR) is een standaard voor gezondheidszorggegevensuitwisseling die HL7 (Health Level Seven International) publiceert.

  • Internet of Medical Things (IoMT) is de verzameling medische apparaten en apps die via onlinecomputernetwerken verbinding maken met IT-systemen.

  • Genomics-gegevens bieden informatie over hoe genen met elkaar en de omgeving communiceren.

  • Beeldgegevens omvatten de afbeeldingen die radiologie, imaging, radiotherapie en andere apparaten produceren.

  • Crm-systemen (Customer Relationship Management), facturering en systemen van derden bieden gegevens over patiënten.

Azure-onderdelen

  • Azure Data Share biedt meerdere organisaties een manier om gegevens veilig te delen. Met deze service blijven gegevensproviders de controle houden over gegevens die ze delen. Het is eenvoudig om te beheren en te controleren wie op welk moment welke gegevens hebben gedeeld. Met Data Share kunt u ook eenvoudig analyses en AI-scenario's verrijken door gegevens van verschillende leden te combineren.

  • Azure Synapse Analytics is een analyseservice voor datawarehouses en big data-systemen. Met dit product kunt u query's uitvoeren op gegevens met serverloze, on-demand resources of met ingerichte resources. Azure Synapse Analytics werkt goed met een groot aantal gestructureerde gegevens.

  • Azure SQL Database is een volledig beheerde PaaS-database-engine (Platform as a Service). Met door AI gemaakte, geautomatiseerde functies verwerkt SQL Database databasebeheerfuncties zoals upgraden, patchen, back-ups en bewaking. Deze service is geschikt voor gestructureerde gegevens.

  • Data Lake Storage is een zeer schaalbare en veilige Data Lake voor high-performance analyseworkloads. Deze service kan meerdere petabytes aan informatie beheren terwijl honderden gigabits aan doorvoer worden ondersteund. Data Lake Storage biedt een manier om gestructureerde en ongestructureerde gegevens van meerdere leden op één locatie op te slaan.

  • Azure Data Explorer is een snelle, volledig beheerde gegevensanalyseservice. U kunt deze service gebruiken voor realtime analyse van grote hoeveelheden gegevens. Azure Data Explorer kan diverse gegevensstromen verwerken van toepassingen, websites, IoT-apparaten en andere bronnen. Azure Data Explorer is geschikt voor het in-place delen van streaming-telemetrie en logboekgegevens.

  • Azure Data Factory is een hybride service voor gegevensintegratie. U kunt deze volledig beheerde, serverloze oplossing gebruiken voor werkstromen voor gegevensintegratie en transformatie. Data Factory biedt een gebruikersinterface zonder code en een gebruiksvriendelijk bewakingspaneel. In deze oplossing nemen Data Factory-pijplijnen gegevens op uit verschillende lidgegevensshares.

  • Azure Databricks is een platform voor gegevensanalyse. Op basis van het nieuwste gedistribueerde Apache Spark-verwerkingssysteem biedt Azure Databricks ondersteuning voor naadloze integratie met opensource-bibliotheken. Deze oplossing maakt gebruik van Azure Databricks-notebooks om alle lidgegevens te transformeren in een gemeenschappelijke indeling.

  • Microsoft Entra ID is een service voor identiteits- en toegangsbeheer in meerdere tenants in de cloud.

  • Azure Key Vault slaat veilig de toegang tot geheimen op, zoals API-sleutels, wachtwoorden, certificaten en cryptografische sleutels. Deze cloudservice beheert ook beveiligingscertificaten.

  • Azure Pipelines bouwt en test automatisch codeprojecten. Deze Azure DevOps-service combineert continue integratie (CI) en continue levering (CD). Met behulp van deze procedures worden in Azure Pipelines voortdurend en consistent code getest en gebouwd en verzonden naar elk doel.

  • Defender voor Cloud biedt geïntegreerd beveiligingsbeheer en geavanceerde beveiliging tegen bedreigingen voor hybride cloudworkloads.

Alternatieven

Met Data Share zijn er veel alternatieven voor gegevensopslag. Uw keuze voor de service is afhankelijk van uw methode voor delen en uw volume en type gegevens:

  • Gebruik een van deze services voor het delen van momentopnamen van batchgegevens:

    • Azure Synapse Analytics
    • SQL Database
    • Data Lake Storage
    • Azure Blob-opslag

    Zie de moderne datawarehouse-architectuur voor meer informatie over het combineren van verschillende typen gegevens.

  • Gebruik Azure Data Explorer voor het in-place delen van streamingtelemetrie en logboekgegevens. Zie interactieve analyses van Azure Data Explorer voor meer informatie over het analyseren van gegevens uit verschillende bronnen.

  • Sommige gegevenssets zijn groot of niet-relationeel. Sommige bevatten geen gegevens in gestandaardiseerde indelingen. Voor deze typen gegevenssets werken Blob Storage of Azure Data Lake Storage beter dan Azure Synapse Analytics en SQL Database voor het uitwisselen van gegevens met Data Share. Zie Oplossingen voor medische gegevensopslag voor meer informatie over het efficiënt opslaan van medische gegevens.

Als Data Share geen optie is, kunt u in plaats daarvan een VPN (virtueel particulier netwerk) overwegen. U kunt een site-naar-site-VPN gebruiken om gegevens over te dragen tussen lid- en consortiumgegevensarchieven.

Scenariodetails

Traditionele klinische studies kunnen complex, tijdrovend en kostbaar zijn. Om deze problemen op te lossen, werken steeds meer gezondheidszorgorganisaties samen om gegevensconsorties te bouwen voor het uitvoeren van klinische studies.

Data consortiums profiteren op veel manieren van gezondheidszorg:

  • Onderzoeksgegevens beschikbaar maken.
  • Nieuwe omzetstromen bieden.
  • Leiden tot rendabele beslissingen op het gebied van regelgeving door snelle toegang tot gegevens te bieden.
  • Houd patiënten veiliger en gezonder door innovatie te versnellen.

Potentiële gebruikscases

Veel soorten zorgprofessionals kunnen profiteren van deze oplossing:

  • Organisaties die echte observatiegegevens gebruiken, zoals patiëntresultaten, om behandelingen te bepalen.
  • Artsen die gespecialiseerd zijn in gepersonaliseerde of precisiegeneeskunde.
  • Telemedicineproviders die eenvoudig toegang nodig hebben tot patiëntgegevens.
  • Onderzoekers die werken met genomische gegevens.

Overwegingen

Met deze overwegingen worden de pijlers van het Azure Well-Architected Framework geïmplementeerd. Dit is een set richtlijnen die kunnen worden gebruikt om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

De technologieën in deze oplossing voldoen aan de vereisten van de meeste bedrijven voor beveiliging, schaalbaarheid en beschikbaarheid.

Beveiliging

Beveiliging biedt garanties tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

Vanwege de gevoeligheid van medische informatie spelen verschillende onderdelen een rol bij het beveiligen van gegevens:

  • Beveiligingsfuncties in Data Share beschermen gegevens op de volgende manieren:

    • Versleuteling van data-at-rest, waarbij het onderliggende gegevensarchief ondersteuning biedt voor at-rest-versleuteling.
    • Gegevens tijdens overdracht versleutelen met TLS (Transport Layer Security) 1.2.
    • Metagegevens over een datashare at rest en in transit versleutelen.
    • De inhoud van gedeelde klantgegevens wordt niet opgeslagen.
  • Azure Synapse Analytics biedt een uitgebreid beveiligingsmodel. U kunt de verfijnde besturingselementen gebruiken om uw gegevens op elk niveau te beveiligen, van afzonderlijke cellen tot volledige databases.

  • SQL Database maakt gebruik van een gelaagde benadering om klantgegevens te beveiligen. De strategie heeft betrekking op deze gebieden:

    • Netwerkbeveiliging
    • Toegangsbeheer
    • Bescherming tegen bedreigingen
    • Gegevensbeveiliging
  • Data Lake Storage biedt toegangsbeheer. Het model ondersteunt deze typen besturingselementen:

    • Toegangsbeheer op basis van rollen in Azure (RBAC)
    • POSIX-toegangsbeheerlijsten (PORTABLE Operating System Interface)
  • Azure Data Explorer beveiligt gegevens op de volgende manieren:

    • Maakt gebruik van Door Microsoft Entra ID beheerde identiteiten voor Azure-resources.
    • Maakt gebruik van RBAC om taken te scheiden en de toegang te beperken.
    • Hiermee blokkeert u verkeer dat afkomstig is van netwerksegmenten buiten Azure Data Explorer.
    • Beschermt gegevens en helpt u om te voldoen aan toezeggingen met behulp van Azure Disk Encryption. Deze service biedt volumeversleuteling voor gegevensschijven van virtuele machines en het besturingssysteem. Azure Disk Encryption kan ook worden geïntegreerd met Key Vault, waarmee geheimen worden versleuteld met door Microsoft beheerde sleutels of door de klant beheerde sleutels.

Beschikbaarheid

Deze oplossing maakt gebruik van een implementatie met één regio. Voor sommige scenario's is een implementatie met meerdere regio's vereist voor hoge beschikbaarheid, herstel na noodgevallen of nabijheid. Voor deze gevallen bieden de volgende services gekoppelde Azure-regio's voor hoge beschikbaarheid:

Kostenoptimalisatie

Kostenoptimalisatie gaat over manieren om onnodige uitgaven te verminderen en operationele efficiëntie te verbeteren. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

Prijzen voor deze oplossing zijn afhankelijk van verschillende factoren:

  • De services die u kiest
  • De capaciteit en doorvoer van uw systeem
  • De transformaties die u gebruikt voor gegevens
  • Uw bedrijfscontinuïteitsniveau
  • Uw herstelniveau na noodgevallen

Raadpleeg Prijsgegevens voor meer informatie.

Inzenders

Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.

Belangrijkste auteurs:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen

Bepaal hoe u de oplossing kunt aanpassen door deze punten te verduidelijken:

  • De gegevensbronnen die beschikbaar zijn
  • De locatie van elke gegevensbron
  • Welke Azure-services leden kunnen gebruiken om brongegevens te ontvangen
  • Welke gegevensleden kunnen delen met het consortium
  • Hoe leden gegevens kunnen delen: in batches als momentopnamen of als gegevensstromen met in-place delen
  • Welke Azure-services het consortium kan gebruiken om gedeelde gegevens te ontvangen
  • De indeling van de lidgegevens en of deze moeten worden opgeruimd of getransformeerd
  • Welke gegevens het consortium kan delen met leden

Productdocumentatie: