De duur van het verblijf en de stroom van de patiënt voorspellen

Azure Data Factory
Azure Data Lake Storage
Azure Machine Learning
Azure Synapse Analytics
Power BI

Deze Azure-oplossing helpt ziekenhuisbeheerders de kracht van machine learning te gebruiken om de duur van het verblijf voor ziekenhuisopnamen te voorspellen, om de capaciteitsplanning en het resourcegebruik te verbeteren. Een Chief Medical Information Officer kan een voorspellend model gebruiken om te bepalen welke faciliteiten te veel worden overbelast en welke middelen binnen die faciliteiten moeten worden versterkt. Een zorglijnmanager kan een model gebruiken om te bepalen of er voldoende personeelsmiddelen zijn om de vrijlating van een patiënt af te handelen.

Architectuur

Diagram van architectuur voor bewaking van externe patiënten met behulp van apparaten in de gezondheidszorg en Azure-services.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

De volgende gegevensstroom komt overeen met het bovenstaande diagram:

  1. Geanonimiseerde gezondheidsgegevens uit elektronische gezondheidsdossiers (EHR) en elektronische medische dossiers (EMR) worden geëxtraheerd met behulp van Azure Data Factory met de juiste runtime (bijvoorbeeld: Azure, zelf-hostend). In dit scenario gaan we ervan uit dat geanonimiseerde gegevens toegankelijk zijn voor batchextractie met behulp van een van de Azure Data Factory-connectors, zoals ODBC, Oracle, SQL. Andere gegevensbronnen, zoals FHIR-gegevens, vereisen mogelijk de opname van een tussenliggende opnameservice, zoals Azure Functions.

  2. Azure Data Factory gegevens stromen via de Data Factory naar Azure Data Lake Storage (gen 2). Er worden tijdens dit proces geen gegevens opgeslagen in Azure Data Factory en fouten zoals verbroken verbindingen kunnen tijdens deze stap worden verwerkt of opnieuw worden geprobeerd.

  3. Azure Machine Learning wordt gebruikt om machine learning-algoritmen/pijplijnen toe te passen op de gegevens die in stap 2 zijn opgenomen. De algoritmen kunnen worden toegepast op gebeurtenisbasis, gepland of handmatig, afhankelijk van de vereisten. Dit omvat met name:

    3.1 Trainen - De opgenomen gegevens worden gebruikt om een machine learning-model te trainen met behulp van een combinatie van algoritmen zoals lineaire regressie en beslissingsstructuur met kleurovergang. Deze algoritmen worden geleverd via verschillende frameworks (bijvoorbeeld scikit-learn) meestal in een pijplijn en kunnen pijplijnstappen voor-/naverwerking omvatten. Als voorbeeld kunnen gezondheidsfactoren voor patiënten, zoals het opnametype dat afkomstig is van de bestaande vooraf verwerkte EMR-/EPD-gegevens (bijvoorbeeld null-rijen verwijderen) worden gebruikt om een regressiemodel zoals Lineaire Regressie te trainen. Het model zou dan in staat zijn om een nieuwe patiëntduur van het verblijf te voorspellen.

    3.2 Valideren : de prestaties van het model worden vergeleken met bestaande modellen/testgegevens, en ook met downstreamverbruiksdoelen zoals Application Programming Interfaces (API's).

    3.3 Implementeren - Het model wordt verpakt met behulp van een container voor gebruik in verschillende doelomgevingen.

    3.4 Monitor - De modelvoorspellingen worden verzameld en bewaakt om ervoor te zorgen dat de prestaties na verloop van tijd niet afnemen. Waarschuwingen kunnen indien nodig worden verzonden om handmatige of geautomatiseerde hertraining/updates voor het model te activeren met behulp van deze bewakingsgegevens. Houd er rekening mee dat er mogelijk aanvullende services zoals Azure Monitor nodig zijn, afhankelijk van het type bewakingsgegevens dat wordt geëxtraheerd.

  4. Azure Machine Learning-uitvoerstromen naar Azure Synapse Analytics. De modeluitvoer (voorspelde verblijfsduur van de patiënt) wordt gecombineerd met de bestaande patiëntgegevens in een schaalbare, ondersteunende laag zoals een toegewezen SQL-pool voor downstreamverbruik. Aanvullende analyses, zoals de gemiddelde duur van het verblijf per ziekenhuis, kunnen op dit moment worden uitgevoerd via Synapse Analytics.

  5. Azure Synapse Analytics levert gegevens aan Power BI. Power BI maakt met name verbinding met de ondersteunende laag in stap (4) om de gegevens te extraheren en aanvullende semantische modellering toe te passen die nodig is.

  6. Power BI wordt gebruikt voor analyse door de zorglijnmanager en de resourcecoördinator van het ziekenhuis.

Onderdelen

  • Azure Data Factory (ADF) biedt een volledig beheerde, serverloze service voor gegevensintegratie en -indeling waarmee gegevensbronnen zonder extra kosten visueel kunnen worden geïntegreerd met meer dan 90 ingebouwde, onderhoudsvrije connectors. In dit scenario wordt ADF gebruikt om gegevens op te nemen en de gegevensstromen te organiseren.

  • Azure Data Lake (ADLS) biedt een schaalbare beveiligde data lake voor analyses met hoge prestaties. In dit scenario wordt ADLS gebruikt als een schaalbare, kosteneffectieve gegevensopslaglaag.

  • Azure Machine Learning-services (AML) versnellen de end-to-end LOS-voorspellingslevenscyclus voor machine learning door:

    • Gegevenswetenschappers en ontwikkelaars voorzien van een breed scala aan productieve ervaringen om machine learning-modellen te bouwen, te trainen en te implementeren en teamsamenwerking te bevorderen.
    • De time-to-market versnellen met toonaangevende MLOps: machine learning-bewerkingen of DevOps voor machine learning.
    • Innoveren op een veilig, vertrouwd platform, ontworpen voor verantwoorde machine learning.

    In dit scenario is AML de service die wordt gebruikt om het model te produceren dat wordt gebruikt om de duur van het verblijf van de patiënt te voorspellen en om de levenscyclus van het end-to-end-model te beheren.

  • Azure Synapse Analytics: een onbeperkte analyseservice die gegevensintegratie, zakelijke datawarehousing en big data-analyse combineert. In dit scenario wordt Synapse gebruikt om de modelvoorspellingen op te nemen in het bestaande gegevensmodel en ook om een snelle servicelaag te bieden voor downstreamverbruik.

  • Power BI biedt selfserviceanalyse op ondernemingsniveau, zodat u het volgende kunt doen:

    • Creëer een gegevensgestuurde cultuur met business intelligence voor iedereen.
    • Houd uw gegevens veilig met toonaangevende mogelijkheden voor gegevensbeveiliging, waaronder vertrouwelijkheidslabels, end-to-end-versleuteling en realtime toegangsbewaking.

    In dit scenario wordt Power BI gebruikt om dashboards voor eindgebruikers te maken en semantische modellering toe te passen die nodig zijn in deze dashboards.

Alternatieven

  • Spark-services zoals Azure Synapse Analytics Spark en Azure Databricks kunnen worden gebruikt als alternatief voor machine learning, afhankelijk van de gegevensschaal en vaardigheden van het data science-team.
  • MLFlow kan worden gebruikt voor het beheren van de end-to-end levenscyclus als alternatief voor Azure Machine Learning, afhankelijk van de vaardighedenset/omgeving van de klant.
  • Azure Synapse Analytics-pijplijnen kunnen in de meeste gevallen worden gebruikt als alternatief voor Azure Data Factory, grotendeels afhankelijk van de specifieke klantomgeving.

Scenariodetails

Voor de mensen die een zorginstelling runnen, is de duur van het verblijf (LOS) van belang, het aantal dagen van patiëntopname tot ontslag. Dit aantal kan echter variëren per faciliteiten en ziekteomstandigheden en specialismen, zelfs binnen hetzelfde gezondheidszorgsysteem, waardoor het lastig is om de patiëntenstroom bij te houden en dienovereenkomstig te plannen.

Deze oplossing maakt een voorspellend model mogelijk voor LOS voor ziekenhuisopnamen. LOS wordt gedefinieerd in het aantal dagen vanaf de eerste opnamedatum tot de datum waarop de patiënt wordt ontslagen uit een bepaalde ziekenhuisinstelling. Er kan een aanzienlijke variatie van LOS zijn in verschillende faciliteiten, ziekteomstandigheden en specialiteiten, zelfs binnen hetzelfde gezondheidszorgsysteem.

Studies zoals Is de verblijfsduur van de patiënt gerelateerd aan kwaliteit van zorg? hebben aangetoond dat een langere risicogecorrigeerde LOS gecorreleerd is met een lagere kwaliteit van de zorg. Geavanceerde LOS-voorspelling op het moment van opname kan de kwaliteit van de zorg voor de patiënt verbeteren door zorgverleners een verwachte LOS te geven die ze als metrische waarde kunnen gebruiken om te vergelijken met de huidige LOS van de patiënt. Dit kan helpen ervoor te zorgen dat patiënten met langer dan verwacht LOS de juiste aandacht krijgen. LOS-voorspelling helpt ook bij het nauwkeurig plannen van ontslagen, wat resulteert in een verlaging van verschillende andere kwaliteitsmaatregelen, zoals overnames.

Potentiële gebruikscases

Er zijn twee verschillende zakelijke gebruikers in het ziekenhuisbeheer die kunnen profiteren van betrouwbaardere voorspellingen over de duur van het verblijf, evenals de families van de patiënten:

  • De Chief Medical Information Officer (CMIO), die de kloof tussen informatica/technologie en zorgprofessionals in een gezondheidszorgorganisatie overspoelt. Hun taken omvatten doorgaans het gebruik van analyses om te bepalen of resources op de juiste manier worden toegewezen in een ziekenhuisnetwerk. De CMIO moet kunnen bepalen welke faciliteiten worden overbelast en in het bijzonder welke resources op die faciliteiten mogelijk moeten worden versterkt om dergelijke resources af te stemmen op de vraag.
  • De zorglijnmanager, die direct betrokken is bij de zorg voor patiënten. Deze rol vereist het bewaken van de status van individuele patiënten en ervoor zorgen dat personeel beschikbaar is om te voldoen aan de specifieke zorgbehoeften van hun patiënten. De zorglijnmanager kan nauwkeurige medische beslissingen nemen en de juiste middelen ruim van tevoren afstemmen. Bijvoorbeeld de mogelijkheid om LOS te voorspellen:
    • omdat een eerste beoordeling van het risico van patiënten essentieel is voor een betere planning en toewijzing van resources, met name wanneer de middelen beperkt zijn, zoals bij ICU's.
    • hiermee kunnen zorglijnmanagers bepalen of de personeelsmiddelen voldoende zijn om de vrijlating van een patiënt af te handelen.
  • Het voorspellen van de LOS op ICU is ook gunstig voor patiënten en hun families, evenals voor verzekeringsmaatschappijen. Een verwachte datum voor ontslag uit het ziekenhuis helpt patiënten en hun families om de medische kosten te begrijpen en te schatten. Dit geeft gezinnen ook een idee over de snelheid van herstel van een patiënt, en helpt hen bij het plannen van ontslag en het beheren van hun budgetten.

Overwegingen

Met deze overwegingen worden de pijlers van het Azure Well-Architected Framework geïmplementeerd. Dit is een set richtlijnen die kunnen worden gebruikt om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

Kostenoptimalisatie

Kostenoptimalisatie gaat over het zoeken naar manieren om onnodige uitgaven te verminderen en de operationele efficiëntie te verbeteren. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

Het duurste onderdeel van deze oplossing is de berekening en er zijn verschillende manieren om de rekenkracht rendabel te schalen met het gegevensvolume. Een voorbeeld hiervan is het gebruik van een Spark-service zoals Azure Synapse Analytics Spark of Azure Databricks voor het data engineering-werk, in plaats van een oplossing met één knooppunt. Spark schaalt horizontaal en is rendabeler in vergelijking met grote, verticaal geschaalde oplossingen met één knooppunt.

De prijzen voor alle Azure-onderdelen zoals geconfigureerd in deze architectuur vindt u in deze opgeslagen schatting van de Azure-prijscalculator. Deze schatting is geconfigureerd om de geschatte kosten vooraf en de maandelijkse kosten weer te geven voor een basisimplementatie die van maandag tot en met vrijdag van 9:00 tot 17:00 uur wordt uitgevoerd.

Operationele uitmuntendheid

Operationele uitmuntendheid omvat de operationele processen die een toepassing implementeren en deze in productie houden. Zie Overzicht van de operationele uitmuntendheidpijler voor meer informatie.

Een solide MLOps-praktijk (Machine Learning Operations) en -implementatie spelen een cruciale rol bij de productiealisering van dit type oplossing. Zie Machine learning-bewerkingen (MLOps) voor meer informatie.

Prestatie-efficiëntie

Prestatie-efficiëntie is de mogelijkheid om op efficiënte wijze uw werkbelasting te schalen om te voldoen aan de vereisten die gebruikers eraan stellen. Zie Overzicht van de pijler Prestatie-efficiëntie voor meer informatie.

In dit scenario wordt de voorverwerking van gegevens uitgevoerd in Azure Machine Learning. Hoewel dit ontwerp werkt voor kleine tot middelgrote gegevensvolumes, kunnen grote gegevensvolumes of scenario's met bijna realtime SLA's moeite hebben vanuit het oogpunt van prestaties. Een manier om dit soort problemen aan te pakken, is door een Spark-service zoals Azure Synapse Analytics Spark of Azure Databricks te gebruiken voor data engineering- of data science-workloads. Spark wordt horizontaal geschaald en wordt per ontwerp gedistribueerd, zodat grote gegevenssets zeer effectief kunnen worden verwerkt.

Beveiliging

Beveiliging biedt garanties tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

Belangrijk

Deze architectuur werkt met zowel geanonimiseerde als niet-geanonimiseerde gezondheidsgegevens. Voor een veilige implementatie raden we echter aan dat gezondheidsgegevens in geanonimiseerde vorm worden opgehaald uit EPD- en EMR-bronnen.

Zie Enterprise security and governance for Azure Machine Learning (Ondernemingsbeveiliging en governance voor Azure Machine Learning) voor meer informatie over beveiligings- en governancefuncties die beschikbaar zijn voor Azure Machine Learning

Medewerkers

Dit artikel wordt onderhouden door Microsoft. Het is oorspronkelijk geschreven door de volgende inzenders.

Hoofdauteurs:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen

Technologieën en resources die betrekking hebben op het implementeren van deze architectuur:

Zie aanvullende Azure Architecture Center-inhoud die is gerelateerd aan deze architectuur: