Przewidywanie długości pobytu i przepływu pacjentów

Data Factory
Data Lake Storage Gen2
Usługa Machine Learning
Synapse Analytics
Power BI

To rozwiązanie platformy Azure ułatwia administratorom szpitala wykorzystanie możliwości uczenia maszynowego w celu przewidywania długości pobytu dla przyjęć w szpitalu w celu zwiększenia planowania pojemności i wykorzystania zasobów. Główny specjalista ds. informacji medycznych może użyć modelu predykcyjnego, aby określić, które obiekty są nadmiernie zatłoczone i które zasoby mają wzmocnić w tych obiektach. Menedżer linii opieki może użyć modelu w celu ustalenia, czy istnieją odpowiednie zasoby personelu do obsługi zwolnienia pacjenta.

Architektura

Diagram architektury zdalnego monitorowania pacjentów przy użyciu urządzeń opieki zdrowotnej i usług platformy Azure.

Pobierz plik programu Visio z tą architekturą.

Przepływ danych

Poniższy przepływ danych odpowiada powyższemu diagramowi:

  1. Anonimowe dane zdrowotne z elektronicznych dokumentacji zdrowia (EHR) i elektronicznej dokumentacji medycznej (EMR) są wyodrębniane przy użyciu Azure Data Factory z odpowiednim środowiskiem uruchomieniowym (na przykład: Azure, Self-hosted). W tym scenariuszu założono, że anonimowe dane są dostępne do wyodrębniania wsadowego przy użyciu jednego z łączników Azure Data Factory, takich jak ODBC, Oracle, SQL. Inne źródła danych, takie jak dane FHIR, mogą wymagać włączenia pośredniej usługi pozyskiwania, takiej jak Azure Functions.

  2. Azure Data Factory dane przepływają przez usługę Data Factory do Azure Data Lake Storage (gen 2). Żadne dane nie są przechowywane w Azure Data Factory w trakcie tego procesu, a błędy, takie jak porzucone połączenia, mogą być obsługiwane/ponawiane w tym kroku.

  3. Usługa Azure Machine Learning służy do stosowania algorytmów/potoków uczenia maszynowego do danych pozyskanych w kroku 2. Algorytmy można stosować na podstawie zdarzeń, zaplanowanych lub ręcznie w zależności od wymagań. W szczególności obejmuje to następujące elementy:

    3.1 Train — pozyskane dane służą do trenowania modelu uczenia maszynowego przy użyciu kombinacji algorytmów, takich jak regresja liniowa i drzewo decyzyjne wzmocnione gradientem. Te algorytmy są udostępniane za pośrednictwem różnych struktur (na przykład scikit-learn) zwykle w potoku i mogą obejmować kroki potoku przed/po przetworzeniu. Na przykład czynniki kondycji pacjenta, takie jak typ wstępu pochodzące z istniejącego wstępnie przetworzonego (na przykład upuszczania wierszy o wartości null) danych EMR/EHR, mogą służyć do trenowania modelu regresji, takiego jak regresja liniowa. Model będzie wtedy w stanie przewidzieć nową długość pobytu pacjenta.

    3.2 Weryfikacja — wydajność modelu jest porównywana z istniejącymi modelami/danymi testowymi, a także z wszelkimi celami użycia podrzędnego, takimi jak interfejsy API (Application Programming Interfaces).

    3.3 Wdrażanie — model jest spakowany przy użyciu kontenera do użycia w różnych środowiskach docelowych.

    3.4 Monitorowanie — przewidywania modelu są zbierane i monitorowane w celu zapewnienia, że wydajność nie ulega pogorszeniu w czasie. Alerty można wysyłać do wyzwalania ręcznego lub zautomatyzowanego ponownego trenowania/aktualizacji modelu zgodnie z potrzebami przy użyciu tych danych monitorowania. Należy pamiętać, że mogą być potrzebne dodatkowe usługi, takie jak Azure Monitor, w zależności od typu wyodrębnionych danych monitorowania.

  4. Przepływy danych wyjściowych usługi Azure Machine Learning do usługi Azure Synapse Analytics. Dane wyjściowe modelu (przewidywana długość pobytu pacjenta) są łączone z istniejącymi danymi pacjentów w skalowalnej warstwie obsługującej warstwę, na przykład dedykowaną pulę SQL na potrzeby użycia podrzędnego. W tym momencie można wykonywać dodatkowe analizy, takie jak średnia długość pobytu na szpital za pośrednictwem usługi Synapse Analytics.

  5. usługa Azure Synapse Analytics dostarcza dane do usługi Power BI. W szczególności usługa Power BI łączy się z warstwą obsługi w kroku (4), aby wyodrębnić dane i zastosować dodatkowe wymagane modelowanie semantyczne.

  6. Usługa Power BI jest używana do analizy przez menedżera linii opieki i koordynatora zasobów szpitala.

Składniki

  • Azure Data Factory (ADF) zapewnia w pełni zarządzaną, bezserwerową integrację danych i usługę aranżacji umożliwiającą wizualną integrację źródeł danych z ponad 90+ wbudowanymi, bezobsługowymi łącznikami bez dodatkowych kosztów. W tym scenariuszu usługa ADF służy do pozyskiwania danych i organizowania przepływów danych.

  • Usługa Azure Data Lake (ADLS) zapewnia skalowalne bezpieczne środowisko data lake na potrzeby analizy o wysokiej wydajności. W tym scenariuszu usługa ADLS jest używana jako skalowalna, ekonomiczna warstwa magazynu danych.

  • Usługi Azure Machine Learning (AML) przyspieszają kompleksowe cykl życia uczenia maszynowego przewidywania LOS przez:

    • Zwiększanie możliwości analityków danych i deweloperów z szeroką gamą wydajnych środowisk do tworzenia, trenowania i wdrażania modeli uczenia maszynowego oraz wspierania współpracy zespołowej.
    • Skracanie czasu obrotu dzięki wiodącej w branży metodyce MLOps — operacjom uczenia maszynowego lub metodyce DevOps na potrzeby uczenia maszynowego.
    • Wprowadzanie innowacji na bezpiecznej, zaufanej platformie zaprojektowanej pod kątem odpowiedzialnego uczenia maszynowego.

    W tym scenariuszu usługa AML jest usługą używaną do tworzenia modelu używanego do przewidywania długości pobytu pacjenta i zarządzania cyklem życia modelu kompleksowego.

  • Azure Synapse Analytics: nieograniczona usługa analizy, która łączy integrację danych, magazynowanie danych przedsiębiorstwa i analizę danych big data. W tym scenariuszu usługa Synapse służy do dołączania przewidywań modelu do istniejącego modelu danych, a także zapewniania wysokiej szybkości warstwy obsługi na potrzeby zużycia podrzędnego.

  • Usługa Power BI zapewnia samoobsługową analizę na dużą skalę przedsiębiorstwa, umożliwiając:

    • Utwórz kulturę opartą na danych z analizą biznesową dla wszystkich.
    • Zapewnij bezpieczeństwo danych dzięki wiodącym w branży funkcjom zabezpieczeń danych, w tym etykietowaniu poufności, kompleksowemu szyfrowaniu i monitorowaniu dostępu w czasie rzeczywistym.

    W tym scenariuszu usługa Power BI służy do tworzenia pulpitów nawigacyjnych użytkowników końcowych i stosowania wszelkich semantycznych modelowania wymaganych na tych pulpitach nawigacyjnych.

Alternatywy

  • Usługi Spark, takie jak Azure Synapse Analytics Spark i Azure Databricks, mogą służyć jako alternatywa do wykonywania uczenia maszynowego, w zależności od skali danych i zestawu umiejętności zespołu nauki o danych.
  • Usługa MLFlow może służyć do zarządzania cyklem życia kompleksowego jako alternatywy dla usługi Azure Machine Learning w zależności od zestawu umiejętności/środowiska klienta.
  • Potoki Azure Synapse Analytics mogą być używane jako alternatywa dla Azure Data Factory w większości przypadków, w zależności od konkretnego środowiska klienta.

Szczegóły scenariusza

Dla osób prowadzących placówkę opieki zdrowotnej długość pobytu (LOS) — liczba dni od przyjęcia pacjenta do zwolnienia — ma znaczenie. Jednak ta liczba może się różnić w różnych obiektach i w różnych warunkach chorobowych i specjalizacjach, nawet w ramach tego samego systemu opieki zdrowotnej, co utrudnia śledzenie przepływu pacjentów i planowania odpowiednio.

To rozwiązanie umożliwia model predykcyjny LOS dla przyjęć w szpitalu. LOS jest definiowana w ciągu kilku dni od początkowej daty przyznania do daty zwolnienia pacjenta z dowolnego placówki szpitalnej. W różnych obiektach, warunkach chorobowych i specjalizacjach, nawet w ramach tego samego systemu opieki zdrowotnej, może istnieć znaczna zmienność LOS.

Badania, takie jak Czy długość pobytu pacjenta związane z jakością opieki? wykazały, że dłuższy los skorygowany o ryzyko jest skorelowany z niższą jakością opieki. Zaawansowane przewidywanie LOS w momencie przyjęcia może zwiększyć jakość opieki nad pacjentem, dając dostawcom oczekiwany LOS, którego mogą używać jako metryki do porównania z bieżącym pacjentem LOS. Może to pomóc w zapewnieniu pacjentom dłuższym niż oczekiwano LOS otrzymania odpowiedniej uwagi. Przewidywanie LOS pomaga również w dokładnym planowaniu zrzutów, co powoduje obniżenie różnych innych miar jakości, takich jak readmisje.

Potencjalne przypadki użycia

Istnieją dwa różne użytkowników biznesowych w zarządzaniu szpitalem, którzy mogą spodziewać się skorzystać z bardziej niezawodnych prognoz długości pobytu, a także rodzin pacjentów:

  • Główny specjalista ds. informacji medycznych (CMIO), który przecina podział między informatykami/technologiami i pracownikami służby zdrowia w organizacji opieki zdrowotnej. Ich obowiązki zazwyczaj obejmują korzystanie z analizy w celu określenia, czy zasoby są przydzielane odpowiednio w sieci szpitalnej. CmIO musi być w stanie określić, które obiekty są nadmiernie zatłoczone, a w szczególności jakie zasoby w tych obiektach mogą być wzmocnione, aby wyrównać takie zasoby z zapotrzebowaniem.
  • Kierownik linii opieki, który jest bezpośrednio zaangażowany w opiekę nad pacjentami. Ta rola wymaga monitorowania stanu poszczególnych pacjentów i zapewnienia, że personel jest dostępny w celu spełnienia określonych wymagań opieki swoich pacjentów. Menedżer linii opieki może podejmować dokładne decyzje medyczne i odpowiednio dostosować odpowiednie zasoby z wyprzedzeniem. Na przykład możliwość przewidywania losu:
    • jako wstępna ocena ryzyka pacjentów ma kluczowe znaczenie dla lepszego planowania i alokacji zasobów, zwłaszcza gdy zasoby są ograniczone, jak w jednostkach ICU.
    • umożliwia menedżerom linii opieki ustalenie, czy zasoby personelu będą odpowiednie do obsługi zwolnienia pacjenta.
  • Przewidywanie LOS w ICU jest również korzystne dla pacjentów i ich rodzin, a także firm ubezpieczeniowych. Oczekiwana data zwolnienia ze szpitala pomaga pacjentom i ich rodzinom zrozumieć i oszacować koszty leczenia. Daje to również rodzinom pomysł na szybkość odzyskiwania pacjenta i pomaga im zaplanować wypis i zarządzać swoimi budżetami.

Zagadnienia do rozważenia

Te zagadnienia implementują filary platformy Azure Well-Architected Framework, która jest zestawem podstawowych zestawów, które mogą służyć do poprawy jakości obciążenia. Aby uzyskać więcej informacji, zobacz Microsoft Azure Well-Architected Framework.

Optymalizacja kosztów

Optymalizacja kosztów dotyczy sposobów zmniejszenia niepotrzebnych wydatków i poprawy wydajności operacyjnej. Aby uzyskać więcej informacji, zobacz Omówienie filaru optymalizacji kosztów.

Najdroższym składnikiem tego rozwiązania jest obliczenia i istnieje kilka sposobów na efektywne skalowanie zasobów obliczeniowych przy użyciu woluminu danych. Przykładem może być użycie usługi Spark, takiej jak Azure Synapse Analytics Spark lub Azure Databricks na potrzeby pracy inżynieryjnej danych, w przeciwieństwie do rozwiązania z jednym węzłem. Platforma Spark skaluje się w poziomie i jest bardziej opłacalna w porównaniu z dużymi, skalowalnymi w pionie rozwiązaniami z jednym węzłem.

Cennik wszystkich składników platformy Azure skonfigurowanych w tej architekturze można znaleźć w tym kalkulatorze cen platformy Azure zapisanym oszacowaniem. To oszacowanie jest skonfigurowane do pokazywania szacowanych kosztów z góry i miesięcznych, dla podstawowej implementacji, która działa od 9:00 do 15:00 w poniedziałek do piątku.

Efektywność operacyjna

Doskonałość operacyjna obejmuje procesy operacyjne, które wdrażają aplikację i działają w środowisku produkcyjnym. Aby uzyskać więcej informacji, zobacz Omówienie filaru doskonałości operacyjnej.

Solidna praktyka i implementacja operacji uczenia maszynowego (MLOps) odgrywa kluczową rolę w produkcji tego typu rozwiązania. Aby uzyskać więcej informacji, zobacz Operacje uczenia maszynowego (MLOps).

Efektywność wydajności

Efektywność wydajności to możliwość skalowania obciążenia w celu zaspokojenia zapotrzebowania użytkowników w wydajny sposób. Aby uzyskać więcej informacji, zobacz Omówienie filaru wydajności.

W tym scenariuszu przetwarzanie wstępne danych jest wykonywane w usłudze Azure Machine Learning. Chociaż ten projekt będzie działać w przypadku małych i średnich woluminów danych, duże woluminy danych lub scenariusze z umowami SLA niemal w czasie rzeczywistym mogą zmagać się z punktu widzenia wydajności. Jednym ze sposobów rozwiązania tego typu problemu jest użycie usługi Spark, takiej jak Azure Synapse Analytics Spark lub Azure Databricks na potrzeby obciążeń inżynierii danych lub nauki o danych. Platforma Spark skaluje się w poziomie i jest dystrybuowana zgodnie z projektem, co pozwala na bardzo efektywne przetwarzanie dużych zestawów danych.

Zabezpieczenia

Zabezpieczenia zapewniają ochronę przed celowymi atakami i nadużyciami cennych danych i systemów. Aby uzyskać więcej informacji, zobacz Omówienie filaru zabezpieczeń.

Ważne

Ta architektura będzie działać zarówno z anonimowymi, jak i nieonimizowanymi danymi kondycji. Jednak ze względu na bezpieczną implementację zalecamy, aby dane kondycji pochodziły w postaci zaonimizowanej ze źródeł EHR i EMR.

Aby uzyskać więcej informacji na temat funkcji zabezpieczeń i ładu dostępnych dla usługi Azure Machine Learning, zobacz Zabezpieczenia i ład w przedsiębiorstwie dla usługi Azure Machine Learning

Współautorzy

Ten artykuł jest obsługiwany przez Microsoft. Został pierwotnie napisany przez następujących współautorów.

Autorzy zabezpieczeń:

Aby wyświetlić niepublice profile serwisu LinkedIn, zaloguj się do serwisu LinkedIn.

Następne kroki

Technologie i zasoby związane z implementacją tej architektury:

Zobacz dodatkową zawartość Centrum architektury platformy Azure powiązaną z tą architekturą: