Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktigt!
Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US
av det här dokumentet för bindningsversionen.
Vad är en transparensanteckning?
Viktigt!
Textanalys inom hälsoområdet är en funktion som tillhandahålls "I BEFINTLIGT SKICK" och "MED ALLA FEL". Textanalys för hälsa är inte avsedd eller tillgänglig för användning som medicinsk enhet, kliniskt stöd, diagnostikverktyg eller annan teknik som är avsedd att användas vid diagnos, botemedel, lindring, behandling eller förebyggande av sjukdomar eller andra tillstånd, och ingen licens eller rätt beviljas av Microsoft för att använda denna funktion för sådana ändamål. Denna funktion är inte utformad eller avsedd att genomföras eller användas som ersättning för professionell medicinsk rådgivning eller hälso- och sjukvårdsutlåtande, diagnos, behandling eller klinisk bedömning av en sjukvårdspersonal, och bör inte användas som sådan. Kunden är ensam ansvarig för all användning av Textanalys för hälsa. Kunden måste separat licensiera alla källordförråd som den avser att använda enligt de villkor som anges för umls-metathesauruslicensavtalets bilaga eller någon framtida motsvarande länk. Kunden ansvarar för att säkerställa att licensvillkoren följs, inklusive eventuella geografiska eller andra tillämpliga begränsningar.
Textanalys för hälsa tillåter nu extrahering av Social Determinants of Health (SDOH) och etnicitet omnämnanden i text. Denna funktion kanske inte täcker alla potentiella SDOH och härleder inte slutsatser baserade på SDOH eller etnicitet (till exempel visas information om substansanvändning, men missbruket härleds inte). Alla beslut som utnyttjar utdata från Textanalys för hälsa som påverkar individer eller resursallokering (inklusive, men inte begränsat till, sådana som rör fakturering, personal eller behandlingshantering av vård) bör fattas med mänsklig tillsyn och inte enbart baseras på resultaten av modellen. Syftet med SDOH och etnicitetsextrahering är att hjälpa leverantörer att förbättra hälsoresultaten och det bör inte användas för att stigmatisera eller dra negativa slutsatser om användare eller konsumenter av SDOH-data eller patientpopulationer utöver det angivna syftet att hjälpa leverantörer att förbättra hälsoresultaten.
Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Att skapa ett system som är lämpligt för sitt avsedda syfte kräver en förståelse för hur tekniken fungerar, vilka dess funktioner och begränsningar är och hur man uppnår bästa prestanda. Microsofts Transparensanteckningar är avsedda att hjälpa dig att förstå hur vår AI-teknik fungerar, vilka val systemägare kan göra som påverkar systemets prestanda och beteende samt vikten av att tänka på hela systemet, inklusive teknik, människor och miljö. Du kan använda Transparensanteckningar när du utvecklar eller distribuerar ditt eget system eller delar dem med de personer som kommer att använda eller påverkas av systemet.
Microsofts transparensanteckningar är en del av ett bredare arbete hos Microsoft för att omsätta våra AI-principer i praktiken. Mer information finns i Ansvarsfulla AI-principer från Microsoft.
Grunderna i textanalys för hälsa
Inledning
Textanalys för hälsofunktionen i Azure AI Language använder bearbetningstekniker för naturligt språk för att hitta och märka värdefull hälsoinformation som diagnoser, symtom, mediciner och behandlingar i ostrukturerad text. Tjänsten kan användas för olika typer av ostrukturerade medicinska dokument, inklusive sammanfattningar av ansvarsfrihet, kliniska anteckningar, protokoll för kliniska prövningar, medicinska publikationer med mera. Textanalys inom hälsoområdet utför namngiven entitetsigenkänning (NER), extraherar relationer mellan identifierade entiteter, lyfter fram påståenden som negation och villkorlighet och länkar identifierade entiteter till generella vokabulärer.
Textanalys för hälsa kan ta emot ostrukturerad text på engelska som en del av det allmänna tillgänglighetserbjudandet. Ytterligare språk stöds för närvarande i ett förhandsversionserbjudande. Mer information finns i Språkstöd.
Du kan läsa en översikt över API:et och dess funktioner. Se även entiteter och relationer som stöds.
Dessutom erbjuds nu anpassning för textanalys för hälsa under den nya förhandsgranskningsfunktionen, anpassad textanalys för hälsa. Med anpassad textanalys för hälsa kan kunder använda sina egna data för att träna en anpassad NER-modell, utformad för hälso- och sjukvård, för att extrahera sina domänspecifika kategorier, vilket utökar den befintliga textanalysen för hälsoentitetskartan. Kunder kan också definiera lexikon eller specifik vokabulär för de nyligen definierade anpassade entiteterna samt befintlig textanalys för hälsoentiteter som Läkemedelsnamn. Därför erbjuder anpassad textanalys för hälsa samma funktioner som erbjuds av Textanalys för hälsa tillsammans med möjligheten att utöka den befintliga entitetskartan genom att lägga till nya ML-entiteter och lägga till anpassad vokabulär till befintliga entiteter.
Viktiga termer
Textanalys för hälsa utför för närvarande namngiven entitetsigenkänning (NER), relationsextrahering, kontrollidentifiering och entitetslänkning för biomedicinsk text. Den kan också kompletteras med ytterligare extrahering av anpassade entiteter med hjälp av inlärda entitets- och listkomponenter, som nu är tillgängliga med hjälp av anpassad textanalys för hälsa.
Begrepp | Definition |
---|---|
Igenkänning av namngiven enhet | Identifierar ord och fraser som nämns i ostrukturerad text som kan associeras med en eller flera semantiska typer, till exempel diagnos, medicineringsnamn, symptom eller tecken eller ålder. |
Utdrag av relationer | Identifierar meningsfulla kopplingar mellan begrepp som nämns i text. Till exempel hittas en "time of condition"-relation genom att associera ett villkorsnamn med en tid. |
Identifiering av försäkran | Visar entitetsmodifierare som nämns i text, till exempel negation eller villkorsstyrdhet. Innebörden av medicinskt innehåll kan påverkas mycket av dessa modifierare. |
Entitetslänkning | Särskiljer distinkta entiteter genom att associera namngivna entiteter som nämns i text med begrepp som finns i en fördefinierad databas med begrepp, till exempel i Unified Medical Language System (UMLS). |
Komponent med inlärd entitet | Tillåter definitionen av nya anpassade entiteter som behandling, anläggning eller medicinskt instrument genom träning av en anpassad modell med märkta data. |
Komponent för entitetslista | Tillåter extrahering av nya anpassade entiteter eller befintlig textanalys för hälsoentiteter med hjälp av en lexikonigenkänning genom att definiera en lista med synonymer eller ordförråd som motsvarar valfria entiteter. Till exempel kan "Medicinering A" definieras som ett nytt listvärde under entiteten läkemedelsnamn. |
Förmågor
Systembeteende
Om du vill använda textanalys för hälsa anger du rå, ostrukturerad text för analys och API-utdata hanteras i ditt program. Fyra viktiga funktioner utförs i ett enda API-anrop: entitetsigenkänning, relationsextrahering, entitetslänkning och kontrollidentifiering. Analysen utförs as-is, utan ytterligare anpassning av den förtränade modellen. Du kan använda Textanalys för hälsa antingen via ett värdbaserat API eller genom att distribuera det i en container i din lokala miljö. Mer information finns i hur du anropar textanalys för hälsa.
Om du vill anpassa textanalys för hälsa använder du anpassad textanalys för hälsotillståndets redigeringsupplevelse för att skapa nya entiteter som utökar den befintliga fördefinierade entitetskartan. Du kan också definiera att ny vokabulär ska identifieras med exakt matchning för nya anpassade entiteter samt befintliga fördefinierade entitetskategorier, till exempel Läkemedelsnamn. När du har definierat projektets entitetskarta kan du träna och distribuera den anpassade modellen för att göra förutsägelser. Den distribuerade anpassade modellen stöder som standard alla funktioner som redan ingår i Textanalys för hälsa för de fördefinierade entitetskategorierna. Dessutom innehåller den anpassade modellen specialanpassad NER för de nya entitetskategorierna samt alla ordlistor som definierats för de förbyggda entiteterna. Därför gör förutsägelser med hjälp av den anpassade modellen igenkänning av namngivna entiteter, relationsextrahering, entitetslänkning och kontrollavkänning för textanalys för hälsoentiteter och anpassad igenkänning av namngivna entiteter för att extrahera kunddefinierade entitetskategorier och ett definierat ordförråd för nya och befintliga entitetskategorier. Alla data som används för att träna din anpassade modell lagras i din privata bloblagring. Dessutom kräver anrop av din anpassade modell din APIM-prenumerationsnyckel, vilket innebär att din anpassade modell endast är tillgänglig för användare som du har delat din hemliga nyckel med.
Avsedda användningsfall
Textanalys för hälsa kan användas i flera scenarier i en mängd olika branscher som den här typen av system stöder. Några vanliga kundmotiveringar för att använda Textanalys för hälsa är:
- Hjälp och automatisera bearbetningen av medicinska dokument för korrekt kodning för att förbättra noggrannheten i vård och fakturering.
- Öka effektiviteten för att analysera hälso- och sjukvårdsdata för att hjälpa till att driva framgång med värdebaserade vårdmodeller (till exempel Medicare).
- Förbättra aggregeringen av viktiga data för att spåra trender inom patientvård och historik utan att lägga till omkostnader för vårdgivare.
- Gör framsteg mot att anta HL7-standarder, vilket är ramen för utbyte, integrering, delning och hämtning av elektronisk hälsoinformation till stöd för den dagliga kliniska praxisen och hanteringen samt övergripande leverans och utvärdering av hälso- och sjukvårdstjänster.
Samma användningsfall och överväganden gäller för anpassad textanalys för hälsa, men anpassad textanalys för hälsa passar bättre för scenarier där kunden har data och vill utöka den befintliga fördefinierade entitetskartan genom att skapa egna entitetskategorier eller definiera ordförråd för nya och befintliga entitetskategorier.
Exempel på användningsfall
Följande användningsfall är populära exempel för program för textanalys för hälso- och anpassad textanalys för hälsofunktioner:
- Extrahering av insikter och statistik. Identifiera medicinska entiteter som symtom, mediciner och diagnoser i kliniska anteckningar och olika kliniska dokument. Använd den här informationen för att skapa insikter och statistik om patientpopulationer, söka i kliniska dokument och för att undersöka dokument och publikationer.
- Skapa förutsägelseanalyser och förutsägelsemodeller från historiska data. Möjliggör utveckling av lösningar för planering, beslutsstöd, riskanalys och mer baserat på förutsägelsemodeller som skapats med hjälp av historiska data.
- Assisterad annotering och kuration. Stödverktyg för klinisk dataannotering och kuratering. Till exempel för att stödja klinisk kodning, digitalisering av data som skapades manuellt och automatisering av registerrapportering.
- Stödlösningar för att visa eller analysera hälsorelaterad information. Stöd för lösningar för att visa eller analysera hälsorelaterad information. För rapporteringsändamål kan du till exempel stödja kvalitetssäkringsprocesser eller flagga eventuella fel som ska granskas av en människa.
Att tänka på när du väljer ett användningsfall
Textanalys för hälsa är ett värdefullt verktyg när du hanterar och extraherar kunskap från ostrukturerad medicinsk text. Men med tanke på hälsorelaterade datas känsliga karaktär är det viktigt att tänka igenom dina användningsfall noggrant. I samtliga fall bör en människa fatta beslut med hjälp av den information som systemet returnerar, och i samtliga fall bör du ha ett sätt att granska källdata och korrigera fel. Här följer några ytterligare överväganden när du väljer ett användningsfall:
- Undvik scenarier som använder den här tjänsten som en medicinteknisk enhet, för att tillhandahålla kliniskt stöd eller som ett diagnostiskt verktyg som ska användas vid diagnos, botemedel, lindring, behandling eller förebyggande av sjukdomar eller andra tillstånd utan mänsklig inblandning. En kvalificerad läkare bör alltid utföra due diligence och verifiera källdata som kan påverka beslut om patientvård.
- Undvik scenarier som rör att automatiskt bevilja eller neka medicinska tjänster eller sjukförsäkringar utan mänsklig inblandning. Eftersom beslut som påverkar täckningsnivåer är mycket effektfulla bör källdata alltid verifieras i dessa scenarier.
- Undvik scenarier som använder personlig hälsoinformation i ett syfte som inte tillåts av patientens medgivande eller tillämplig lag. Hälsoinformation har särskilt skydd för sekretess och medgivande. Se till att alla data som du använder har patientmedgivande för hur du använder data i systemet eller att du på annat sätt är kompatibel med tillämplig lag när det gäller användning av hälsoinformation.
- Överväg noggrant att använda identifierade entiteter för att automatiskt uppdatera patientjournaler utan mänsklig inblandning. Se till att det alltid finns ett sätt att rapportera, spåra och korrigera eventuella fel för att undvika att sprida felaktiga data till andra system. Se till att alla uppdateringar av patientjournaler granskas och godkänns av kvalificerade proffs.
- Överväg noggrant att använda identifierade entiteter i patientfakturering utan mänsklig inblandning. Se till att leverantörer och patienter alltid har ett sätt att rapportera, spåra och korrigera data som genererar felaktig fakturering.
- Överväg noggrant scenarier som använder de identifierade sociala bestämningsfaktorerna för hälso- och etnicitetsentiteter. Se alltid till att det finns ett sätt att rapportera, spåra och korrigera eventuella fel för att undvika felaktig slutsatsdragning av ämnets användning eller erbjuda en felaktig form av vård baserat på sociala och demografiska faktorer.
- Tänk noga på scenarier som använder en automatiserad feedbackloop för att finjustera den anpassade textanalysen för hälsomodellen. Se alltid till att testa och utvärdera modellen innan du distribuerar till en produktionsmiljö för att undvika regression av modellkvalitet eftersom anpassad modellträning är en iterativ process som är mycket känslig för träningsdata för indata.
- Juridiska och regelmässiga överväganden: Organisationer måste utvärdera potentiella specifika juridiska och regelmässiga skyldigheter när de använder AI-tjänster och lösningar, vilket kanske inte är lämpligt för användning i alla branscher eller scenarion. Dessutom är AI-tjänster eller lösningar inte utformade för och får inte användas på sätt som är förbjudna i tillämpliga användningsvillkor och relevanta uppförandekoder.
Sociala determinanter för hälsa och etnicitet
Textanalys för hälsa tillåter extrahering av SDOH (Social Determinants of Health) och etnicitetsomnämnanden i text. Med hjälp av sociala och demografiska entiteter kan hjälpa dig att låsa upp omnämnanden av en rad faktorer förutom direkt medicinsk vård som kan driva hälsoresultat, till exempel underliggande genetik, hälsobeteenden och sociala och miljömässiga faktorer. Genom att utnyttja funktionen textanalys för hälso-SDOH-entitetsextrahering kanske du kan minska hälsoskillnader som ofta är rotade i sociala och ekonomiska nackdelar, förbättra vården, bedöma problem med hälsooförvisande och införliva underrepresenterade grupper i kliniska prövningar och forskning. Mer information finns i Sociala bestämningsfaktorer för hälsa, FDA tar viktiga steg för att öka raslig och etnisk mångfald i kliniska prövningar | FDA och County Health Rankings: Relationer mellan determinanta faktorer och hälsoresultat.
Den här funktionen härleder inte slutsatser baserade på SDOH eller etnicitet (till exempel visas information om substansanvändning från indatatexten, men missbruket härleds inte baserat på extraherade entiteter). Alla beslut som förlitar sig på utdata från textanalys för hälsa och som påverkar individer eller resursallokering (inklusive men inte begränsat till beslut som rör fakturering, personal eller hantering av vård) bör fattas med mänsklig tillsyn och inte enbart baseras på modellens resultat. Syftet med SDOH- och etnicitetsextraheringsfunktionerna är att hjälpa leverantörer att förbättra hälsoresultaten. De bör inte användas för att stigmatisera eller dra negativa slutsatser om användare eller konsumenter av SDOH-data eller patientpopulationer utöver det angivna syftet att hjälpa leverantörer att förbättra hälsoresultaten. Precis som med andra extraherade entiteter returnerar textanalysen för hälsosvar även en konfidenspoäng för levande status, sysselsättning, substansanvändning och etnicitetsentiteter. Tänk noga på konfidenspoängen i kontexten för en entitets avsedda användning.
Anpassad textanalys för hälsa
Med textanalys för hälsa kan utvecklare bearbeta och extrahera insikter från ostrukturerade medicinska data. Även om hälsofunktionen kan bearbeta och extrahera ett brett spektrum av datatyper och entitetskategorier, finns det fortfarande fall där kunden kanske vill lägga till en ny entitetstyp som är specifik för deras data eller till och med definiera ytterligare medicinsk vokabulär i en befintlig entitetskategori.
Syftet med anpassad textanalys för hälsa är därför att tillhandahålla ett sätt att anpassa utöver textanalys för hälsa genom att ge kunderna möjlighet att utöka entitetskartan med helt nya entitetskategorier som är specifika för deras data, samt möjligheten att lägga till anpassad vokabulär i de befintliga entitetskategorierna.
Med anpassad textanalys för hälsa kan kunder träna en anpassad ml-modell för sjukvårdsentitetsextrahering med hjälp av deras märkta data och anpassade ordlistor/vokabulärer. Detta gör det möjligt för kunder att definiera nya medicinska entiteter som är specifika för deras data. Tjänsten kommer också internt att anropa Textanalys för Hälsa och ge alla funktioner och entitetskarta som redan finns i Textanalys för Hälsa. Som en extra anpassningsnivå kan kunderna lägga till sitt eget ordförråd i befintlig textanalys för hälsoentiteter för att komplettera det fördefinierade svaret med sina data.
Kunden ansvarar för att tillhandahålla tillräckligt med märkta data och ordförråd för att träna den anpassade modellen; Därför kan modellens prestanda variera beroende på kvaliteten och omfattningen av de märkta träningsdata som kunden använder i förhållande till de nya entitetskategorier som ska definieras. Vi rekommenderar att du alltid testar och utvärderar modellen innan du distribuerar till en produktionsmiljö för att undvika regression av modellkvalitet eftersom anpassad modellträning är en iterativ process som är mycket känslig för träningsdata för indata.
Begränsningar
- Täckning: SDOH-extraheringsfunktionen kanske inte täcker alla potentiella SDOH. Igenkänning är begränsad till etnicitet och de entitetstyper som anges här Entitetskategorier som identifieras av Textanalys för hälsa – Azure AI-tjänster | Microsoft Learn.
- Språk: För närvarande är SDOH- och etnicitetsextraheringsfunktioner aktiverade endast för engelsk text. Textanalys för hälsa kan ta emot ostrukturerad text på engelska som en del av det allmänna tillgänglighetserbjudandet. Ytterligare språk stöds för närvarande i ett förhandsversionserbjudande.
- Stavning: Felaktig stavning kan påverka utdata. Mer specifikt söker entitetslänkning efter termer och synonymer som endast baseras på en specifik, korrekt stavning. Om ett läkemedelsnamn till exempel är felstavat kan systemet ha tillräckligt med information för att känna igen att texten är ett drognamn, men det kanske inte identifierar länken som den skulle ha för det korrekt stavade läkemedelsnamnet.
- Prestanda: Potentiella feltyper har beskrivits i avsnittet Systemprestanda nedan.
- Anpassad textanalys för hälsa (i förhandsversion): Stöder alla språk som stöds av Textanalys för hälsa. För att träna en anpassad modell måste du tillhandahålla träningstjänsten med minst 10 etiketter för varje nydefinierad anpassad entitetskategori. För att kunna träna en anpassad modell måste kunden lägga till minst 10 dokument i projektets datauppsättning. Lexicon-identifierare som används för att extrahera kunddefinierad vokabulär förlitar sig på exakt skiftlägesmatchning på det angivna språket, vilket innebär att kunden måste lägga till alla varianter av det specifika ordet och inkludera det för alla indataspråk för sitt projekt. När du använder anpassad textanalys för hälsa stöds entitetslänkning, relationsextrahering och påståendedetektering för hälsoentiteter, men returneras inte för några nyligen definierade anpassade entitetskategorier.
Systemprestanda
Textanalys för hälsa och anpassad textanalys för hälsa i allmänhet kan ha både falska positiva fel och falska negativa fel för varje funktion som stöds av hälsofunktionen. Flera exempel på potentiella feltyper beskrivs i nästa avsnitt.
Igenkänning av namngiven enhet (NER)
Falsk positiv identifiering
I NER inträffar en falsk positiv identifiering när systemet felaktigt identifierar en entitet som hör till en kategori. I följande exempel är COVID-19 felmärkt som EXAMINATION_NAME. Faktum är att COVID-19 är en diagnos, inte namnet på en undersökning. Så detta är ett falskt positivt resultat för EXAMINATION_NAME.
I det andra exemplet är vodka en falskt positiv bedömning för MEDICATION_NAME. I stället bör den klassificeras som SUBSTANCE_USE.
Falskt negativt
Ett falskt negativt värde i NER inträffar när en entitet ska ha identifierats som tillhörande en kategori, men det var det inte. I följande exempel bör entiteten ER ha identifierats som CARE_ENVIRONMENT, men det var den inte. Om en entitet inte identifieras korrekt identifieras inte heller den länkade koden.
I de följande två exemplen identifieras inte ett andra omnämnande av ETNICITET och information om tidigare anställningar korrekt.
Relationenextraktion
Falsk positiv identifiering
I samband med extrahering uppstår ett falskt positivt resultat när en relation inte borde ha identifierats, men har ändå blivit det. I nästa exempel tillskrevs värdet för AST-undersökningen felaktigt ALT-undersökningen, som redan har ett tilldelat mätvärde.
Falskt negativt
Ett falskt negativt i relationsextrahering inträffar när en relation borde ha identifierats, men det blev inte. I föregående exempel tilldelades inte mätvärdet 45 till AST-undersökningen, och det borde det ha varit.
Entitetslänkning
Falsk positiv identifiering
Entitetslänkning uppnås genom att söka efter en exakt matchning mellan begrepp i vanliga vokabulärer och den identifierade entiteten. Ett falskt positivt resultat för entitetslänkning skulle inträffa i sällsynta fall när en entitet registreras fastän den inte borde ha registrerats (falskt positiv NER) och ett matchande begrepp verkar finnas i ordförrådet. Ett falskt positivt resultat för entitetslänkning kan också inträffa för tvetydiga termer som har flera distinkta matchande begrepp i vanliga vokabulärer.
Falskt negativt
Eftersom entitetslänkning är en exakt matchning med den ursprungliga texten kan du få ett falskt negativt om det finns tillräckligt med signal för att korrekt identifiera entiteten, men stavningen av den entiteten är inte korrekt i texten. I följande text där terapier är felstavade får du till exempel inte rätt länkad entitet UMLS: C0087111.
Identifiering av uttalande
Falsk positiv identifiering
Vid påståendedetektering inträffar en falsk positiv när systemet identifierar ett påstående som inte ska finnas i texten. I följande exempel negeras entitetens andningssjukdom felaktigt som en DIAGNOS för COVID-19.
Falskt negativt
Ett falskt negativt i identifieringen av påståenden inträffar när ett påstående inte upptäcks. I följande exempel ska symptomet "svara" negeras eftersom det inte fanns något svar på den nämnda medicinen.
Metodtips för att förbättra systemprestanda
- Anpassad textanalys för hälsas anpassade vokabulär använder exakt matchning av ord; därför kan felaktig stavning påverka hur entiteter extraheras.
- För att förbättra kvaliteten på anpassad textanalys för hälsotillståndets ML-baserade entitetsextrahering med hjälp av inlärda entitetskomponenter rekommenderar vi att du inkluderar en lika stor distribution av etiketter för varje anpassad entitet samt minst 15 etiketter för varje entitet med exempel som är representativa för indata.
Utvärdering av textanalys för hälsa
Utvärderingsmetoder
Hälsoinriktad textanalys tränas och utvärderas på olika typer av ostrukturerade medicinska dokument, inklusive utskrivningssammanfattningar, kliniska anteckningar, protokoll för kliniska prövningar, medicinska publikationer och mycket mer. SDOH-modellen, som visar levande status, sysselsättning och substansanvändningsentiteter, tränas och utvärderas på en manuellt kommenterad datamängd som kommer från två oberoende källor: cirka 750 slumpmässigt samplade proprietära kliniska anteckningar och cirka 1 500 kliniska anteckningar som slumpmässigt samplas från en corpus som tillhandahålls av ett amerikanskt medicinskt centrum och fokuserar främst på vuxna patienter. Den ursprungliga corpus täcker mer än 10 års insamlade data och tusentals patientantagningar. Det ger nästan lika representation av manliga och kvinnliga patienter. Det bör noteras att ingen ytterligare analys av representativiteten för träningsdata (till exempel geografisk, demografisk eller etnografisk representation) har utförts. Även om interna tester visar modellens potential att generalisera till olika populationer och geografiska områden bör du noga överväga hur tränings- och utvärderingsdata är representativa i samband med din avsedda användning. För att utvärdera systemet i förhållande till potentiella rättviseskador delades utvärderingsdatauppsättningen upp i undergrupper av dokument efter sociala och demografiska faktorer, till exempel kön, ålder, etnicitet, sysselsättning och levnadsstatus. Riktade lägsta prestandanivåer för varje grupp utvärderades, liksom relativa prestandaskillnader mellan grupper.
Utvärdering av anpassad textanalys för hälsa
Anpassad textanalys för hälsa utnyttjar en anpassad sjukvårdsbasmodell som finjusteras av kundspecifika data utöver den fördefinierade textanalysen för hälsomodellen. Basmodellen för hälso- och sjukvården som används är samma basmodell som mappningen textanalys för hälsoentitet bygger på.
Anpassad textanalys för hälsa har en intern utvärdering som en del av redigeringsupplevelsen. Detta gör det möjligt för kunden att skapa en testdatauppsättning och granska F1-, precisions- och återkallelsepoängen för de definierade anpassade entitetskategorierna. Textanalys för hälsofördefinierade entiteter ingår inte i den interna utvärderingen. Upplevelsen innehåller också modellvägledning för att ge kunden sätt att förbättra resultatet från testningen, till exempel rekommendera ytterligare etiketter för entiteter som inte fungerar bra.
Utvärdera och integrera textanalys för hälsa för din användning
Microsoft vill hjälpa dig att på ett ansvarsfullt sätt utveckla och distribuera lösningar som använder Azure AI Language. Dessa överväganden är i linje med vårt åtagande att utveckla ansvarsfull AI. När du bestämmer dig för hur du ska använda och implementera produkter och lösningar som drivs av Azure AI Language-funktioner bör du tänka på följande faktorer.
Allmänna riktlinjer
När du förbereder dig för att distribuera textanalys inom hälsoområdet kan följande aktiviteter hjälpa dig att lyckas:
- Förstå vad den kan göra: Utvärdera funktionerna i Textanalys för hälsa fullt ut för att förstå dess funktioner och begränsningar. Förstå hur det kommer att fungera i ditt scenario och kontext.
- Testa med verkliga, olika data: Förstå att textanalys för hälsa utförs i ditt scenario genom att noggrant testa det med hjälp av verkliga förhållanden och data som återspeglar mångfalden i dina användare, geografi och distributionskontexter. Små datamängder, syntetiska data och tester som inte återspeglar ditt scenario från slutpunkt till slutpunkt kommer sannolikt inte att representera produktionsprestanda tillräckligt.
- Respektera en individs rätt till integritet: Samla endast in eller använda data och information från individer för lagliga och berättigade ändamål. Använd endast de data och den information som du har samtyckt till att använda eller som är lagligt tillåtna att använda.
- Juridisk granskning: Få lämplig juridisk granskning av din lösning, särskilt om du ska använda den i känsliga program eller högriskprogram. Förstå vilka begränsningar du kan behöva arbeta inom och eventuella risker som måste minimeras före användning. Det är ditt ansvar att minska sådana risker och lösa eventuella problem som kan uppstå.
- Systemgranskning: Om du planerar att integrera och på ett ansvarsfullt sätt använda en AI-baserad produkt eller funktion i ett befintligt system för program- eller kund- eller organisationsprocesser kan du ta dig tid att förstå hur varje del av systemet påverkas. Fundera på hur din AI-lösning överensstämmer med Microsofts principer för ansvarsfull AI.
- Människa i loopen: Behåll en mänsklig medverkan i processen och inkludera mänsklig övervakning som ett genomgående mönsterområde att utforska. Det innebär ständig mänsklig tillsyn över den AI-drivna produkten eller funktionen och säkerställer människans roll när det gäller att fatta beslut som baseras på modellens utdata. För att förhindra skador och hantera hur AI-modellen presterar ser du till att människor har ett sätt att ingripa i lösningen i realtid.
- Säkerhet: Se till att din lösning är säker och att den har tillräckliga kontroller för att bevara innehållets integritet och förhindra obehörig åtkomst.
- Loop för kundfeedback: Ge en feedbackkanal som användare kan använda för att rapportera problem med tjänsten efter att den har tagits i drift. När du har distribuerat en AI-baserad produkt eller funktion kräver den kontinuerlig övervakning och förbättring. Ha en plan och var redo att implementera feedback och förslag på förbättringar.
Se även
- Transparensanteckning för Azure AI Language
- Transparensanteckning för namngiven entitetsigenkänning och personligt identifierande information
- Transparensanteckning för extrahering av nyckelfraser
- Transparensanteckning för språkidentifiering
- Transparensanteckning för svar på frågor
- Transparensanteckning för sammanfattning
- Transparensanteckning för attitydanalys
- Datasekretess och säkerhet för Azure AI Language
- Vägledning för integrering och ansvarsfull användning med Azure AI Language