Snabbstart: anpassade Textanalys för hälsa

Artikel
01/10/2024

Använd den här artikeln om du vill komma igång med att skapa en anpassad Textanalys för hälsoprojekt där du kan träna anpassade modeller ovanpå Textanalys för hälsa för anpassad entitetsigenkänning. En modell är programvara för artificiell intelligens som är tränad att utföra en viss uppgift. För det här systemet extraherar modellerna sjukvårdsrelaterade namngivna entiteter och tränas genom att lära sig från märkta data.

I den här artikeln använder vi Language Studio för att demonstrera viktiga begrepp för anpassade Textanalys för hälsa. Som ett exempel skapar vi en anpassad Textanalys för hälsomodell för att extrahera anläggningen eller behandlingsplatsen från korta urladdningsanteckningar.

Förutsättningar

Azure-prenumeration – Skapa en kostnadsfritt

Name	beskrivning
Prenumeration	Din Azure-prenumeration.
Resursgrupp	En resursgrupp som ska innehålla din resurs. Du kan använda en befintlig eller skapa en ny.
Region	Regionen för språkresursen. Till exempel "USA, västra 2".
Name	Ett namn på resursen.
Prisnivå	Prisnivån för din språkresurs. Du kan använda nivån Kostnadsfri (F0) för att prova tjänsten.

Lagringskontovärde	Rekommenderat värde
Lagringskontonamn	Valfritt namn
Storage account type	Standard LRS

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`{API-VERSION}`	Den version av API:et som du anropar. Värdet som refereras här är för den senaste versionen som släppts. Mer information om andra tillgängliga API-versioner finns i Modelllivscykel .	`2022-05-01`

Key	Platshållare	Värde	Exempel
`multilingual`	`true`	Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen och när din modell distribueras kan du fråga modellen på alla språk som stöds (inte nödvändigtvis i dina träningsdokument). Mer information om flerspråkig support finns i språkstöd .	`true`
`projectName`	`{PROJECT-NAME}`	Projektnamn	`myproject`
`storageInputContainerName`	`{CONTAINER-NAME}`	Containerns namn	`mycontainer`
`entities`		Matris som innehåller alla entitetstyper som du har i projektet. Det här är de entitetstyper som kommer att extraheras från dina dokument till.
`category`		Namnet på entitetstypen, som kan vara användardefinierad för nya entitetsdefinitioner eller fördefinierade för fördefinierade entiteter.
`compositionSetting`	`{COMPOSITION-SETTING}`	Regel som definierar hur du hanterar flera komponenter i entiteten. Alternativen är `combineComponents` eller `separateComponents`.	`combineComponents`
`list`		Matris som innehåller alla underlistor som du har i projektet för en specifik entitet. Listor kan läggas till i fördefinierade entiteter eller nya entiteter med inlärda komponenter.
`sublists`	`[]`	Matris som innehåller underlistor. Varje underlista är en nyckel och dess associerade värden.	`[]`
`listKey`	`One`	Ett normaliserat värde för listan över synonymer som ska mappas tillbaka till i förutsägelsen.	`One`
`synonyms`	`[]`	Matris som innehåller alla synonymer	Synonym
`language`	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för synonymen i underlistan. Om projektet är ett flerspråkigt projekt och du vill stödja din lista över synonymer för alla språk i projektet måste du uttryckligen lägga till synonymerna i varje språk. Mer information om språkkoder som stöds finns i Språkstöd .	`en`
`values`	`"EntityNumberone"`, `"FirstEntity"`	En lista över kommaavgränsade strängar som matchas exakt för extrahering och mappning till listnyckeln.	`"EntityNumberone"`, `"FirstEntity"`
`prebuilts`	`MedicationName`	Namnet på den fördefinierade komponenten som fyller i den fördefinierade entiteten. Fördefinierade entiteter läses automatiskt in i projektet som standard, men du kan utöka dem med listkomponenter i din etikettfil.	`MedicationName`
`documents`		Matris som innehåller alla dokument i projektet och en lista över de entiteter som är märkta i varje dokument.	[]
`location`	`{DOCUMENT-NAME}`	Platsen för dokumenten i lagringscontainern. Eftersom alla dokument finns i roten i containern bör detta vara dokumentnamnet.	`doc1.txt`
`dataset`	`{DATASET}`	Testuppsättningen som filen ska gå till när den delas upp före träningen. Möjliga värden för det här fältet är `Train` och `Test`.	`Train`
`regionOffset`		Den inkluderande teckenpositionen i början av texten.	`0`
`regionLength`		Längden på avgränsningsrutan i termer av UTF16-tecken. Utbildningen tar endast hänsyn till data i den här regionen.	`500`
`category`		Den typ av entitet som är associerad med det angivna textintervallet.	`Entity1`
`offset`		Startpositionen för entitetstexten.	`25`
`length`		Längden på entiteten när det gäller UTF16-tecken.	`20`
`language`	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för dokumentet som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om språkkoder som stöds finns i Språkstöd .	`en`

Key	Platshållare	Värde	Exempel
modelLabel	`{MODEL-NAME}`	Modellnamnet som har tilldelats din modell när den har tränats.	`myModel`
trainingConfigVersion	`{CONFIG-VERSION}`	Det här är den modellversion som används för att träna modellen.	`2022-05-01`
evaluationOptions		Alternativ för att dela upp dina data mellan tränings- och testuppsättningar.	`{}`
typ	`percentage`	Dela upp metoder. Möjliga värden är `percentage` eller `manual`. Mer information finns i Träna en modell .	`percentage`
trainingSplitPercentage	`80`	Procentandel av dina taggade data som ska ingå i träningsuppsättningen. Rekommenderat värde är `80`.	`80`
testingSplitPercentage	`20`	Procentandel av dina taggade data som ska ingå i testuppsättningen. Rekommenderat värde är `20`.	`20`

Key	Platshållare	Värde	Exempel
`displayName`	`{JOB-NAME}`	Ditt jobbnamn.	`MyJobName`
`documents`	[{},{}]	Lista över dokument som aktiviteter ska köras på.	`[{},{}]`
`id`	`{DOC-ID}`	Dokumentnamn eller ID.	`doc1`
`language`	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för dokumentet. Om den här nyckeln inte anges förutsätter tjänsten standardspråket för projektet som valdes när projektet skapades. Se språkstöd för en lista över språkkoder som stöds.	`en-us`
`text`	`{DOC-TEXT}`	Dokumentuppgift som aktiviteterna ska köras på.	`Lorem ipsum dolor sit amet`
`tasks`		Lista över uppgifter som vi vill utföra.	`[]`
`taskName`	`Custom Text Analytics for Health Test`	Uppgiftsnamnet	`Custom Text Analytics for Health Test`
`kind`	`CustomHealthcare`	Den typ av projekt eller uppgift som vi försöker utföra	`CustomHealthcare`
`parameters`		Lista över parametrar som ska skickas till uppgiften.
`project-name`	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`deployment-name`	`{DEPLOYMENT-NAME}`	Namnet på distributionen. Det här värdet är skiftlägeskänsligt.	`prod`

Key	Exempelvärde	beskrivning
entiteter	[]	En matris som innehåller alla extraherade entiteter.
entityComponentKind	`prebuiltComponent`	En variabel som anger vilken komponent som returnerade den specifika entiteten. Möjliga värden: `prebuiltComponent`, `learnedComponent`, `listComponent`
förskjutning	`0`	Ett tal som anger startpunkten för den extraherade entiteten genom att indexera över tecknen
längd	`10`	Ett tal som anger längden på den extraherade entiteten i antal tecken.
text	`first entity`	Texten som extraherades för en specifik entitet.
category	`MedicationName`	Namnet på entitetstypen eller kategorin som motsvarar den extraherade texten.
confidenceScore	`0.9`	Ett tal som anger modellens säkerhetsnivå för den extraherade entiteten från 0 till 1 med högre tal som anger högre säkerhet.
assertion	`certainty`	Intyg som är associerade med den extraherade entiteten. Kontroller stöds endast för fördefinierade Textanalys för hälsoentiteter.
name	`Ibuprofen`	Det normaliserade namnet för den entitetslänkning som är associerad med den extraherade entiteten. Entitetslänkning stöds endast för fördefinierade Textanalys för hälsoentiteter.
länkar	[]	En matris som innehåller alla resultat från entitetslänkningen som är associerad med den extraherade entiteten. Entitetslänkning stöds endast för fördefinierade Textanalys för hälsoentiteter.
Datasource	`UMLS`	Referensstandarden som är resultatet av entitetslänkningen som är associerad med den extraherade entiteten. Entitetslänkning stöds endast för fördefinierade Textanalys för hälsoentiteter.
ID	`C0020740`	Referenskoden som är resultatet av entitetens länkning som är associerad med den extraherade entiteten som tillhör den extraherade datakällan. Entitetslänkning stöds endast för fördefinierade Textanalys för hälsoentiteter.
Förbindelser	[]	Matris som innehåller alla extraherade relationer. Relationsextrahering stöds endast för fördefinierade Textanalys för hälsoentiteter.
relationType	`DosageOfMedication`	Kategorin för den extraherade relationen. Relationsextrahering stöds endast för fördefinierade Textanalys för hälsoentiteter.
entiteter	`"Dosage", "Medication"`	Entiteterna som är associerade med den extraherade relationen. Relationsextrahering stöds endast för fördefinierade Textanalys för hälsoentiteter.

Dela via

Snabbstart: anpassade Textanalys för hälsa

Förutsättningar

Skapa en ny Azure AI Language-resurs och Ett Azure-lagringskonto

Skapa en ny resurs från Azure-portalen

Ladda upp exempeldata till blobcontainer

Skapa en anpassad Textanalys för hälsoprojekt

Träna din modell

Distribuera din modell

Testa din modell

Rensa resurser

Förutsättningar

Skapa en ny Azure AI Language-resurs och Ett Azure-lagringskonto

Skapa en ny resurs från Azure-portalen

Ladda upp exempeldata till blobcontainer

Hämta dina resursnycklar och slutpunkt

Skapa en anpassad Textanalys för hälsoprojekt

Projektjobb för utlösare för import

Sidhuvuden

Brödtext

Hämta status för importjobb

Begäran-URL

Sidhuvuden

Träna din modell

Starta träningsjobbet

Sidhuvuden

Begärandetext

Hämta status för träningsjobb

Begäran-URL

Sidhuvuden

Svarstext

Distribuera din modell

Starta distributionsjobbet

Sidhuvuden

Begärandetext

Hämta status för distributionsjobb

Sidhuvuden

Svarstext

Göra förutsägelser med din tränade modell

Skicka en anpassad Textanalys för hälsoaktivitet

Sidhuvuden

Brödtext

Response

Hämta aktivitetsresultat

Sidhuvuden

Svarstext

Rensa resurser

Sidhuvuden

Nästa steg

Feedback

Feedback

Ytterligare resurser