A custom Text Analytics for health modell betanítása

Cikk
12/19/2023

A betanítás az a folyamat, amelyben a modell tanul a címkézett adatokból. A betanítás befejezése után megtekintheti a modell teljesítményét , és megállapíthatja, hogy javítania kell-e a modellt.

Modell betanításához elindít egy betanítási feladatot, és csak a sikeresen befejezett feladatok hoznak létre modellt. A betanítási feladatok hét nap után lejárnak, ami azt jelenti, hogy ez után nem fogja tudni lekérni a feladat részleteit. Ha a betanítási feladat sikeresen befejeződött, és létrejött egy modell, a modellre nincs hatással. Egyszerre csak egy betanítási feladat futhat, és nem indíthat el más feladatokat ugyanabban a projektben.

A betanítási idő néhány dokumentum kezelésekor néhány perctől akár több óráig is tarthat az adathalmaz méretétől és a séma összetettségétől függően.

Előfeltételek

Sikeresen létrehozott projekt egy konfigurált Azure Blob Storage-fiókkal
A tárfiókba feltöltött szöveges adatok.
Címkézett adatok

További információért tekintse meg a projektfejlesztési életciklust .

Adatok felosztása

A betanítási folyamat megkezdése előtt a projekt címkézett dokumentumai betanítási és tesztelési készletre vannak osztva. Mindegyik más-más funkciót szolgál. A betanítási készlet a modell betanításához használatos. Ez az a készlet, amelyből a modell megtanulja a címkézett entitásokat, és hogy milyen szövegtartományokat kell kinyerni entitásként. A tesztelési készlet egy olyan vakkészlet, amely nem a betanítás során, hanem csak az értékelés során kerül bevezetésre a modellbe. A modell betanításának sikeres befejezése után a modell használatával előrejelzéseket készíthet a tesztelésben szereplő dokumentumokból, és ezek alapján kiszámítja a kiértékelési metrikákat . A modell betanítása és kiértékelése csak a tanult összetevőkkel rendelkező újonnan definiált entitásokra vonatkozik; ezért az állapotentitások Text Analytics ki vannak zárva a modell betanításából és kiértékeléséből, mivel azok előre összeállított összetevőkkel rendelkező entitások. Ajánlott gondoskodni arról, hogy az összes címkézett entitás megfelelően szerepeljen a betanítási és a tesztelési csoportban.

Az állapothoz készült egyéni Text Analytics két módszert támogat az adatfelosztáshoz:

A tesztelési csoport automatikus felosztása a betanítási adatokból:A rendszer a kiválasztott százalékos arányoknak megfelelően felosztja a címkézett adatokat a betanítási és a tesztelési készletek között. Az ajánlott százalékos felosztás 80% a betanításhoz és 20% teszteléshez.

Megjegyzés

Ha a Tesztelési csoport automatikus felosztása a betanítási adatokból beállítást választja, csak a betanítási készlethez rendelt adatok lesznek felosztva a megadott százalékos értékek szerint.

A betanítási és tesztelési adatok manuális felosztása: Ez a módszer lehetővé teszi a felhasználók számára, hogy meghatározzák, mely címkézett dokumentumok melyik készlethez tartoznak. Ez a lépés csak akkor engedélyezett, ha az adatok címkézése során dokumentumokat adott hozzá a tesztelési csoporthoz.

A modell betanítása a Language Studióban:

A bal oldali menüben válassza a Betanítási feladatok lehetőséget.
A felső menüben válassza a Betanítási feladat indítása lehetőséget.
Válassza az Új modell betanítása lehetőséget, és írja be a modell nevét a szövegmezőbe. Meglévő modellt úgy is felülírhat , ha ezt a lehetőséget választja, és kiválasztja azt a modellt, amelyet felül szeretne írni a legördülő menüből. A betanított modellek felülírása visszafordíthatatlan, de az új modell üzembe helyezéséig nem lesz hatással az üzembe helyezett modellekre.
Válassza ki az adatfelosztási módszert. A tesztelési készlet automatikus felosztása betanítási adatokból lehetőséget választhatja, ahol a rendszer a megadott százalékos arányok szerint felosztja a címkézett adatokat a betanítási és a tesztelési készletek között. Vagy használhatja a betanítási és tesztelési adatok manuális felosztását is, ez a beállítás csak akkor engedélyezett, ha dokumentumokat adott hozzá a tesztelési csoporthoz. Az adatfelosztással kapcsolatos információkért tekintse meg az adatfeliratozást és a modellek betanítását ismertető cikket.
Válassza a Betanítása gombot.
Ha kiválasztja a betanítási feladat azonosítóját a listából, megjelenik egy oldalsó panel, ahol ellenőrizheti a betanítási folyamatot, a feladat állapotát és a feladat egyéb részleteit.
Megjegyzés
- Csak a sikeres betanítási feladatok hoznak létre modelleket.
- A betanítás eltarthat néhány perc és több óra között a címkézett adatok méretétől függően.
- Egyszerre csak egy betanítási feladat futtatható. Amíg a futó feladat be nem fejeződik, nem lehet másik betanítási feladatot elindítani ugyanabban a projektben.

Betanítási feladat indítása

Post-kérés elküldése a következő URL-cím, fejlécek és JSON-törzs használatával egy betanítási feladat elküldéséhez. Cserélje le a helyőrző értékeket a saját értékeire.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Helyőrző	Érték	Példa
`{ENDPOINT}`	Az API-kérelem hitelesítésének végpontja.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	A projekt neve. Ez az érték megkülönbözteti a kis- és nagybetűk értékét.	`myProject`
`{API-VERSION}`	A meghívni kívánt API verziója. Az itt hivatkozott érték a legújabb kiadott verzióra hivatkozik. Az egyéb elérhető API-verziókról további információt a Modell életciklusa című témakörben talál.	`2022-05-01`

Fejlécek

A kérés hitelesítéséhez használja az alábbi fejlécet.

Kulcs	Érték
`Ocp-Apim-Subscription-Key`	Az erőforrás kulcsa. Az API-kérések hitelesítésére szolgál.

A kérés törzse

Használja a következő JSON-t a kérelem törzsében. A modell a {MODEL-NAME} betanítás befejezését követően kapja meg. Csak a sikeres betanítási feladatok hoznak létre modelleket.

{
	"modelLabel": "{MODEL-NAME}",
	"trainingConfigVersion": "{CONFIG-VERSION}",
	"evaluationOptions": {
		"kind": "percentage",
		"trainingSplitPercentage": 80,
		"testingSplitPercentage": 20
	}
}

Kulcs	Helyőrző	Érték	Példa
modelLabel	`{MODEL-NAME}`	A modellhez a sikeres betanítása után hozzárendelt modellnév.	`myModel`
trainingConfigVersion	`{CONFIG-VERSION}`	Ez az a modellverzió , amely a modell betanításakor használatos.	`2022-05-01`
evaluationOptions		Lehetőség az adatok betanítási és tesztelési csoportokra való felosztására.	`{}`
Fajta	`percentage`	Felosztási metódusok. A lehetséges értékek: `percentage` és `manual`. További információért lásd : Modell betanítása .	`percentage`
trainingSplitPercentage	`80`	A betanítási készletbe felvenni kívánt címkézett adatok százalékos aránya. Ajánlott érték: `80`.	`80`
testingSplitPercentage	`20`	A tesztelési csoportban szerepeltetni kívánt címkézett adatok százalékos aránya. Ajánlott érték: `20`.	`20`

Megjegyzés

A trainingSplitPercentage és testingSplitPercentage értékre csak akkor van szükség, ha Kind az értékre percentage van állítva, és a két százalékösszegnek 100-nak kell lennie.

Az API-kérés elküldése után egy 202 válasz jelenik meg, amely jelzi, hogy a feladat megfelelően lett elküldve. A válaszfejlécekben bontsa ki az location értéket. Formátuma a következő:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} a kérés azonosítására szolgál, mivel ez a művelet aszinkron. Ezzel az URL-címmel lekérheti a betanítás állapotát.

Betanítási feladat állapotának lekérése

A betanítás a betanítási adatok méretétől és a séma összetettségétől függően eltarthat egy ideig. A következő kéréssel továbbra is lekérdezheti a betanítási feladat állapotát, amíg sikeresen be nem fejeződik.

Az alábbi GET kéréssel lekérheti a modell betanítási folyamatának állapotát. Cserélje le az alábbi helyőrző értékeket a saját értékeire.

URL-cím kérése

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Helyőrző	Érték	Példa
`{ENDPOINT}`	Az API-kérés hitelesítésének végpontja.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	A projekt neve. Ez az érték megkülönbözteti a kis- és nagybetűk értékét.	`myProject`
`{JOB-ID}`	A modell betanítási állapotának helyének azonosítója. Ez az érték az `location` előző lépésben kapott fejlécértékben van.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	A hívott API verziója. Az itt hivatkozott érték a legújabb kiadott verzióhoz tartozik. A többi elérhető API-verzióról további információt a Modell életciklusa című témakörben talál.	`2022-05-01`

Fejlécek

A kérés hitelesítéséhez használja az alábbi fejlécet.

Kulcs	Érték
`Ocp-Apim-Subscription-Key`	Az erőforrás kulcsa. Az API-kérések hitelesítéséhez használatos.

Válasz törzse

A kérés elküldése után a következő választ kapja.

{
  "result": {
    "modelLabel": "{MODEL-NAME}",
    "trainingConfigVersion": "{CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "{JOB-ID}",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Betanítási feladat megszakítása

Language Studio
REST API-k

Ha le szeretne mondani egy betanítási feladatot a Language Studióban, lépjen a Betanítási feladatok lapra . Válassza ki a megszakítani kívánt betanítási feladatot, majd a felső menüben válassza a Mégse lehetőséget.

Hozzon létre egy POST-kérést az alábbi URL-cím, fejlécek és JSON-törzs használatával egy betanítási feladat megszakításához.

URL-cím kérése

Az API-kérés létrehozásakor használja az alábbi URL-címet. Cserélje le az alábbi helyőrző értékeket a saját értékeire.

{Endpoint}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Helyőrző	Érték	Példa
`{ENDPOINT}`	Az API-kérés hitelesítésének végpontja.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	A projekt neve. Ez az érték megkülönbözteti a kis- és nagybetűk értékét.	`EmailApp`
`{JOB-ID}`	Ez az érték a betanítási feladat azonosítója.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	A hívott API verziója. A hivatkozott érték a legújabb kiadású modellverzióhoz tartozik.	`2022-05-01`

Fejlécek

A kérés hitelesítéséhez használja az alábbi fejlécet.

Kulcs	Érték
`Ocp-Apim-Subscription-Key`	Az erőforrás kulcsa. Az API-kérések hitelesítéséhez használatos.

Az API-kérés elküldése után egy 202-ben kapott választ kap a Operation-Location feladat állapotának ellenőrzésére szolgáló fejléccel.

Következő lépések

A betanítás befejezése után megtekintheti a modell teljesítményét , ha szükséges, igény szerint javíthatja a modellt. Miután elégedett a modellel, üzembe helyezheti azt, és elérhetővé teheti az entitások szövegből való kinyeréséhez .

Megosztás a következőn keresztül:

A custom Text Analytics for health modell betanítása

Előfeltételek

Adatok felosztása

Modell betanítása

Betanítási feladat indítása

Fejlécek

A kérés törzse

Betanítási feladat állapotának lekérése

URL-cím kérése

Fejlécek

Válasz törzse

Betanítási feladat megszakítása

URL-cím kérése

Fejlécek

Következő lépések

Visszajelzés

Visszajelzés

További források