Wyszkol swój niestandardowy model rozpoznawania nazwanych jednostek

Trenowanie to proces, w którym model uczy się na podstawie oznaczonych danych. Po zakończeniu trenowania będzie można wyświetlić wydajność modelu, aby określić, czy trzeba poprawić model.

Aby wytrenować model, należy rozpocząć zadanie szkoleniowe i utworzyć model tylko pomyślnie ukończone zadania. Zadania szkoleniowe wygasają po siedmiu dniach, co oznacza, że nie będzie można pobrać szczegółów zadania po tym czasie. Jeśli zadanie trenowania zostało ukończone pomyślnie i model został utworzony, model nie jest dotknięty. Jednocześnie można uruchomić tylko jedno zadanie szkoleniowe i nie można uruchomić innych zadań w tym samym projekcie.

Czasy trenowania różnią się. Trenowanie może trwać od kilku minut, w przypadku obsługi kilku dokumentów lub kilku godzin, w zależności od rozmiaru zestawu danych i złożoności schematu.

Wymagania wstępne

Pomyślnie utworzono projekt przy użyciu skonfigurowanego konta usługi Azure Blob Storage
Dane tekstowe załadowane na konto magazynowe.
Dane oznaczone etykietami

Zobacz cykl projektowania projektu.

Dzielenie danych

Przed rozpoczęciem procesu trenowania dokumenty oznaczone etykietą w projekcie są podzielone na zestaw szkoleniowy i zestaw testów. Każdy z nich pełni inną funkcję. Zestaw szkoleniowy jest używany podczas trenowania modelu. Jest to zestaw, z którego model uczy się oznaczonych jednostek i zakresów tekstu, które mają być wyodrębniane jako jednostki. Zestaw testów to zestaw ślepy, który nie jest wprowadzany do modelu podczas trenowania, ale tylko podczas oceny. Po pomyślnym zakończeniu trenowania modelu model jest używany do przewidywania z dokumentów testowych, a metryki oceny są obliczane. Zalecamy upewnienie się, że wszystkie jednostki są odpowiednio reprezentowane w zestawie trenowania i testowania.

Niestandardowa funkcja NER obsługuje dwie metody dzielenia danych:

Automatyczne dzielenie zestawu testów na podstawie danych treningowych: system dzieli dane oznaczone etykietami między zestawami treningowymi i testowymi zgodnie z wybranymi wartościami procentowymi. Zalecany podział procentowy wynosi 80% na potrzeby trenowania i 20% na potrzeby testowania.

Uwaga

Jeśli wybierzesz opcję Automatycznie rozdzielając zestaw testów z danych treningowych , tylko dane przypisane do zestawu treningowego zostaną podzielone zgodnie z podanymi wartościami procentowymi.

Użyj ręcznego podziału danych treningowych i testowych: ta metoda umożliwia użytkownikom zdefiniowanie, które dokumenty z etykietami powinny należeć do tego zestawu. Ten krok jest włączony tylko w przypadku dodania dokumentów do zestawu testów podczas etykietowania danych.

Trenowanie modelu (interfejs API REST)

Po oznaczeniu danych etykietami i skonfigurowaniu ustawień podziału danych możesz rozpocząć trenowanie niestandardowego modelu NER przy użyciu interfejsu API REST. Proces treningu obejmuje przesłanie żądania zadania szkoleniowego i monitorowanie jego postępu aż do ukończenia. Ta sekcja zawiera wywołania interfejsu API potrzebne do zainicjowania szkolenia i sprawdzenia stanu zadania szkoleniowego.

Rozpoczynanie zadania szkoleniowego

Prześlij żądanie POST przy użyciu następującego adresu URL, nagłówków i treści JSON, aby przesłać zadanie szkoleniowe. Zastąp wartości zastępcze własnymi wartościami.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Symbol zastępczy	Wartość	Przykład
`{ENDPOINT}`	Punkt końcowy do uwierzytelniania żądania interfejsu API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.	`myProject`
`{API-VERSION}`	Wersja wywoływanego interfejsu API. Wartość, do których odwołuje się, dotyczy najnowszej wersji wydanej. Aby uzyskać więcej informacji, zobaczCykl życia modelu.	`2022-05-01`

Nagłówki

Użyj następującego nagłówka, aby uwierzytelnić żądanie.

Klucz	Wartość
`Ocp-Apim-Subscription-Key`	Twój klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.

Treść żądania

Użyj następującego kodu JSON w treści żądania. Model jest przedstawiany jako {MODEL-NAME} po zakończeniu trenowania. Tylko pomyślne zadania szkoleniowe tworzą modele.

{
    "modelLabel": "{MODEL-NAME}",
    "trainingConfigVersion": "{CONFIG-VERSION}",
    "evaluationOptions": {
        "kind": "percentage",
        "trainingSplitPercentage": 80,
        "testingSplitPercentage": 20
    }
}

Klucz	Symbol zastępczy	Wartość	Przykład
modelLabel	`{MODEL-NAME}`	Nazwa modelu przypisana po pomyślnym wytrenowaniu.	`myModel`
wersjaKonfiguracjiTreningowej	`{CONFIG-VERSION}`	Jest to wersja modelu używana do trenowania modelu.	`2022-05-01`
opcje oceny		Opcja dzielenia danych między zestawy trenowania i testowania.	`{}`
rodzaj / miły	`percentage`	Metody podzielone. Możliwe wartości to `percentage` lub `manual`. Aby uzyskać więcej informacji, zobaczHow to train a model (Jak trenować model).	`percentage`
procent podziału szkolenia	`80`	Procent oznakowanych danych, które mają zostać uwzględnione w zestawie treningowym. Zalecana wartość to `80`.	`80`
testingSplitPercentage	`20`	Procent oznakowanych danych, które mają zostać uwzględnione w zestawie testów. Zalecana wartość to `20`.	`20`

Uwaga

Wartości trainingSplitPercentage i testingSplitPercentage są wymagane tylko wtedy, gdy Kind jest ustawiona wartość percentage , a suma obu wartości procentowych powinna być równa 100.

Po wysłaniu żądania interfejsu API otrzymasz odpowiedź wskazującą 202 , że zadanie zostało przesłane poprawnie. W nagłówkach odpowiedzi wyodrębnij wartość location sformatowaną w następujący sposób:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} służy do identyfikowania żądania, ponieważ ta operacja jest asynchroniczna. Możesz użyć tego adresu URL, aby uzyskać stan trenowania.

Uzyskiwanie stanu zadania szkoleniowego (REST API)

Trenowanie może zająć trochę czasu, w zależności od rozmiaru danych treningowych i złożoności schematu. Następujące żądanie umożliwia kontynuowanie sondowania stanu zadania szkoleniowego do momentu pomyślnego ukończenia.

Użyj następującego żądania GET , aby uzyskać stan postępu trenowania modelu. Zastąp wartości zastępcze własnymi wartościami.

Adres URL żądania

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Symbol zastępczy	Wartość	Przykład
`{ENDPOINT}`	Punkt końcowy do uwierzytelniania żądania interfejsu API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.	`myProject`
`{JOB-ID}`	Identyfikator dla ustalenia statusu treningu modelu. Ta wartość znajduje się w wartości nagłówka `location` otrzymanej w poprzednim kroku.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Wersja wywoływanego interfejsu API. Wartość, do których odwołuje się, dotyczy najnowszej wersji wydanej. Aby uzyskać więcej informacji, zobaczCykl życia modelu.	`2022-05-01`

Nagłówki

Użyj następującego nagłówka, aby uwierzytelnić żądanie.

Klucz	Wartość
`Ocp-Apim-Subscription-Key`	Twój klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.

Treść odpowiedzi

Po wysłaniu żądania otrzymasz następującą odpowiedź.

{
  "result": {
    "modelLabel": "{MODEL-NAME}",
    "trainingConfigVersion": "{CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "{JOB-ID}",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Anulowanie zadania trenowania (interfejs API REST)

Jeśli musisz zatrzymać zadanie trenowania, które jest obecnie w toku, możesz anulować je przy użyciu interfejsu API REST. Anulowanie zadania szkoleniowego jest przydatne w przypadku wykrycia problemu z danymi lub konfiguracją i podjęcia poprawek przed ponownym uruchomieniem procesu trenowania.

Utwórz żądanie POST przy użyciu następującego adresu URL, nagłówków i treści JSON, aby anulować zadanie szkoleniowe.

Adres URL żądania

Podczas tworzenia żądania interfejsu API użyj następującego adresu URL. Zastąp wartości zastępcze własnymi wartościami.

{Endpoint}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Symbol zastępczy	Wartość	Przykład
`{ENDPOINT}`	Punkt końcowy do uwierzytelniania żądania interfejsu API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.	`EmailApp`
`{JOB-ID}`	Ta wartość to identyfikator zadania szkoleniowego.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Wersja wywoływanego interfejsu API. Wartość, do których odwołuje się, dotyczy najnowszej wydanej wersji modelu.	`2022-05-01`

Nagłówki

Użyj następującego nagłówka, aby uwierzytelnić żądanie.

Klucz	Wartość
`Ocp-Apim-Subscription-Key`	Twój klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.

Po wysłaniu żądania API otrzymasz odpowiedź 202 z nagłówkiem Operation-Location służącym do sprawdzania stanu zadania.

Następne kroki

Po zakończeniu trenowania będzie można wyświetlić wydajność modelu, aby opcjonalnie poprawić model w razie potrzeby. Gdy model jest zadowalający, możesz go wdrożyć, udostępniając go do wyodrębniania jednostek z tekstu.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-12-17

Udostępnij przez

Wyszkol swój niestandardowy model rozpoznawania nazwanych jednostek

Wymagania wstępne

Dzielenie danych

Trenowanie modelu (interfejs API REST)

Rozpoczynanie zadania szkoleniowego

Nagłówki

Treść żądania

Uzyskiwanie stanu zadania szkoleniowego (REST API)

Adres URL żądania

Nagłówki

Treść odpowiedzi

Anulowanie zadania trenowania (interfejs API REST)

Adres URL żądania

Nagłówki

Następne kroki

Sprzężenie zwrotne

Dodatkowe źródła