Udostępnij za pośrednictwem


Niestandardowe definicje i terminy rozpoznawania nazwanych jednostek

Skorzystaj z tego artykułu, aby dowiedzieć się więcej o niektórych definicjach i terminach, które mogą wystąpić podczas korzystania z niestandardowego modułu NER.

Jednostka

Jednostka jest zakresem tekstu, który wskazuje określony typ informacji. Zakres tekstu może składać się z co najmniej jednego wyrazu. W zakresie niestandardowego modułu NER jednostki reprezentują informacje, które użytkownik chce wyodrębnić z tekstu. Deweloperzy tagują jednostki w danych przy użyciu wymaganych jednostek przed przekazaniem ich do modelu na potrzeby trenowania. Na przykład "Numer faktury", "Data rozpoczęcia", "Numer przesyłki", "Miejsce urodzenia", "Miasto pochodzenia", "Nazwa dostawcy" lub "Adres klienta".

Na przykład w zdaniu "John pożyczył 25 000 USD od Freda". Jednostki mogą być następujące:

Nazwa/typ jednostki Jednostka
Nazwa kredytobiorcy Michał
Nazwa pożyczkodawcy Fred
Kwota pożyczki 25 000 USD

Wynik F1

Wynik F1 jest funkcją precyzji i kompletności. Jest to potrzebne, gdy szukasz równowagi między precyzją a kompletnością.

Model

Model jest obiektem, który jest szkolony do wykonywania określonego zadania, w tym przypadku rozpoznawania jednostek niestandardowych. Modele są trenowane przez dostarczanie danych oznaczonych etykietami do nauki, dzięki czemu mogą być później używane do zadań rozpoznawania.

  • Trenowanie modelu to proces nauczania modelu, który należy wyodrębnić na podstawie danych oznaczonych etykietami.
  • Ocena modelu to proces wykonywany bezpośrednio po trenowaniu, aby wiedzieć, jak dobrze działa model.
  • Wdrożenie to proces przypisywania modelu do wdrożenia w celu udostępnienia go do użycia za pośrednictwem interfejsu API przewidywania.

Dokładność

Mierzy dokładność/dokładność modelu. Jest to stosunek między poprawnie zidentyfikowanych alarmów (prawdziwie dodatnich) i wszystkich zidentyfikowanych alarmów. Metryka precyzji pokazuje, ile klas przewidywanych jest poprawnie oznaczonych etykietami.

Project

Projekt to obszar roboczy umożliwiający tworzenie niestandardowych modeli uczenia maszynowego na podstawie Twoich danych. Dostęp do projektu można uzyskać tylko do Ciebie i innych osób, które mają dostęp do używanego zasobu platformy Azure. W ramach wymagań wstępnych dotyczących tworzenia projektu wyodrębniania jednostek niestandardowych należy połączyć zasób z kontem magazynu przy użyciu zestawu danych podczas tworzenia nowego projektu. Projekt automatycznie uwzględnia wszystkie .txt pliki dostępne w kontenerze.

W projekcie można wykonać następujące czynności:

  • Oznacz dane etykietami: proces etykietowania danych w taki sposób, aby podczas trenowania modelu dowiedział się, co chcesz wyodrębnić.
  • Kompilowanie i trenowanie modelu: podstawowy krok projektu, w którym model zaczyna uczyć się na podstawie oznaczonych danych.
  • Wyświetlanie szczegółów oceny modelu: Przejrzyj wydajność modelu, aby zdecydować, czy istnieje miejsce na poprawę, czy wyniki są zadowalające.
  • Wdrożenie: po przejrzeniu wydajności modelu i podjęciu decyzji, że może on być używany w danym środowisku, należy przypisać go do wdrożenia, aby go użyć. Przypisanie modelu do wdrożenia udostępnia go do użycia za pośrednictwem interfejsu API przewidywania.
  • Model testowy: po wdrożeniu modelu przetestuj wdrożenie w programie Language Studio , aby zobaczyć, jak będzie działać w środowisku produkcyjnym.

Recall

Mierzy zdolność modelu do przewidywania rzeczywistych dodatnich klas. Jest to stosunek między przewidywanymi wartościami prawdziwie dodatnimi a tym, co zostało rzeczywiście oznaczone. Metryka kompletności pokazuje, ile z przewidywanych klas jest poprawnych.

Następne kroki