Udostępnij za pośrednictwem


Jak używać automatycznego etykietowania do klasyfikacji tekstu niestandardowego

Proces etykietowania jest ważną częścią przygotowywania zestawu danych. Ponieważ ten proces wymaga dużo czasu i wysiłku, możesz użyć funkcji automatycznego etykietowania, aby automatycznie oznaczyć dokumenty klasami, do których chcesz je sklasyfikować. Obecnie można uruchamiać zadania automatycznego etykietowania na podstawie modelu przy użyciu modeli GPT, w których można natychmiast wyzwolić zadanie automatycznego etykietowania bez wcześniejszego trenowania modelu. Ta funkcja pozwala zaoszczędzić czas i nakład pracy ręcznego etykietowania dokumentów.

Wymagania wstępne

Aby można było używać automatycznego etykietowania za pomocą biblioteki GPT, potrzebne są następujące elementy:


Wyzwalanie zadania automatycznego etykietowania

Po wyzwoleniu zadania automatycznego etykietowania za pomocą biblioteki GPT opłaty są naliczane za zasób usługi Azure OpenAI zgodnie z użyciem. Opłaty są naliczane według szacowanej liczby tokenów w każdym dokumencie, który jest automatycznie obelgowany. Zapoznaj się ze stroną cennika usługi Azure OpenAI , aby uzyskać szczegółowy podział cen na token różnych modeli.

  1. W menu nawigacji po lewej stronie wybierz pozycję Etykietowanie danych.

  2. Wybierz przycisk Autolabel w okienku Działanie po prawej stronie.

    Zrzut ekranu przedstawiający sposób wyzwalania zadania autotagowania z okienka działań.

  3. Wybierz pozycję Autolabel with GPT (Autolabel with GPT), a następnie wybierz przycisk Next (Dalej).

    Zrzut ekranu przedstawiający wybór modelu do automatycznego etykietowania.

  4. Wybierz zasób i wdrożenie usługi Azure OpenAI. Aby kontynuować , musisz utworzyć zasób usługi Azure OpenAI i wdrożyć model .

    Zrzut ekranu przedstawiający sposób wybierania zasobów i wdrożeń openAI

  5. Wybierz klasy, które chcesz uwzględnić w zadaniu automatycznego etykietowania. Domyślnie wszystkie klasy są zaznaczone. Opisowe nazwy klas i dołączanie przykładów dla każdej klasy jest zalecane w celu uzyskania dobrej jakości etykietowania za pomocą biblioteki GPT.

    Zrzut ekranu przedstawiający etykiety, które mają być uwzględnione w zadaniu autotagowania.

  6. Wybierz dokumenty, które mają być automatycznie oznaczone etykietą. Zaleca się wybranie niezaznakowanych dokumentów z filtru.

    Uwaga

    • Jeśli dokument został automatycznie oznaczony etykietą, ale ta etykieta została już zdefiniowana przez użytkownika, używana jest tylko etykieta zdefiniowana przez użytkownika.
    • Dokumenty można wyświetlić, klikając nazwę dokumentu.

    Zrzut ekranu przedstawiający dokumenty, które mają być uwzględnione w zadaniu autotagowania.

  7. Wybierz pozycję Uruchom zadanie , aby wyzwolić zadanie automatycznego etykietowania. Powinno nastąpić przekierowanie do strony automatycznego etykietowania wyświetlającej zainicjowane zadania automatycznego etykietowania. Automatyczne etykietowanie zadań może potrwać od kilku sekund do kilku minut, w zależności od liczby uwzględnionych dokumentów.

    Zrzut ekranu przedstawiający ekran przeglądu zadania autotagu.


Przeglądanie dokumentów z etykietami automatycznymi

Po zakończeniu zadania automatycznego etykietowania można wyświetlić dokumenty wyjściowe na stronie Etykietowanie danych programu Language Studio. Wybierz pozycję Przejrzyj dokumenty z autolabelami , aby wyświetlić dokumenty z zastosowanym filtrem z etykietą automatyczną .

Zrzut ekranu przedstawiający dokumenty z etykietami automatycznymi

Dokumenty, które zostały automatycznie sklasyfikowane, sugerowały etykiety w okienku działań wyróżnione na fioletowo. Każda sugerowana etykieta ma dwie selektory (znacznik wyboru i ikonę anulowania), które umożliwiają akceptowanie lub odrzucanie etykiety automatycznej.

Po zaakceptowaniu etykiety kolor fioletowy zmieni się na domyślny niebieski, a etykieta zostanie uwzględniona w każdym kolejnym trenowaniu modelu, który staje się etykietą zdefiniowaną przez użytkownika.

Po zaakceptowaniu lub odrzuceniu etykiet dla dokumentów z etykietami automatycznymi wybierz pozycję Zapisz etykiety , aby zastosować zmiany.

Uwaga

  • Zalecamy automatyczne weryfikowanie dokumentów oznaczonych etykietami przed ich zaakceptowaniem.
  • Wszystkie etykiety, które nie zostały zaakceptowane, są usuwane podczas trenowania modelu.

Zrzut ekranu przedstawiający sposób akceptowania i odrzucania automatycznie etykietowanych dokumentów.

Następne kroki