Udostępnij za pośrednictwem


Co to jest niestandardowa klasyfikacja tekstu?

Niestandardowa klasyfikacja tekstu jest jedną z niestandardowych funkcji oferowanych przez język azure AI. Jest to oparta na chmurze usługa interfejsu API, która stosuje analizę uczenia maszynowego, aby umożliwić tworzenie niestandardowych modeli pod kątem zadań klasyfikacji tekstu.

Niestandardowa klasyfikacja tekstu umożliwia użytkownikom tworzenie niestandardowych modeli sztucznej inteligencji w celu klasyfikowania tekstu w niestandardowych klasach wstępnie zdefiniowanych przez użytkownika. Tworząc niestandardowy projekt klasyfikacji tekstu, deweloperzy mogą iteracyjnie oznaczać dane, trenować, oceniać i poprawiać wydajność modelu przed udostępnieniem ich do użycia. Jakość oznaczonych danych znacznie wpływa na wydajność modelu. Aby uprościć tworzenie i dostosowywanie modelu, usługa oferuje niestandardowy portal internetowy, do którego można uzyskać dostęp za pośrednictwem programu Language Studio. Możesz łatwo rozpocząć pracę z usługą, wykonując kroki opisane w tym przewodniku Szybki start.

Niestandardowa klasyfikacja tekstu obsługuje dwa typy projektów:

  • Klasyfikacja pojedynczej etykiety — można przypisać pojedynczą klasę dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy można sklasyfikować tylko jako "Romans" lub "Komedia".
  • Klasyfikacja wielu etykiet — można przypisać wiele klas dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy można sklasyfikować jako "Komedia" lub "Romans" i "Komedia".

Ta dokumentacja zawiera następujące typy artykułów:

  • Przewodniki Szybki start to instrukcje wprowadzające, które ułatwiają wysyłanie żądań do usługi.
  • Pojęcia zawierają wyjaśnienia funkcji i funkcji usługi.
  • Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Przykładowe scenariusze użycia

Niestandardowa klasyfikacja tekstu może być używana w wielu scenariuszach w różnych branżach:

Automatyczne wiadomości e-mail lub klasyfikacja biletów

Centra pomocy technicznej wszystkich typów otrzymują dużą liczbę wiadomości e-mail lub biletów zawierających bez struktury, dowolny tekst i załączniki. Terminowe przeglądanie, potwierdzanie i kierowanie do ekspertów wewnętrznych zespołów ma kluczowe znaczenie. Klasyfikacja wiadomości e-mail w tej skali wymaga, aby osoby przeglądały odpowiednie działy i kierowały je do odpowiednich działów, co zajmuje trochę czasu i zasobów. Niestandardowa klasyfikacja tekstu może służyć do analizowania tekstu przychodzącego oraz klasyfikowania i kategoryzowania zawartości, która ma być automatycznie kierowana do odpowiednich działów w celu wykonania dalszych działań.

Wyszukiwanie jest podstawą dowolnej aplikacji, która wyświetla zawartość tekstowa dla użytkowników. Typowe scenariusze obejmują wyszukiwanie katalogów lub dokumentów, wyszukiwanie produktów w sprzedaży detalicznej lub wyszukiwanie wiedzy na potrzeby nauki o danych. Wiele przedsiębiorstw w różnych branżach stara się stworzyć bogate środowisko wyszukiwania w prywatnej, heterogenicznej zawartości, która obejmuje zarówno dokumenty ustrukturyzowane, jak i nieustrukturyzowane. W ramach potoku deweloperzy mogą użyć niestandardowej klasyfikacji tekstu do kategoryzowania tekstu w klasach, które są istotne dla ich branży. Przewidywane klasy mogą służyć do wzbogacania indeksowania pliku w celu uzyskania bardziej dostosowanego środowiska wyszukiwania.

Cykl projektowania projektu

Tworzenie niestandardowego projektu klasyfikacji tekstu zwykle obejmuje kilka różnych kroków.

Cykl życia programowania

Wykonaj następujące kroki, aby jak najlepiej wykorzystać model:

  1. Zdefiniuj schemat: Poznaj dane i zidentyfikuj klasy , które chcesz rozróżnić, aby uniknąć niejednoznaczności.

  2. Etykietowanie danych: Jakość etykietowania danych jest kluczowym czynnikiem w określaniu wydajności modelu. Dokumenty należące do tej samej klasy powinny zawsze mieć tę samą klasę, jeśli masz dokument, który może należeć do dwóch klas, używa projektów klasyfikacji wielu etykiet. Unikaj niejednoznaczności klas, upewnij się, że klasy są wyraźnie rozdzielne od siebie, szczególnie w przypadku projektów klasyfikacji pojedynczej etykiety.

  3. Trenowanie modelu: Model zaczyna uczyć się na podstawie danych oznaczonych etykietami.

  4. Wyświetlanie wydajności modelu: wyświetl szczegóły oceny modelu, aby określić, jak dobrze działa w przypadku wprowadzenia nowych danych.

  5. Wdróż model: wdrażanie modelu udostępnia go do użycia za pośrednictwem interfejsu API analizowania.

  6. Klasyfikowanie tekstu: użyj niestandardowego modelu do wykonywania niestandardowych zadań klasyfikacji tekstu.

Dokumentacja referencyjna i przykłady kodu

Jeśli używasz niestandardowej klasyfikacji tekstu, zapoznaj się z następującą dokumentacją referencyjną i przykładami dla języka azure AI:

Opcja/język programowania Dokumentacja referencyjna Przykłady
Interfejsy API REST (tworzenie) Dokumentacja interfejsu API REST
Interfejsy API REST (środowisko uruchomieniowe) Dokumentacja interfejsu API REST
C# (środowisko uruchomieniowe) Dokumentacja języka C# Przykłady w języku C# — przykłady klasyfikacji pojedynczej etykiety C# — klasyfikacja wielu etykiet
Java (środowisko uruchomieniowe) Dokumentacja języka Java Przykłady języka Java — przykłady klasyfikacji pojedynczej etykiety Java — klasyfikacja wielu etykiet
JavaScript (środowisko uruchomieniowe) Dokumentacja języka JavaScript Przykłady języka JavaScript — przykłady klasyfikacji pojedynczej etykiety JavaScript — klasyfikacja wielu etykiet
Python (środowisko uruchomieniowe) Dokumentacja języka Python Przykłady języka Python — przykłady klasyfikacji pojedynczej etykiety w języku Python — klasyfikacja wielu etykiet

Odpowiedzialne AI

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które będą jej używać, osoby, których to dotyczy, oraz środowisko, w którym jest wdrażana. Przeczytaj notatkę dotyczącą przezroczystości niestandardowej klasyfikacji tekstu, aby dowiedzieć się więcej na temat odpowiedzialnego używania i wdrażania sztucznej inteligencji w systemach. Więcej informacji można również znaleźć w następujących artykułach:

Następne kroki