Co to jest niestandardowa klasyfikacja tekstu?

Niestandardowa klasyfikacja tekstu jest jedną z niestandardowych funkcji oferowanych przez język sztucznej inteligencji platformy Azure. Jest to oparta na chmurze usługa interfejsu API, która stosuje inteligencję uczenia maszynowego, aby umożliwić tworzenie niestandardowych modeli pod kątem zadań klasyfikacji tekstu.

Niestandardowa klasyfikacja tekstu umożliwia użytkownikom tworzenie niestandardowych modeli sztucznej inteligencji w celu klasyfikowania tekstu do niestandardowych klas wstępnie zdefiniowanych przez użytkownika. Tworząc niestandardowy projekt klasyfikacji tekstu, deweloperzy mogą iteracyjnie oznaczać dane, trenować, oceniać i poprawiać wydajność modelu przed udostępnieniem ich do użycia. Jakość oznaczonych danych znacznie wpływa na wydajność modelu. Aby uprościć tworzenie i dostosowywanie modelu, usługa oferuje niestandardowy portal internetowy, do którego można uzyskać dostęp za pośrednictwem programu Language Studio. Możesz łatwo rozpocząć pracę z usługą, wykonując kroki opisane w tym przewodniku Szybki start.

Niestandardowa klasyfikacja tekstu obsługuje dwa typy projektów:

  • Klasyfikacja z pojedynczą etykietą — można przypisać pojedynczą klasę dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy może być klasyfikowany tylko jako "Romans" lub "Komedia".
  • Klasyfikacja wielu etykiet — można przypisać wiele klas dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy można sklasyfikować jako "Komedia" lub "Romans" i "Komedia".

Ta dokumentacja zawiera następujące typy artykułów:

  • Przewodniki Szybki start zawierają instrukcje wprowadzające, które ułatwiają wysyłanie żądań do usługi.
  • Pojęcia zawierają wyjaśnienia dotyczące funkcjonalności i funkcji usługi.
  • Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Przykładowe scenariusze użycia

Niestandardowa klasyfikacja tekstu może być używana w wielu scenariuszach w różnych branżach:

Automatyczne wiadomości e-mail lub klasyfikacja biletów

Centra pomocy technicznej wszystkich typów otrzymują dużą liczbę wiadomości e-mail lub biletów zawierających bez struktury, dowolny tekst i załączniki. Terminowe przeglądanie, potwierdzanie i kierowanie do ekspertów z danej dziedziny w zespołach wewnętrznych ma kluczowe znaczenie. Email klasyfikacji w tej skali wymaga, aby osoby przeglądały odpowiednie działy i kierowały je do odpowiednich działów, co wymaga czasu i zasobów. Niestandardowa klasyfikacja tekstu może służyć do analizowania tekstu przychodzącego oraz klasyfikowania i kategoryzowania zawartości, która ma być automatycznie kierowana do odpowiednich działów w celu wykonania dalszych działań.

Wyszukiwanie jest podstawą każdej aplikacji, która wyświetla zawartość tekstowa użytkownikom. Typowe scenariusze obejmują wyszukiwanie w katalogu lub dokumentach, wyszukiwanie produktów w sprzedaży detalicznej lub wyszukiwanie wiedzy na potrzeby nauki o danych. Wiele przedsiębiorstw w różnych branżach stara się o stworzenie bogatego środowiska wyszukiwania w zakresie prywatnej, heterogenicznej zawartości, która obejmuje zarówno dokumenty ustrukturyzowane, jak i nieustrukturyzowane. W ramach potoku deweloperzy mogą używać niestandardowej klasyfikacji tekstu do kategoryzowania tekstu na klasy, które są istotne dla ich branży. Przewidywane klasy mogą służyć do wzbogacania indeksowania pliku w celu uzyskania bardziej dostosowanego środowiska wyszukiwania.

Cykl projektowania projektu

Tworzenie niestandardowego projektu klasyfikacji tekstu zwykle obejmuje kilka różnych kroków.

Cykl życia programowania

Wykonaj następujące kroki, aby jak najlepiej wykorzystać model:

  1. Zdefiniuj schemat: Poznaj dane i zidentyfikuj klasy , między nimi, aby uniknąć niejednoznaczności.

  2. Etykietowanie danych: jakość etykietowania danych jest kluczowym czynnikiem w określaniu wydajności modelu. Dokumenty należące do tej samej klasy powinny zawsze mieć tę samą klasę, jeśli masz dokument, który może należeć do dwóch klas, używa projektów klasyfikacji wielu etykiet . Unikaj niejednoznaczności klas, upewnij się, że klasy są wyraźnie rozdzielne od siebie, szczególnie w przypadku projektów klasyfikacji pojedynczej etykiety.

  3. Trenowanie modelu: Model zaczyna uczyć się na podstawie danych oznaczonych etykietami.

  4. Wyświetlanie wydajności modelu: wyświetl szczegóły oceny modelu, aby określić, jak dobrze działa w przypadku wprowadzenia nowych danych.

  5. Wdrażanie modelu: wdrażanie modelu umożliwia jego użycie za pośrednictwem interfejsu API analizy.

  6. Klasyfikowanie tekstu: użyj modelu niestandardowego do wykonywania niestandardowych zadań klasyfikacji tekstu.

Dokumentacja referencyjna i przykłady kodu

Podczas korzystania z niestandardowej klasyfikacji tekstu zapoznaj się z następującą dokumentacją referencyjną i przykładami dla języka AI platformy Azure:

Opcja/język programowania Dokumentacja referencyjna Przykłady
Interfejsy API REST (tworzenie) Dokumentacja interfejsu API REST
Interfejsy API REST (środowisko uruchomieniowe) Dokumentacja interfejsu API REST
C# (środowisko uruchomieniowe) Dokumentacja języka C# Przykłady w języku C# — przykłady klasyfikacji pojedynczej etykiety— klasyfikacja wielu etykiet
Java (środowisko uruchomieniowe) Dokumentacja języka Java Przykłady języka Java — przykłady klasyfikacji pojedynczej etykietyw języku Java — klasyfikacja wielu etykiet
JavaScript (środowisko uruchomieniowe) Dokumentacja języka JavaScript Przykłady dla języka JavaScript — przykłady klasyfikacji pojedynczej etykietyw języku JavaScript — klasyfikacja wielu etykiet
Python (środowisko uruchomieniowe) Dokumentacja języka Python Przykłady dla języka Python — przykłady klasyfikacji pojedynczej etykietyw języku Python — klasyfikacja wielu etykiet

Odpowiedzialne rozwiązania z zakresu sztucznej inteligencji

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które z niej będą korzystać, osoby, których to dotyczy, oraz środowisko, w którym zostanie wdrożona. Przeczytaj notatkę dotyczącą przezroczystości dla niestandardowej klasyfikacji tekstu , aby dowiedzieć się więcej na temat odpowiedzialnego używania sztucznej inteligencji i wdrażania w systemach. Aby uzyskać więcej informacji, zobacz również następujące artykuły:

Następne kroki

  • Użyj artykułu Szybki start , aby rozpocząć korzystanie z niestandardowej klasyfikacji tekstu.

  • Podczas cyklu projektowania projektu zapoznaj się ze słownikiem , aby dowiedzieć się więcej o terminach używanych w całej dokumentacji tej funkcji.

  • Pamiętaj, aby wyświetlić limity usługi dla informacji, takich jak dostępność regionalna.