Testowanie wsadowe z zestawem przykładowych wypowiedzi

2025-06-12

Ważne

Usługa Language Understanding Intelligent Service (LUIS) zostanie w pełni wycofana 31 marca 2026 r. Tworzenie zasobów usługi LUIS nie jest dostępne. Od 31 października 2025 r. portal usługi LUIS nie będzie już dostępny. Zalecamy migrację aplikacji LUIS do interpretacji języka konwersacyjnego, aby korzystać z ciągłej pomocy technicznej i wielojęzycznych możliwości produktów.

Testowanie wsadowe weryfikuje aktywną wytrenowana wersję w celu mierzenia dokładności przewidywania. Test wsadowy pomaga w ocenie dokładności każdej intencji i encji w aktywnej wersji. Przejrzyj wyniki testu wsadowego, aby podjąć odpowiednie działania w celu zwiększenia dokładności, takie jak dodanie większej liczby przykładowych wypowiedzi do intencji, jeśli aplikacja często nie identyfikuje właściwej intencji, albo oznaczanie jednostek w wypowiedzi.

Grupowanie danych na potrzeby testu wsadowego

Ważne jest, aby wypowiedzi używane do testowania wsadowego były nowe w usłudze LUIS. Jeśli masz zestaw danych wypowiedzi, podziel wypowiedzi na trzy zestawy: przykładowe wypowiedzi dodane do intencji, wypowiedzi odebrane z opublikowanego punktu końcowego i wypowiedzi używane do testowania wsadowego LUIS po jego wyszkoleniu.

Używany plik JSON wsadowy powinien zawierać wypowiedzi z jednostkami uczenia maszynowego najwyższego poziomu oznaczonymi etykietami, w tym pozycją początkową i końcową. Wypowiedzi nie powinny być częścią przykładów już w aplikacji. Powinny to być wypowiedzi, które chcesz pozytywnie przewidzieć dla intencji i jednostek.

Testy można rozdzielić według intencji i/lub jednostki, lub umieścić wszystkie testy (do 1000 wypowiedzi) w tym samym pliku.

Typowe błędy podczas importowania partii

Jeśli wystąpią błędy podczas przekazywania pliku wsadowego do usługi LUIS, sprawdź następujące typowe problemy:

Więcej niż 1000 wypowiedzi w pliku wsadowym
Obiekt JSON wypowiedzi, który nie ma właściwości jednostek. Właściwość może być pustą tablicą.
Wyrazy oznaczone etykietą w wielu jednostkach
Etykiety jednostek zaczynające się lub kończące spacją.

Naprawianie błędów wsadowych

Jeśli występują błędy podczas etapu testowania zbiorczego, możesz albo dodać więcej wypowiedzi do intencji, albo oznaczyć więcej wypowiedzi z jednostką, aby ułatwić usłudze LUIS rozróżnianie intencji. Jeśli dodano wypowiedzi i oznaczono je etykietami i nadal występują błędy przewidywania podczas testowania wsadowego, rozważ dodanie funkcji listy fraz ze słownictwem specyficznym dla domeny, aby ułatwić usłudze LUIS szybsze uczenie się.

Portal LUIS
Interfejs API REST

Testowanie wsadowe przy użyciu portalu usługi LUIS

Importowanie i trenowanie przykładowej aplikacji

Zaimportuj aplikację, która przyjmuje zamówienie pizzy, takie jak 1 pepperoni pizza on thin crust.

Pobierz i zapisz plik JSON aplikacji.
Zaloguj się do portalu LUIS i wybierz swoją Subskrypcję oraz zasób tworzenia, aby wyświetlić aplikacje przypisane do tego zasobu tworzenia.
Wybierz strzałkę obok pozycji Nowa aplikacja i kliknij pozycję Importuj jako kod JSON , aby zaimportować kod JSON do nowej aplikacji. Nadaj aplikacji Pizza appnazwę .
Wybierz pozycję Trenuj w prawym górnym rogu nawigacji, aby wytrenować aplikację.

Role w testowaniu wsadowym

Uwaga

Role jednostek nie są obsługiwane w testach wsadowych.

Plik testowy usługi Batch

Przykładowy kod JSON zawiera jedną wypowiedź z jednostką oznaczoną etykietą, aby zilustrować wygląd pliku testowego. We własnych testach należy mieć wiele wypowiedzi z prawidłową intencją i jednostką uczenia maszynowego oznaczoną etykietą.

Utwórz pizza-with-machine-learned-entity-test.json w edytorze tekstów lub pobierz go.

W pliku wsadowym sformatowanym w formacie JSON dodaj wypowiedź z intencją , którą chcesz przewidzieć w teście.

[
    {
        "text": "I want to pick up 1 cheese pizza",
        "intent": "ModifyOrder",
        "entities": [
            {
                "entity": "Order",
                "startPos": 18,
                "endPos": 31
            },
            {
                "entity": "ToppingList",
                "startPos": 20,
                "endPos": 25
            }
        ]
    }
]

Uruchamianie partii

Wybierz pozycję Testuj na górnym pasku nawigacyjnym.
Wybierz panel testowania usługi Batch w panelu po prawej stronie.
Wybierz Importuj. W wyświetlonym oknie dialogowym wybierz pozycję Wybierz plik i znajdź plik JSON z poprawnym formatem JSON, który nie zawiera więcej niż 1000 wypowiedzi do przetestowania.

Błędy importu są zgłaszane na czerwonym pasku powiadomień w górnej części przeglądarki. Jeśli import zawiera błędy, nie jest tworzony żaden zestaw danych. Aby uzyskać więcej informacji, zobacz Typowe błędy.
Wybierz lokalizację pizza-with-machine-learned-entity-test.json pliku.
Nadaj zestawowi danych pizza test nazwę i wybierz pozycję Gotowe.
Wybierz przycisk Run (Uruchom).

Po zakończeniu testu wsadowego można zobaczyć następujące kolumny:

Kolumna	opis
Stan	Stan testu. Zobacz wyniki są widoczne tylko po zakończeniu testu.
Nazwisko	Nazwa nadana testowi.
Rozmiar	Liczba testów w tym pliku testu wsadowego.
Ostatnie uruchomienie	Data ostatniego uruchomienia tego pliku testowego wsadowego.
Ostatni wynik	Liczba pomyślnych przewidywań w teście.

Aby wyświetlić szczegółowe wyniki testu, wybierz pozycję Zobacz wyniki.
Napiwek
- Wybranie opcji Pobierz spowoduje pobranie tego samego pliku, który przesłałeś.
- Jeśli test wsadowy zakończy się niepowodzeniem, oznacza to, że co najmniej jeden zamiar wypowiedzi nie zgadza się z przewidywaniem.

Przeglądanie wyników wsadowych dla intencji

Aby przejrzeć wyniki testu wsadowego, wybierz Zobacz wyniki. Wyniki testu pokazują graficznie, jak przewidywano wypowiedzi testowe względem aktywnej wersji.

Wykres wsadowy przedstawia cztery sekcje wyników. Po prawej stronie wykresu jest filtr. Filtr zawiera intencje i jednostki. Po wybraniu sekcji wykresu lub punktu na wykresie skojarzone wypowiedzi są wyświetlane poniżej wykresu.

Po umieszczeniu kursora na wykresie koło myszy może powiększyć lub zmniejszyć wyświetlanie na wykresie. Jest to przydatne, gdy na wykresie jest ściśle zgrupowanych wiele punktów.

Wykres znajduje się w czterech ćwiartkach, z dwoma sekcjami wyświetlanymi na czerwono.

Wybierz intencję ModifyOrder na liście filtrów. Wypowiedź jest przewidziana jako prawdziwie dodatni co oznacza, że została pomyślnie dopasowana do swojego pozytywnego przewidywania wymienionego w pliku wsadowym.

Zielone znaczniki na liście filtrów wskazują również powodzenie testu dla każdego celu. Wszystkie inne intencje są wyświetlane z dodatnim wynikiem 1/1, ponieważ wypowiedź została przetestowana względem każdej intencji, jako negatywny test dla intencji, które nie zostały wymienione w teście wsadowym.
Wybierz intencję Potwierdzenie . Ta intencja nie jest wymieniona w teście wsadowym, dlatego jest to negatywny test wypowiedzi wymienionej w teście wsadowym.

Test ujemny zakończył się pomyślnie, jak zanotowano z zielonym tekstem w filtrze i siatką.

Przegląd wyników testów zbiorczych dla jednostek

Jednostka ModifyOrder, jako jednostka maszynowa z podjednostkami, pokazuje, czy jednostka najwyższego poziomu pasuje i jak są przewidywane podjednostki.

Wybierz jednostkę ModifyOrder na liście filtrów, a następnie wybierz okrąg w siatce.
Przewidywanie jednostek jest wyświetlane poniżej wykresu. Na wyświetlaczu znajdują się linie stałe dla przewidywań, które pasują do oczekiwań i kropkowanych wierszy dla przewidywań, które nie pasują do oczekiwań.

Filtrowanie wyników wykresu

Aby filtrować wykres według określonej intencji lub jednostki, wybierz intencję lub jednostkę w panelu filtrowania po prawej stronie. Punkty danych i ich dystrybucja są aktualizowane na wykresie zgodnie z wyborem.

Wizualizowanie wyniku testu wsadowego

Przykłady wyników wykresu

Na wykresie w portalu usługi LUIS można wykonać następujące czynności:

Wyświetlanie danych pojedynczego punktu wypowiedzi

Na wykresie umieść wskaźnik myszy na punkcie danych, aby zobaczyć wynik pewności przewidywania. Wybierz punkt danych, aby pobrać odpowiednią wypowiedź na liście wypowiedzi w dolnej części strony.

Wybrana wypowiedź

Wyświetlanie danych sekcji

Na wykresie z czterema sekcjami wybierz nazwę sekcji, taką jak Wynik fałszywie dodatni w prawym górnym rogu wykresu. Poniżej wykresu wszystkie wypowiedzi w tej sekcji są wyświetlane poniżej wykresu na liście.

Wybrane wypowiedzi według sekcji

Na powyższym obrazie wypowiedź switch on jest oznaczona intencją TurnAllOn, ale otrzymała przewidywanie intencji None. Jest to wskazanie, że intencja TurnAllOn potrzebuje więcej przykładowych wypowiedzi, aby uzyskać oczekiwane przewidywania.

Dwie sekcje wykresu na czerwono wskazują wypowiedzi, które nie pasują do oczekiwanego przewidywania. Wskazują one na wypowiedzi, które wymagają, aby LUIS był bardziej przeszkolony.

Dwie sekcje wykresu na zielono pasują do oczekiwanego przewidywania.

Testowanie wsadowe przy użyciu interfejsu API REST

Usługa LUIS umożliwia testowanie wsadowe przy użyciu portalu LUIS i interfejsu API REST. Poniżej wymieniono punkty końcowe interfejsu API REST. Aby uzyskać informacje na temat testowania wsadowego przy użyciu portalu usługi LUIS, zapoznaj się z Samouczek: zestawy danych testów wsadowych. Użyj poniższych pełnych adresów URL, zastępując wartości symboli zastępczych własnym kluczem predykcyjnym LUIS i punktem końcowym.

Pamiętaj, aby dodać swój klucz LUIS do Ocp-Apim-Subscription-Key w nagłówku i ustawić Content-Type na application/json.

Rozpocznij test wsadowy

Uruchom test wsadowy przy użyciu identyfikatora wersji aplikacji lub miejsca publikowania. Wyślij żądanie POST do jednego z następujących formatów punktu końcowego. Uwzględnij plik wsadowy w treści żądania.

Termin publikowania

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-NAME>/evaluations

Identyfikator wersji aplikacji

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations

Te punkty końcowe zwracają identyfikator operacji, który będzie używany do sprawdzania stanu i uzyskiwania wyników.

Pobierz stan trwającego testu wsadowego

Użyj identyfikatora operacji z rozpoczętego testu wsadowego, aby uzyskać jego status z następujących formatów punktów końcowych:

Termin publikowania

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/status

Identyfikator wersji aplikacji

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/status

Uzyskaj wyniki z testu wsadowego

Użyj identyfikatora operacji z rozpoczętego testu wsadowego, aby uzyskać jego wyniki z następujących formatów punktów końcowych:

Termin publikowania

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/result

Identyfikator wersji aplikacji

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/result

Plik wsadowy wypowiedzi

Prześlij plik wsadowy wypowiedzi, znany jako zestaw danych, na potrzeby testowania wsadowego. Zestaw danych jest plikiem w formacie JSON zawierającym maksymalnie 1 000 oznaczonych wypowiedzi. W aplikacji można przetestować maksymalnie 10 zestawów danych. Jeśli chcesz przetestować więcej, usuń zestaw danych, a następnie dodaj nowy. Wszystkie jednostki niestandardowe w modelu są wyświetlane w filtrze jednostek testów wsadowych, nawet jeśli w danych pliku wsadowego nie ma odpowiednich jednostek.

Plik wsadowy składa się z wypowiedzi. Każda wypowiedź musi mieć oczekiwane przewidywanie intencji wraz z dowolnymi jednostkami uczenia maszynowego, które mają zostać wykryte.

Szablon składni Batch dla intencji z encjami

Użyj następującego szablonu, aby uruchomić plik wsadowy:

{
    "LabeledTestSetUtterances": [
        {
            "text": "play a song",
            "intent": "play_music",
            "entities": [
                {
                    "entity": "song_parent",
                    "startPos": 0,
                    "endPos": 15,
                    "children": [
                        {
                            "entity": "pre_song",
                            "startPos": 0,
                            "endPos": 3
                        },
                        {
                            "entity": "song_info",
                            "startPos": 5,
                            "endPos": 15
                        }
                    ]
                }
            ]
        }
    ]
}

Plik wsadowy używa właściwości startPos i endPos , aby zanotować początek i koniec jednostki. Wartości są oparte na zerach i nie powinny zaczynać się ani kończyć spacją. Różni się to od dzienników zapytań, które używają właściwości startIndex i endIndex.

Jeśli nie chcesz testować jednostek, dołącz entities właściwość i ustaw wartość jako pustą tablicę. []

Wyniki testu wsadowego interfejsu API REST

API zwraca kilka obiektów:

Informacje o intencjach i modelach jednostek, takich jak precyzja, kompletność i ocena F.
Informacje o modelach jednostek, takich jak precyzja, kompletność i wynik F) dla każdej jednostki
- Korzystając z flagi verbose , możesz uzyskać więcej informacji na temat jednostki, takich jak entityTextFScore i entityTypeFScore.
Podane wypowiedzi z przewidywanymi i oznaczonymi nazwami intencji
Lista fałszywie dodatnich jednostek oraz lista fałszywie ujemnych jednostek.

Następne kroki

Jeśli testowanie wskazuje, że aplikacja usługi LUIS nie rozpoznaje prawidłowych intencji i jednostek, możesz pracować nad zwiększeniem wydajności aplikacji LUIS przez etykietowanie większej liczby wypowiedzi lub dodawanie funkcji.

Udostępnij za pośrednictwem

Testowanie wsadowe z zestawem przykładowych wypowiedzi

Grupowanie danych na potrzeby testu wsadowego

Typowe błędy podczas importowania partii

Naprawianie błędów wsadowych

Testowanie wsadowe przy użyciu portalu usługi LUIS

Importowanie i trenowanie przykładowej aplikacji

Role w testowaniu wsadowym

Plik testowy usługi Batch

Uruchamianie partii

Przeglądanie wyników wsadowych dla intencji

Przegląd wyników testów zbiorczych dla jednostek

Filtrowanie wyników wykresu

Przykłady wyników wykresu

Wyświetlanie danych pojedynczego punktu wypowiedzi

Wyświetlanie danych sekcji

Następne kroki

Dodatkowe zasoby