Debugowanie sesji w usłudze Azure AI Search

Artykuł
09/01/2024

Sesje debugowania to edytor wizualny, który współpracuje z istniejącym zestawem umiejętności w witrynie Azure Portal, uwidaczniając strukturę i zawartość pojedynczego wzbogaconego dokumentu, ponieważ jest on tworzony przez indeksator i zestaw umiejętności na czas trwania sesji. Ponieważ pracujesz z dokumentem na żywo, sesja jest interaktywna — możesz identyfikować błędy, modyfikować i wywoływać wykonywanie umiejętności oraz weryfikować wyniki w czasie rzeczywistym. Jeśli zmiany rozwiążą ten problem, możesz zatwierdzić je w opublikowanym zestawie umiejętności, aby zastosować poprawki globalnie.

W tym artykule opisano obsługiwane scenariusze i sposób organizowania edytora. Karty i sekcje edytora rozpakować różne warstwy zestawu umiejętności, aby można było zbadać strukturę, przepływ i zawartość, którą generuje w czasie wykonywania.

Obsługiwane scenariusze

Użyj sesji debugowania, aby zbadać i rozwiązać problemy z:

Wbudowane umiejętności używane do wzbogacania sztucznej inteligencji, takie jak OCR, analiza obrazów, rozpoznawanie jednostek i wyodrębnianie słów kluczowych.
Wbudowane umiejętności używane do zintegrowanej wektoryzacji, z fragmentowaniem danych za pośrednictwem dzielenia tekstu i wektoryzacji za pomocą umiejętności osadzania.
Niestandardowe umiejętności używane do integracji przetwarzania zewnętrznego, które udostępniasz.

Porównaj następujące obrazy sesji debugowania dla dwóch pierwszych scenariuszy. W obu scenariuszach obszar powierzchni pokazuje postęp umiejętności, które generują lub przekształcają zawartość w drodze z dokumentu źródłowego do indeksu wyszukiwania. Przepływ zawiera opcje mapowania indeksów i można śledzić strzałki, aby podążać śladem przetwarzania. Okienko szczegółów po prawej stronie jest wrażliwe na kontekst. Przedstawia on reprezentację wzbogaconego dokumentu lub szczegóły umiejętności lub mapowania.

Pierwszy obraz przedstawia wzorzec zastosowanego wzbogacania sztucznej inteligencji. Umiejętności mogą być uruchamiane sekwencyjnie lub równolegle, jeśli nie ma zależności. Mapowania pól wyjściowych wysyłają wzbogaconą lub wygenerowaną zawartość ze struktur danych w pamięci do pól w indeksie.

Drugi obraz przedstawia typowy wzorzec zintegrowanej wektoryzacji. Umiejętności zintegrowanego wektoryzacji zwykle obejmują dzielenie tekstu i umiejętność osadzania. Umiejętność dzielenia tekstu dzieli dokument na strony. Umiejętności osadzania zapewniają wektoryzacja. Mapowania projekcji kontrolują sposób indeksowania fragmentów zawartości. Ten konkretny zestaw umiejętności pomija indeks nadrzędny i tworzy indeks właśnie fragmentowanej zawartości przy użyciu metadanych w celu zidentyfikowania źródła fragmentu.

Ograniczenia

Sesje debugowania współpracują ze wszystkimi ogólnie dostępnymi źródłami danych indeksatora i większością źródeł danych w wersji zapoznawczej, z następującymi wyjątkami:

Indeksator usługi SharePoint Online.
Indeksator usługi Azure Cosmos DB dla bazy danych MongoDB.
W przypadku usługi Azure Cosmos DB for NoSQL, jeśli wiersz nie powiedzie się podczas indeksu i nie ma odpowiednich metadanych, sesja debugowania może nie wybrać poprawnego wiersza.
W przypadku interfejsu API SQL usługi Azure Cosmos DB, jeśli kolekcja partycjonowana wcześniej nie została podzielona na partycje, sesja debugowania nie znajdzie dokumentu.
W przypadku niestandardowych umiejętności tożsamość zarządzana przypisana przez użytkownika nie jest obsługiwana w przypadku połączenia sesji debugowania z usługą Azure Storage. Zgodnie z wymaganiami wstępnymi można użyć tożsamości zarządzanej systemu lub określić pełny dostęp parametry połączenia, który zawiera klucz. Aby uzyskać więcej informacji, zobacz Łączenie usługi wyszukiwania z innymi zasobami platformy Azure przy użyciu tożsamości zarządzanej.

Jak działa sesja debugowania

Po rozpoczęciu sesji usługa wyszukiwania tworzy kopię zestawu umiejętności, indeksatora i źródła danych zawierającego pojedynczy dokument używany do testowania zestawu umiejętności. Cały stan sesji jest zapisywany w nowym kontenerze obiektów blob utworzonym przez usługę Azure AI usługa wyszukiwania na określonym koncie usługi Azure Storage. Nazwa wygenerowanego kontenera ma prefiks .ms-az-cognitive-search-debugsession Prefiks jest wymagany, ponieważ zmniejsza prawdopodobieństwo przypadkowego wyeksportowania danych sesji do innego kontenera na koncie.

Buforowana kopia wzbogaconego dokumentu i zestawu umiejętności jest ładowana do edytora wizualizacji, dzięki czemu można sprawdzić zawartość i metadane wzbogaconego dokumentu z możliwością sprawdzania każdego węzła dokumentu i edytowania dowolnego aspektu definicji zestawu umiejętności. Wszelkie zmiany wprowadzone w sesji są buforowane. Te zmiany nie będą mieć wpływu na opublikowany zestaw umiejętności, chyba że je zatwierdzisz. Zatwierdzanie zmian spowoduje zastąpienie zestawu umiejętności produkcyjnych.

Jeśli potok wzbogacania nie zawiera żadnych błędów, sesja debugowania może służyć do przyrostowego wzbogacania dokumentu, testowania i weryfikowania każdej zmiany przed zatwierdzeniem zmian.

Debugowanie układu sesji

Edytor wizualizacji jest zorganizowany w obszar powierzchni przedstawiający postęp operacji, począwszy od pękania dokumentów, a następnie umiejętności, mapowania i indeksu.

Wybierz dowolną umiejętność lub mapowanie, a po stronie zostanie otwarte okienko z odpowiednimi informacjami.

Skorzystaj z linków, aby przejść dalej do przetwarzania umiejętności. Na przykład poniższy zrzut ekranu przedstawia dane wyjściowe pierwszej iteracji umiejętności dzielenia tekstu.

Okienko szczegółów umiejętności

Okienko Szczegóły umiejętności zawiera następujące sekcje:

Iteracji: pokazuje, ile razy wykonuje umiejętności. Możesz sprawdzić dane wejściowe i wyjściowe każdego z nich.
Ustawienia umiejętności: wyświetlanie lub edytowanie definicji zestawu umiejętności JSON.
Błędy i ostrzeżenia: pokazuje błędy lub ostrzeżenia specyficzne dla tej umiejętności.

Wzbogacone okienko struktury danych

Okienko Wzbogacona struktura danych jest wyświetlane po stronie po wybraniu niebieskiego pokazu lub ukrycia symbolu strzałki. Jest to czytelna dla człowieka reprezentacja zawartości wzbogaconego dokumentu. Poprzednie zrzuty ekranu w tym artykule przedstawiają przykłady wzbogaconej struktury danych.

Następne kroki

Teraz, gdy znasz elementy sesji debugowania, rozpocznij pierwszą sesję debugowania w istniejącym zestawie umiejętności.

Jak debugować zestaw umiejętności

Udostępnij za pośrednictwem