Ładowanie danych do indeksu wyszukiwania w usłudze Azure AI Search

W tym artykule wyjaśniono, jak importować, odświeżać zawartość i zarządzać nią w wstępnie zdefiniowanym indeksie wyszukiwania. W usłudze Azure AI Search najpierw tworzony jest indeks wyszukiwania z importem danych po drugim kroku. Wyjątkiem jest kreator importu danych i potoki indeksatora, które tworzą i ładują indeks w jednym przepływie pracy.

Usługa wyszukiwania importuje i indeksuje tekst i wektory w formacie JSON, używane w scenariuszach wyszukiwania pełnotekstowego, wyszukiwania wektorów, wyszukiwania hybrydowego i wyszukiwania wiedzy. Zawartość tekstowa jest uzyskiwana z pól alfanumerycznych w zewnętrznym źródle danych, metadanych przydatnych w scenariuszach wyszukiwania lub wzbogaconej zawartości utworzonej przez zestaw umiejętności (umiejętności mogą wyodrębniać lub wnioskować opisy tekstowe z obrazów i zawartości bez struktury). Zawartość wektorowa jest wektoryzowana przy użyciu zewnętrznego modelu osadzania lub zintegrowanej wektoryzacji (wersja zapoznawcza).

Po zaindeksowanym indeksie fizyczne struktury danych indeksu są zablokowane. Aby uzyskać wskazówki dotyczące tego, co można zmienić i których nie można zmienić, zobacz Usuwanie i ponowne kompilowanie indeksu.

Indeksowanie nie jest procesem w tle. Usługa wyszukiwania zrównoważy indeksowanie i obciążenia zapytań, ale jeśli opóźnienie zapytań jest zbyt wysokie, możesz dodać pojemność lub zidentyfikować okresy niskiej aktywności zapytań na potrzeby ładowania indeksu.

Ładowanie dokumentów

Usługa wyszukiwania akceptuje dokumenty JSON zgodne ze schematem indeksu.

Te dokumenty można przygotować samodzielnie, ale jeśli zawartość znajduje się w obsługiwanym źródle danych, uruchomienie indeksatora lub kreator importu danych może zautomatyzować pobieranie dokumentów, serializacji JSON i indeksowanie.

W witrynie Azure Portal użyj kreatorów importu danych, aby utworzyć i załadować indeksy w bezproblemowym przepływie pracy. Jeśli chcesz załadować istniejący indeks, wybierz alternatywne podejście.

  1. Zaloguj się w witrynie Azure Portal przy użyciu danych konta Azure.

  2. Znajdź usługę wyszukiwania i na stronie Przegląd wybierz pozycję Importuj dane lub Importuj i wektoryzuj dane na pasku poleceń, aby utworzyć i wypełnić indeks wyszukiwania. Skorzystaj z poniższych linków, aby przejrzeć przepływ pracy: Szybki start: tworzenie indeksu usługi Azure AI Search i Szybki start: wektoryzacja zintegrowana (wersja zapoznawcza).

    Screenshot of the Import data command

Jeśli indeksatory są już zdefiniowane, możesz zresetować i uruchomić indeksator w witrynie Azure Portal, co jest przydatne w przypadku przyrostowego dodawania pól. Polecenie Reset wymusza rozpoczęcie od początku indeksatora i pobieranie wszystkich pól ze wszystkich dokumentów źródłowych.

Usuwanie oddzielonych dokumentów

Usługa Azure AI Search obsługuje operacje na poziomie dokumentu, dzięki czemu można wyszukiwać, aktualizować i usuwać określony dokument w izolacji. W poniższym przykładzie pokazano, jak usunąć dokument. W usłudze wyszukiwania dokumenty nie są powiązane, więc usunięcie jednego z nich nie będzie miało wpływu na pozostałą część indeksu.

  1. Zidentyfikuj, które pole jest kluczem dokumentu. W portalu można wyświetlić pola poszczególnych indeksów. Klucze dokumentów są polami ciągów i są oznaczone ikoną klucza, aby ułatwić ich odnajdowanie.

  2. Sprawdź wartości pola klucza dokumentu: search=*&$select=HotelId. Prosty ciąg jest prosty, ale jeśli indeks używa pola zakodowanego w formacie base-64 lub jeśli dokumenty wyszukiwania zostały wygenerowane na podstawie parsingMode ustawienia, możesz pracować z wartościami, których nie znasz.

  3. Wyszukaj dokument , aby sprawdzić wartość identyfikatora dokumentu i przejrzeć jego zawartość przed jego usunięciem. Określ klucz lub identyfikator dokumentu w żądaniu. W poniższych przykładach przedstawiono prosty ciąg dla przykładowego indeksu Hotels i zakodowany ciąg base-64 dla klucza metadata_storage_path indeksu cog-search-demo.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Usuń dokument , aby usunąć go z indeksu wyszukiwania.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Zobacz też