Načtení dat do indexu vyhledávání ve službě Azure AI Search

Tento článek vysvětluje, jak importovat, aktualizovat a spravovat obsah v předdefinovaném indexu vyhledávání. Ve službě Azure AI Search se nejprve vytvoří index vyhledávání s importem dat, který následuje jako druhý krok. Výjimkou je průvodce importem dat a kanály indexeru, které vytvářejí a načítají index v jednom pracovním postupu.

Vyhledávací služba importuje a indexuje text a vektory ve formátu JSON, které se používají ve scénářích fulltextového vyhledávání, vektorového vyhledávání, hybridního vyhledávání a dolování znalostí. Textový obsah je možné získat z alfanumerických polí externího zdroje dat, metadat, která jsou užitečná ve scénářích hledání nebo rozšířeného obsahu vytvořeného sadou dovedností (dovednosti mohou extrahovat nebo odvozovat textové popisy z obrázků a nestrukturovaného obsahu). Vektorový obsah se vektorizuje pomocí externího vloženého modelu nebo integrované vektorizace (Preview).

Po indexování dat jsou fyzické datové struktury indexu uzamčeny. Pokyny k tomu, co se nedá změnit, najdete v tématu Vyřazení a opětovné sestavení indexu.

Indexování není proces na pozadí. Vyhledávací služba vyrovnává úlohy indexování a dotazů, ale pokud je latence dotazů příliš vysoká, můžete buď přidat kapacitu , nebo identifikovat období nízké aktivity dotazů pro načtení indexu.

Nahrání dokumentů

Vyhledávací služba přijímá dokumenty JSON, které odpovídají schématu indexu.

Tyto dokumenty můžete připravit sami, ale pokud se obsah nachází v podporovaném zdroji dat, může spuštění indexeru nebo Průvodce importem dat automatizovat načítání dokumentů, serializaci JSON a indexování.

Na webu Azure Portal pomocí průvodců importem dat vytvořte a načtěte indexy v bezproblémovém pracovním postupu. Pokud chcete načíst existující index, zvolte alternativní přístup.

  1. Přihlaste se k webu Azure Portal pomocí svého účtu Azure.

  2. Najděte vyhledávací službu a na stránce Přehled vyberte Importovat data nebo Importovat a vektorizovat data na panelu příkazů a vytvořte a naplňte index vyhledávání. Pomocí těchto odkazů si můžete projít pracovní postup: Rychlý start: Vytvoření indexu Azure AI Search a rychlého startu: Integrovaná vektorizace (Preview)

    Snímek obrazovky s příkazem Importovat data

Pokud už jsou indexery definované, můžete indexer resetovat a spustit z webu Azure Portal, což je užitečné v případě, že přidáváte pole přírůstkově. Reset vynutí, aby indexer začal znovu a vyzvedá všechna pole ze všech zdrojových dokumentů.

Odstranění osamocených dokumentů

Azure AI Search podporuje operace na úrovni dokumentu, abyste mohli vyhledat, aktualizovat a odstranit konkrétní dokument izolovaně. Následující příklad ukazuje, jak odstranit dokument. Dokumenty ve vyhledávací službě nesouvisejí, takže odstranění nebude mít žádný vliv na zbytek indexu.

  1. Určete, které pole je klíčem dokumentu. Na portálu můžete zobrazit pole jednotlivých indexů. Klíče dokumentu jsou řetězcová pole a označují se ikonou klíče, aby se snadněji zobrazovaly.

  2. Zkontrolujte hodnoty pole klíče dokumentu: search=*&$select=HotelId. Jednoduchý řetězec je jednoduchý, ale pokud index používá pole s kódováním base-64 nebo pokud byly z nastavení vygenerovány parsingMode vyhledávací dokumenty, můžete pracovat s hodnotami, které neznáte.

  3. Vyhledejte dokument , abyste ověřili hodnotu ID dokumentu a před odstraněním zkontrolovali jeho obsah. Zadejte klíč nebo ID dokumentu v požadavku. Následující příklady ilustrují jednoduchý řetězec pro ukázkový index Hotels a řetězec kódovaný v base-64 pro metadata_storage_path klíč indexu cog-search-demo.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Odstraňte dokument , který chcete odebrat z indexu vyhledávání.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Viz také