Läsa in data i ett sökindex i Azure AI Search

Den här artikeln beskriver hur du importerar, uppdaterar och hanterar innehåll i ett fördefinierat sökindex. I Azure AI Search skapas ett sökindex först, med dataimport som följer som ett andra steg. Undantaget är guiden Importera data och indexeringspipelines, som skapar och läser in ett index i ett arbetsflöde.

En söktjänst importerar och indexerar text och vektorer i JSON, som används i fulltextsökning, vektorsökning, hybridsökning och kunskapsutvinningsscenarier. Textinnehåll kan hämtas från alfanumeriska fält i den externa datakällan, metadata som är användbara i sökscenarier eller berikat innehåll som skapats av en kompetensuppsättning (färdigheter kan extrahera eller härleda textbeskrivningar från bilder och ostrukturerat innehåll). Vektorinnehållet är vektoriserat med hjälp av en extern inbäddningsmodell eller integrerad vektorisering (förhandsversion).

När data har indexerats är indexets fysiska datastrukturer låsta. Vägledning om vad som kan och inte kan ändras finns i Släppa och återskapa ett index.

Indexering är inte en bakgrundsprocess. En söktjänst balanserar indexering och frågearbetsbelastningar, men om frågefördröjningen är för hög kan du antingen lägga till kapacitet eller identifiera perioder med låg frågeaktivitet för att läsa in ett index.

Läsa in dokument

En söktjänst accepterar JSON-dokument som överensstämmer med indexschemat.

Du kan förbereda dokumenten själv, men om innehållet finns i en datakälla som stöds kan du automatisera dokumenthämtning, JSON-serialisering och indexering genom att köra en indexerare eller guiden Importera data.

I Azure-portalen använder du guiden Importera data för att skapa och läsa in index i ett sömlöst arbetsflöde. Om du vill läsa in ett befintligt index väljer du en alternativ metod.

  1. Logga in på Azure Portal med ditt Azure-konto.

  2. Leta reda på söktjänsten och på sidan Översikt väljer du Importera data eller Importera och vektorisera data i kommandofältet för att skapa och fylla i ett sökindex. Du kan följa dessa länkar för att granska arbetsflödet: Snabbstart: Skapa ett Azure AI Search-index och snabbstart: Integrerad vektorisering (förhandsversion).

    Screenshot of the Import data command

Om indexerare redan har definierats kan du återställa och köra en indexerare från Azure-portalen, vilket är användbart om du lägger till fält stegvis. Återställning tvingar indexeraren att börja om och plocka upp alla fält från alla källdokument.

Ta bort överblivna dokument

Azure AI Search stöder åtgärder på dokumentnivå så att du kan söka efter, uppdatera och ta bort ett specifikt dokument isolerat. I följande exempel visas hur du tar bort ett dokument. I en söktjänst är dokument orelaterade så att ta bort en kommer inte att påverka resten av indexet.

  1. Identifiera vilket fält som är dokumentnyckeln. I portalen kan du visa fälten för varje index. Dokumentnycklar är strängfält och betecknas med en nyckelikon för att göra dem enklare att upptäcka.

  2. Kontrollera värdena för dokumentnyckelfältet: search=*&$select=HotelId. En enkel sträng är enkel, men om indexet använder ett base-64-kodat fält, eller om sökdokument har genererats från en parsingMode inställning, kanske du arbetar med värden som du inte är bekant med.

  3. Leta upp dokumentet för att verifiera värdet för dokument-ID:t och granska dess innehåll innan du tar bort det. Ange nyckel- eller dokument-ID:t i begäran. I följande exempel visas en enkel sträng för exempelindexet Hotels och en base-64-kodad sträng för metadata_storage_path nyckeln för cog-search-demo-indexet.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Ta bort dokumentet för att ta bort det från sökindexet.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Se även