Förstå sökkomponenter

Slutförd

En AI Search-lösning består av flera komponenter som var och en spelar en viktig roll i processen för att extrahera, berika, indexera och söka efter data.

Data source

A diagram showing a conceptual illustration of a data source.

De flesta söklösningar börjar med en datakälla som innehåller de data som du vill söka efter. Azure AI Search stöder flera typer av datakällor, inklusive:

  • Ostrukturerade filer i Azure Blob Storage-containrar.
  • Tabeller i Azure SQL Database.
  • Dokument i Cosmos DB.

Azure AI Search kan hämta data från dessa datakällor för indexering.

Alternativt kan program skicka JSON-data direkt till ett index, utan att hämta dem från ett befintligt datalager.

Skillset

A diagram a conceptual illustration of a skillset.

I en grundläggande söklösning kan du indexeras data som extraherats från datakällan. Vilken information som kan extraheras beror på datakällan. När du till exempel indexerar data i en databas kan fälten i databastabellerna extraheras. eller när du indexerar en uppsättning dokument kan filmetadata som filnamn, ändrat datum, storlek och författare extraheras tillsammans med textinnehållet i dokumentet.

Även om en grundläggande söklösning som indexerar datavärden som extraheras direkt från datakällan kan vara användbar, har förväntningarna hos moderna programanvändare drivit på behovet av bättre insikter om data. I Azure AI Search kan du använda AI-kunskaper (artificiell intelligens) som en del av indexeringsprocessen för att utöka källdata med ny information, som kan mappas till indexfält. De kunskaper som används av en indexerare kapslas in i en kompetensuppsättning som definierar en berikningspipeline där varje steg förbättrar källdata med insikter som erhålls av en specifik AI-färdighet. Exempel på den typ av information som kan extraheras av en AI-färdighet är:

  • Det språk som ett dokument är skrivet på.
  • Nyckelfraser som kan hjälpa dig att fastställa huvudteman eller ämnen som beskrivs i ett dokument.
  • En attitydpoäng som kvantifierar hur positivt eller negativt ett dokument är.
  • Specifika platser, personer, organisationer eller landmärken som nämns i innehållet.
  • AI-genererade beskrivningar av bilder eller bildtext som extraherats av optisk teckenigenkänning.
  • Anpassade kunskaper som du utvecklar för att uppfylla specifika krav.

Indexerare

A diagram showing a conceputal illustration of an indexer.

Indexeraren är den motor som driver den övergripande indexeringsprocessen. Den tar utdata som extraherats med hjälp av färdigheterna i kunskapsuppsättningen, tillsammans med data- och metadatavärden som extraherats från den ursprungliga datakällan och mappar dem till fält i indexet.

En indexerare körs automatiskt när den skapas och kan schemaläggas att köras med jämna mellanrum eller köras på begäran för att lägga till fler dokument i indexet. I vissa fall, till exempel när du lägger till nya fält i ett index eller nya kunskaper i en kompetensuppsättning, kan du behöva återställa indexet innan du kör indexeraren igen.

Index

A diagram showing a conceputal illustration of an index.

Indexet är det sökbara resultatet av indexeringsprocessen. Den består av en samling JSON-dokument med fält som innehåller de värden som extraherades under indexeringen. Klientprogram kan köra frågor mot indexet för att hämta, filtrera och sortera information.

Varje indexfält kan konfigureras med följande attribut:

  • nyckel: Fält som definierar en unik nyckel för indexposter.
  • sökbar: Fält som kan efterfrågas med fulltextsökning.
  • filterbar: Fält som kan inkluderas i filteruttryck för att endast returnera dokument som matchar angivna begränsningar.
  • sorterbar: Fält som kan användas för att sortera resultaten.
  • facetable: Fält som kan användas för att fastställa värden för fasetter (användargränssnittselement som används för att filtrera resultaten baserat på en lista över kända fältvärden).
  • hämtningsbar: Fält som kan inkluderas i sökresultat (som standard kan alla fält hämtas om inte det här attributet uttryckligen tas bort).