Snabbstart: Skapa ett Azure Cognitive Search index i Azure-Portal

I den här snabbstarten skapar du ditt första sökindex med hjälp av guiden Importera data och en inbyggd exempeldatakälla som består av fiktiva hotelldata. Guiden vägleder dig genom skapandet av ett sökindex (hotels-sample-index) så att du kan skriva intressanta frågor inom några minuter.

Även om du inte använder alternativen i den här snabbstarten innehåller guiden en sida för AI-berikning så att du kan extrahera text och struktur från bildfiler och ostrukturerad text. En liknande genomgång som innehåller AI-berikning finns i Snabbstart: Skapa en kompetensuppsättning.

Förutsättningar

Kontrollera utrymmet

Många kunder börjar med den kostnadsfria tjänsten. Den kostnadsfria nivån är begränsad till tre index, tre datakällor och tre indexerare. Kontrollera att du har plats för extra objekt innan du börjar. Den här snabbstarten skapar ett av varje objekt.

Gå till översiktssidan för tjänsten för att ta reda på hur många index, indexerare och datakällor du redan har.

Skärmbild av listor över index, indexerare och datakällor på instrumentpanelen för tjänsten.

Skapa och läsa in ett index

Sökfrågor itererar över ett index som innehåller sökbara data, metadata och andra konstruktioner som optimerar vissa sökbeteenden.

I den här snabbstarten skapar och läser vi in indexet med hjälp av en inbyggd exempeldatauppsättning som kan crawlas med hjälp av en indexerare via guiden Importera data. Datauppsättningen hotels-sample finns på Microsoft i Azure Cosmos DB och nås via en intern anslutning. Du behöver inte ett eget Cosmos DB-konto eller källfiler för att komma åt data.

En indexerare är en källspecifik crawler som kan läsa metadata och innehåll från Azure-datakällor som stöds. Normalt skapas indexerare programmatiskt, men i portalen kan du skapa dem via guiden Importera data.

Steg 1 – starta guiden Importera data och skapa en datakälla

  1. Logga in på Azure-portalen med ditt Azure-konto.

  2. Leta upp din söktjänst och välj Importera data i kommandofältet på sidan Översikt för att skapa och fylla i ett sökindex.

    Skärmbild av kommandot Importera data i kommandofältet.

  3. I guiden väljer du Anslut till dinadataExempel>>hotels-sample. Den här datakällan är inbyggd. Om du skapar din egen datakälla så behöver du ange ett namn, typ och anslutningsinformation. När du har skapat den blir den en ”befintlig datakälla” som kan återanvändas i andra importåtgärder.

    Skärmbild av sidan Välj exempeldatamängd i guiden.

  4. Fortsätt till nästa sida.

Steg 2 – Hoppa över sidan "Berika innehåll"

Guiden stöder skapandet av en AI-berikningspipeline för att införliva Cognitive Services AI-algoritmer i indexering.

Vi hoppar över det här steget för tillfället och går direkt till Anpassa målindex.

Skärmbild av knappen Hoppa över kognitiv färdighet i guiden.

Tips

Du kan gå igenom ett EXEMPEL på AI-indexering i en snabbstart eller självstudie.

Steg 3 – Konfigurera index

För det inbyggda hotellexempelindexet definieras ett standardindexschema åt dig. Förutom några avancerade filterexempel körs frågor i dokumentationen och exemplen som riktar sig till indexet hotel-samples på den här indexdefinitionen:

Skärmbild av indexdefinitionen för genererade hotell i guiden.

I en kodbaserad övning slutförs vanligtvis skapandet av index innan data läses in. Guiden Importera data komprimerar de här stegen genom att generera ett grundläggande index för alla datakällor som den kan crawla. Ett index kräver minst ett namn och en fältsamling. Ett av fälten ska markeras som dokumentnyckel för att unikt identifiera varje dokument. Du kan också välja att använda språkanalys eller språkförslag för automatisk komplettering eller frågeförslag.

Fält har en datatyp och attribut. Kryssrutorna överst är attribut som styr hur fältet används.

  • Nyckel är den unika dokumentdentifieraren. Det är alltid en sträng och krävs. Endast ett fält kan vara nyckeln.
  • Hämtningsbar innebär att fältinnehållet visas i sökresultatlistan. Du kan markera enskilda fält som utanför gränserna för sökresultat genom att avmarkera den här kryssrutan, till exempel för fält som endast används i filteruttryck.
  • Filtrerbar, Sorterbar och Fasetterbar avgör om fält användas i ett filter, en sortering eller en fasetterad navigeringsstruktur.
  • Sökbar innebär att ett fält ingår i fulltextsökning. Strängarna är sökbara. Numeriska fält och fält för booleska värden är ofta markerade som icke sökbara.

Lagringskraven kan variera beroende på attributval. Filterable kräver till exempel mer lagringsutrymme, men det går inte att hämta.

Som standard söker guiden igenom datakällan för att hitta unika identifierare som utgör själva grunden för sökordsfältet. Strängar tilldelas som Hämtningsbar och Sökbar. Heltal tilldelas som Hämtningsbar, Filterbar, Sorterbar och Fasettbar.

  1. Acceptera alla standardinställningar.

    Om du kör guiden igen en andra gång med hjälp av en befintlig hotelldatakälla konfigureras inte indexet med standardattribut. Du måste då manuellt välja attribut för framtida importer.

  2. Fortsätt till nästa sida.

Steg 4 – Konfigurera indexeraren

I guiden Importera data väljer du Indexerarens>namn och anger ett namn för indexeraren.

Det här objektet definierar en körbar process. Du kan lägga till det i ett återkommande schema, men för tillfället använder du standardalternativet för att köra indexeraren en gång direkt.

Välj Skicka för att skapa och samtidigt köra indexeraren.

Skärmbild av hotellindexeringsdefinitionen i guiden.

Övervaka förloppet

Guiden ska ta dig till listan med indexerare där du kan övervaka förloppet. För självnavigering går du till sidan Översikt och väljer fliken Indexerare .

Det kan ta några minuter för portalen att uppdatera sidan men du borde se den nyligen skapade indexeraren i listan med status Pågående eller Lyckades, tillsammans med antalet dokument som indexerats.

Skärmbild av förloppsmeddelandet för indexeraren i guiden.

Kontrollera resultat

Tjänstöversiktssidan innehåller länkar till de resurser som skapats i din Azure Cognitive Search-tjänst. Om du vill visa indexet som du nyss skapade väljer du Index i listan med länkar.

Vänta tills portalsidan har uppdaterats. Efter några minuter bör du se indexet med ett antal dokument och lagringsstorlek.

Skärmbild av listan Index på instrumentpanelen för tjänsten.

I den här listan kan du välja det hotels-sample-index som du nyss skapade och visa indexschemat. Du kan också lägga till nya fält.

Fliken Fält visar indexschemat. Om du skriver frågor och behöver kontrollera om ett fält kan filtreras eller sorteras visas attributen på den här fliken.

Rulla till slutet av listan för att ange ett nytt fält. Du kan alltid skapa ett nytt fält, men i de flesta fall kan du inte ändra befintliga fält. Befintliga fält har en fysisk representation i söktjänsten och kan därför inte ändras, inte ens i kod. Om du vill ändra ett befintligt fält från grunden så skapar du ett nytt index och tar bort det ursprungliga.

Skärmbild av exempelindexdefinitionen i Azure-Portal.

Andra konstruktioner, t.ex. bedömningsprofiler och CORS-alternativ, kan läggas till när som helst.

Om du vill förstå vad du kan och inte kan redigera under indexdesignen kan du ta en minut att visa alternativ för indexdefinitioner. Nedtonade alternativ är en indikator på att ett värde inte kan ändras eller tas bort.

Fråga med Sökutforskaren

Nu har du ett sökindex som kan efterfrågas med hjälp av Sökutforskaren.

Sökutforskaren skickar REST-anrop som överensstämmer med API:et för sökdokument. Verktyget stöder enkel frågesyntax och fullständig Lucene-frågeparser.

  1. Välj Sökutforskaren i kommandofältet.

    Skärmbild av kommandot Sökutforskaren i kommandofältet.

  2. Från Index väljer du "hotels-sample-index".

    Skärmbild av listorna för index- och API-val i Sökutforskaren.

  3. I sökfältet klistrar du in en frågesträng från exemplen nedan och väljer Sök.

    Skärmbild av frågesträngens textfält och sökknappen i Sökutforskaren.

Köra fler exempelfrågor

Alla frågor i det här avsnittet är utformade för Sökutforskaren och Hotels exempelindex. Resultat returneras som utförliga JSON-dokument. Alla fält som har markerats som "hämtningsbara" i indexet kan visas i resultat. Mer information om frågor finns i Frågor i Azure Cognitive Search.

Söka i data Beskrivning
search=spa Enkel fulltextfråga med N främsta resultat. Parametern search= används för nyckelordssökning, i det här fallet för att returnera hotelldata för dem som innehåller spa i alla sökbara fält i dokumentet.
search=beach &$filter=Rating gt 4 Filtrerad fråga. I det här fallet betyg som är större än 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Parametriserad fråga. Symbolen & används för att lägga till sökparametrar, som kan anges i valfri ordning.
$select parametern returnerar en delmängd av fälten för mer koncisa sökresultat.
$count=true parametern returnerar det totala antalet dokument som matchar frågan.
$top=10 returnerar de högst rankade 10 dokumenten av totalsumman. Som standard returnerar Azure Cognitive Search de första 50 bästa matchningarna. Du kan öka eller minska mängden med den här parametern.
search=* &facet=Category &$top=2 Fasetteringsfråga, som används för att returnera ett aggregerat antal dokument som matchar ett fasetterat värde som du anger. Vid en tom eller okvalificerad sökning representeras alla dokument. I hotellindexet markeras fältet Kategori som "fasettbar".
search=spa &facet=Rating Fasettering för numeriska värden. Den här frågan är fasettering för klassificering i en textsökning efter "spa". Termen "Klassificering" kan anges som en fasett eftersom fältet är markerat som hämtningsbart, filterbart och fasettbart i indexet, och dess numeriska värden (1 till 5) är lämpliga för att gruppera resultat efter varje värde.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Träffmarkering. Termen "strand" markeras när den visas i fältet "Beskrivning".
search=seatle följt av
search=seatle~ &queryType=full
Fuzzy-sökning. Som standard returnerar felstavade frågetermer, t.ex . sittplats för "Seattle", matchningar i vanlig sökning. Det första exemplet returnerar inga resultat. Om du lägger till queryType=full anropas den fullständiga Lucene-frågeparsern, som stöder operanden ~ för fuzzy-sökning.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Geospatial sökning. Exempelfrågan filtrerar alla resultat för positionsdata, där resultaten är mindre än 5 kilometer från en viss punkt, enligt koordinaterna för latitud och longitud (i det här exemplet används Redmond, Washington som ursprungspunkt).

Lärdomar

Den här snabbstarten gav en snabb introduktion till Azure Cognitive Search med hjälp av Azure-Portal.

Du lärde dig hur du skapar ett sökindex med hjälp av guiden Importera data. Du skapade din första indexerare och lärde dig det grundläggande arbetsflödet för indexdesign. Mer information om fördelarna och begränsningarna finns i guiden Importera data i Azure Cognitive Search.

Med hjälp av Sökutforskaren i Azure-Portal lärde du dig grundläggande frågesyntax genom praktiska exempel som demonstrerade viktiga funktioner som filter, träffmarkering, fuzzy-sökning och geospatial sökning.

Rensa resurser

När du arbetar i din egen prenumeration kan det dock vara klokt att i slutet av ett projekt kontrollera om du fortfarande behöver de resurser som du skapade. Resurser som fortsätter att köras kostar pengar. Du kan ta bort resurser individuellt eller ta bort resursgruppen om du vill ta bort hela uppsättningen resurser.

Du kan hitta och hantera resurser i portalen med hjälp av länken Alla resurser eller Resursgrupper i det vänstra navigeringsfönstret.

Om du använder en kostnadsfri tjänst bör du komma ihåg att gränsen är tre index, indexerare och datakällor. Du kan ta bort enskilda objekt i portalen för att hålla dig under gränsen.

Nästa steg

Använd en portalguide för att generera en färdig webbapp som körs i en webbläsare. Du kan prova den här guiden på det lilla index som du nyss skapade, eller använda en av de inbyggda exempeldatauppsättningarna för en bättre sökupplevelse.