Snabbstart: Skapa ett kunskapslager i Azure-portalen

I den här snabbstarten skapar du ett kunskapslager som fungerar som en lagringsplats för utdata som genererats från en AI-berikande pipeline i Azure AI Search. Ett kunskapslager gör genererat innehåll tillgängligt i Azure Storage för andra arbetsbelastningar än sökning.

Först konfigurerar du några exempeldata i Azure Storage. Sedan kör du guiden Importera data för att skapa en berikningspipeline som också genererar ett kunskapslager. Kunskapsarkivet innehåller ursprungligt källinnehåll som hämtats från datakällan (kundgranskningar av ett hotell), plus AI-genererat innehåll som innehåller en sentimentetikett, extrahering av nyckelfraser och textöversättning av icke-engelska kundkommenter.

Förutsättningar

Innan du börjar måste du ha följande förutsättningar på plats:

Den här snabbstarten använder även Azure AI-tjänster för AI-berikande. Eftersom arbetsbelastningen är så liten används Azure AI-tjänster i bakgrunden för kostnadsfri bearbetning för upp till 20 transaktioner. Det innebär att du kan slutföra den här övningen utan att behöva skapa en extra Azure AI-resurs för flera tjänster.

Starta guiden

  1. Logga in på Azure Portal med ditt Azure-konto.

  2. Leta upp din söktjänst och på sidan Översikt väljer du Importera data i kommandofältet för att skapa ett kunskapslager i fyra steg.

    Screenshot of the Import data command

Steg 1: Skapa en datakälla

Eftersom data är flera rader i en CSV-fil anger du parsningsläget för att hämta ett sökdokument för varje rad.

  1. I Anslut till dina data väljer du Azure Blob Storage.

  2. Som Namn anger du "hotel-reviews-ds".

  3. För Data att extrahera väljer du Innehåll och metadata.

  4. För Parsningsläge väljer du Avgränsad text och markerar sedan kryssrutan Första raden innehåller sidhuvud . Kontrollera att avgränsartecknet är ett kommatecken (,).

  5. I Anslut ion String väljer du en befintlig anslutning om lagringskontot finns i samma prenumeration. Annars klistrar du in en anslutningssträng till ditt Azure Storage-konto.

    En anslutningssträng kan vara fullständig åtkomst med följande format:DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.net

    Eller så kan en anslutningssträng referera till en hanterad identitet, förutsatt att den har konfigurerats och tilldelats en roll i Azure Storage:ResourceId=/subscriptions/{YOUR-SUBSCRIPTION-ID}/resourceGroups/{YOUR-RESOURCE-GROUP-NAME}/providers/Microsoft.Storage/storageAccounts/{YOUR-ACCOUNT-NAME};

  6. I Containrar anger du namnet på blobcontainern som innehåller data ("hotellgranskningar").

    Sidan bör se ut ungefär som följande skärmbild.

    Screenshot of data source definition

  7. Fortsätt till nästa sida.

Steg 2: Lägg till kunskaper

I det här guidesteget lägger du till kunskaper för AI-berikning. Källdata består av kundgranskningar på engelska och franska. Kunskaper som är relevanta för den här datamängden är extrahering av nyckelfraser, sentimentidentifiering och textöversättning. I ett senare steg "projiceras" dessa berikningar i ett kunskapslager som Azure-tabeller.

  1. Expandera Bifoga Azure AI-tjänster. Kostnadsfria (begränsade berikningar) väljs som standard. Du kan använda den här resursen eftersom antalet poster i HotelReviews-Free.csv är 19 och den här kostnadsfria resursen tillåter upp till 20 transaktioner per dag.

  2. Expandera Lägg till berikanden.

  3. Som Namn på kompetensuppsättning anger du "hotel-reviews-ss".

  4. I fältet Källdata väljer du reviews_text.

  5. För Berikningskornighetsnivå väljer du Sidor (5 000 tecken segment).

  6. För Kognitiva kunskaper för text väljer du följande kunskaper:

    • Extrahera nyckelfraser
    • Översätta text
    • Språkidentifiering
    • Identifiera sentiment

    Sidan bör se ut så här:

    Screenshot of the skillset definition

  7. Rulla nedåt och expandera Spara berikanden till kunskapsarkivet.

  8. Välj Välj en befintlig anslutning och välj sedan ett Azure Storage-konto. Sidan Containrar visas så att du kan skapa en container för projektioner. Vi rekommenderar att du antar en namngivningskonvention för prefix, till exempel "kstore-hotel-reviews" för att skilja mellan källinnehåll och kunskapslagerinnehåll.

  9. Gå tillbaka till guiden Importera data och välj följande Azure-tabellprojektioner. Guiden erbjuder alltid projektionen Dokument . Andra projektioner erbjuds beroende på vilka kunskaper du väljer (till exempel nyckelfraser) eller berikningskornigheten (sidor):

    • Dokument
    • Sidor
    • Nyckelfraser

    Följande skärmbild visar val av tabellprojektion i guiden.

    Screenshot of the knowledge store definition

  10. Fortsätt till nästa sida.

Steg 3: Konfigurera indexet

I det här guidesteget konfigurerar du ett index för valfria fulltextsökningsfrågor. Du behöver inget sökindex för ett kunskapslager, men indexeraren kräver ett för att kunna köras.

I det här steget tar guiden exempel på datakällan för att härleda fält och datatyper. Du behöver bara välja attributen för önskat beteende. Med attributet Hämtningsbar kan söktjänsten till exempel returnera ett fältvärde, medan attributet Sökbar aktiverar fulltextsökning i fältet.

  1. Som Indexnamn anger du "hotel-reviews-idx".

  2. För attribut accepterar du standardvalen: Hämtningsbar och sökbar för de nya fält som pipelinen skapar.

    Indexet bör se ut ungefär som i följande bild. Eftersom listan är lång visas inte alla fält i bilden.

    Screenshot of the index definition

  3. Fortsätt till nästa sida.

Steg 4: Konfigurera och kör indexeraren

I det här guidesteget konfigurerar du en indexerare som samlar ihop datakällan, kompetensuppsättningen och indexet som du definierade i föregående guidesteg.

  1. Som Namn anger du "hotel-reviews-idxr".

  2. Behåll standardvärdet En gång för Schema.

  3. Välj Skicka för att köra indexeraren. Dataextrahering, indexering, tillämpning av kognitiva färdigheter sker i det här steget.

Steg 5: Kontrollera status

På sidan Översikt öppnar du fliken Indexerare mitt på sidan och väljer sedan hotels-reviews-idxr. Inom en minut eller två bör statusen gå från "Pågår" till "Lyckades" utan fel och varningar.

Kontrollera tabeller i Azure-portalen

  1. I Azure-portalen öppnar du lagringskontot som används för att skapa kunskapsarkivet.

  2. I det vänstra navigeringsfönstret för lagringskontot väljer du Lagringswebbläsare (förhandsversion) för att visa de nya tabellerna.

    Du bör se tre tabeller, en för varje projektion som erbjöds i avsnittet "Spara berikanden" på sidan "Lägg till berikanden".

    • "hotelReviewssDocuments" innehåller alla noder på första nivån i ett dokuments berikande träd som inte är samlingar.

    • "hotelReviewssKeyPhrases" innehåller en lång lista över bara de nyckelfraser som extraherats från alla recensioner. Kunskaper som matar ut samlingar (matriser), till exempel nyckelfraser och entiteter, skickar utdata till en fristående tabell.

    • "hotelReviewssPages" innehåller berikade fält som skapats över varje sida som har delats upp från dokumentet. I den här kompetensuppsättningen och datakällan berikning på sidnivå som består av attitydetiketter och översatt text. En sidtabell (eller en meningstabell om du anger den specifika detaljnivån) skapas när du väljer "sidor" kornighet i kompetensuppsättningsdefinitionen.

Alla dessa tabeller innehåller ID-kolumner som stöder tabellrelationer i andra verktyg och appar. När du öppnar en tabell bläddrar du förbi de här fälten för att visa de innehållsfält som läggs till av pipelinen.

I den här snabbstarten bör tabellen för "hotelReviewssPages" se ut ungefär så här:

Screenshot of the generated tables in Storage Browser

Rensa

När du arbetar i din egen prenumeration kan det dock vara klokt att i slutet av ett projekt kontrollera om du fortfarande behöver de resurser som du skapade. Resurser som fortsätter att köras kostar pengar. Du kan ta bort enstaka resurser eller hela resursgruppen om du vill ta bort alla resurser.

Du kan hitta och hantera resurser i portalen med hjälp av länken Alla resurser eller Resursgrupper i det vänstra navigeringsfönstret.

Om du använder en kostnadsfri tjänst ska du komma ihåg att du är begränsad till tre index, indexerare och datakällor. Du kan ta bort enskilda objekt i portalen för att hålla dig under gränsen.

Dricks

Om du vill upprepa den här övningen eller prova en annan genomgång av AI-berikande tar du bort indexeraren hotel-reviews-idxr och de relaterade objekten för att återskapa dem. Om du tar bort indexeraren återställs den kostnadsfria dagliga transaktionsräknaren till noll.

Nästa steg

Nu när du har introducerats i ett kunskapslager kan du ta en närmare titt på varje steg genom att växla över till REST API-genomgången. Uppgifter som guiden hanterade internt förklaras i REST-genomgången.