Megosztás a következőn keresztül:


Adatok betöltése keresési indexbe az Azure AI Searchben

Ez a cikk bemutatja, hogyan importálhat dokumentumokat előre definiált keresési indexbe. Az Azure AI Searchben először egy keresési index jön létre, amely második lépésként követi az adatimportálást. Kivételt képeznek az Importálás varázslók a portálon és az indexelő folyamatokban, amelyek létrehoznak és betöltenek egy indexet egy munkafolyamatban.

Az adatimportálás működése

A keresési szolgáltatás elfogadja az indexsémának megfelelő JSON-dokumentumokat. A keresési szolgáltatás egyszerű szövegeket és vektorokat importál és indexel JSON-ban, amelyeket teljes szöveges keresésben, vektorkeresésben, hibrid keresésben és tudásbányászati forgatókönyvekben használnak.

  • Az egyszerű szöveges tartalom a külső adatforrás alfanumerikus mezőiből, a keresési forgatókönyvekben hasznos metaadatokból vagy egy készségkészlet által létrehozott bővített tartalomból érhető el (a készségek szöveges leírásokat nyerhetnek ki vagy vonhatnak ki képekből és strukturálatlan tartalmakból).

  • A vektortartalmak vektorizálása külső beágyazási modell vagy integrált vektorizálás (előzetes verzió) használatával történik az alkalmazott AI-val integrálható Azure AI Search-funkciókkal.

Ezeket a dokumentumokat saját maga is előkészítheti, de ha a tartalom támogatott adatforrásban található, indexelő futtatása vagy Importálás varázsló használata automatizálhatja a dokumentumok lekérését, a JSON-szerializálást és az indexelést.

Az adatok indexelése után az index fizikai adatstruktúrái zárolva lesznek. Az indexek frissítéséről és újraépítéséről további információt az indexek frissítéséről és újraépítéséről szóló cikkben talál.

Az indexelés nem háttérfolyamat. A keresési szolgáltatás kiegyensúlyozza az indexelést és a lekérdezési számítási feladatokat, de ha a lekérdezés késése túl magas, kapacitást adhat hozzá, vagy azonosíthatja az index betöltéséhez szükséges alacsony lekérdezési tevékenységeket.

További információ: Adatimportálási stratégiák.

Az Azure Portal használata

Az Azure Portalon az importálási varázslókkal hozhat létre és tölthet be indexeket egy zökkenőmentes munkafolyamatban. Ha meglévő indexet szeretne betölteni, válasszon másik módszert.

  1. Jelentkezzen be az Azure Portalra az Azure-fiókjával, és keresse meg a keresési szolgáltatást.

  2. Az Áttekintés lapon válassza az Adatok importálása vagy Adatok importálása és vektorizálása parancsot a parancssávon a keresési index létrehozásához és feltöltéséhez.

    Képernyőkép az Adatok importálása parancsról

    Az alábbi hivatkozásokra kattintva áttekintheti a munkafolyamatot: Rövid útmutató: Azure AI Search-index létrehozása és rövid útmutató: Integrált vektorizáció (előzetes verzió).

  3. A varázsló befejezése után a Kereséskezelővel keresse meg a találatokat.

Tipp.

Az importálási varázslók indexelőket hoznak létre és futtatnak. Ha az indexelők már definiálva vannak, visszaállíthat és futtathat indexelőt az Azure Portalról, ami akkor hasznos, ha fokozatosan ad hozzá mezőket. Az alaphelyzetbe állítás kényszeríti az indexelőt az újrakezdésre, és minden mezőt felvesz az összes forrásdokumentumból.

A REST API-k használata

Dokumentumok – Az index az adatok keresési indexbe való importálására szolgáló REST API. A REST API-k a kezdeti megvalósíthatósági vizsgálathoz hasznosak, ahol anélkül tesztelheti az indexelési munkafolyamatokat, hogy sok kódot kellene írnia. A @search.action paraméter azt határozza meg, hogy a dokumentumok teljes egészében vagy részben új vagy helyettesítő értékekben vannak-e hozzáadva adott mezőkhöz.

Rövid útmutató: A REST használatával végzett szöveges keresés ismerteti a lépéseket. Az alábbi példa a példa módosított verziója. A rendszer a rövidség kedvéért levágta, és az első HotelId értéket módosították, hogy ne írja felül a meglévő dokumentumot.

  1. Alakítson ki egy POST-hívást, amely megadja az index nevét, a "docs/index" végpontot és a paramétert tartalmazó @search.action kérelemtörzset.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {
        "value": [
        {
        "@search.action": "upload",
        "HotelId": "1111",
        "HotelName": "Secret Point Motel",
        "Description": "The hotel is ideally located on the main commercial artery of the city in the heart of New York. A few minutes away is Time's Square and the historic centre of the city, as well as other places of interest that make New York one of America's most attractive and cosmopolitan cities.",
        "Category": "Boutique",
        "Tags": [ "pool", "air conditioning", "concierge" ]
        },
        {
        "@search.action": "mergeOrUpload",
        "HotelId": "2",
        "HotelName": "Twin Dome Motel",
        "Description": "This is description is replacing the original one for this hotel. New and changed values overwrite the previous ones. In a comma-delimited list like Tags, be sure to provide the full list because there is no merging of values within the field itself.",
        "Category": "Boutique",
        "Tags": [ "pool", "free wifi", "concierge", "my first new tag", "my second new tag" ]
        }
      ]
    }
    
  2. Állítsa be a @search.action paramétert upload dokumentum létrehozására vagy felülírására. Állítsa be, merge vagy uploadOrMerge ha a dokumentum adott mezőinek frissítéseit célozza meg. Az előző példában mindkét művelet látható.

    Művelet Hatály
    egyesül Frissíti a már létező dokumentumot, és nem találja a dokumentumot. Az egyesítés lecseréli a meglévő értékeket. Ezért mindenképpen ellenőrizze, hogy a gyűjteménymezők több értéket tartalmaznak-e, például a típusmezőket Collection(Edm.String). Ha például egy tags mező egy értékével ["budget"] kezdődik, és egyesítést ["economy", "pool"]hajt végre, akkor a tags mező végső értéke .["economy", "pool"] Nem lesz ["budget", "economy", "pool"].
    mergeOrUpload Úgy viselkedik, mint az egyesítés, ha a dokumentum létezik, és feltölti, ha a dokumentum új. Ez a növekményes frissítések leggyakoribb művelete.
    upload Hasonló ahhoz az "upsert"-hez, amelyben a dokumentum be lesz szúrva, ha új, és ha létezik, frissítve vagy lecserélve. Ha a dokumentum nem rendelkezik az index által igényelt értékekkel, a dokumentummező értéke null értékre van állítva.
  3. Küldje el a kérést.

  4. Keresse meg az imént hozzáadott dokumentumokat érvényesítési lépésként:

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    

Ha a dokumentumkulcs vagy -azonosító új, a null érték lesz a dokumentumban nem meghatározott mezők értéke. Meglévő dokumentumon végzett műveletek esetén a frissített értékek felülírják az előző értékeket. Az "egyesítés" vagy az "mergeUpload" mezőben nem megadott mezők érintetlenül maradnak a keresési indexben.

Az Azure SDK-k használata

A programozhatóságot az alábbi Azure SDK-k biztosítják.

A .NET-hez készült Azure SDK az alábbi API-kat biztosítja az egyszerű és tömeges dokumentumok indexbe való feltöltéséhez:

Számos minta szemlélteti az indexelést az egyszerű és nagy léptékű indexelés kontextusában:

Lásd még