Adatok betöltése keresési indexbe az Azure AI Searchben

Ez a cikk bemutatja, hogyan importálhat, frissíthet és kezelhet tartalmakat egy előre definiált keresési indexben. Az Azure AI Searchben először egy keresési index jön létre, amely második lépésként követi az adatimportálást. A kivétel az Adatok importálása varázsló és az indexelő folyamatok, amelyek egy indexet hoznak létre és töltenek be egy munkafolyamatban.

A keresési szolgáltatás a JSON-ban importálja és indexeli a szövegeket és vektorokat, amelyeket teljes szöveges keresésben, vektorkeresésben, hibrid keresésben és tudásbányászati forgatókönyvekben használnak. A szöveges tartalom a külső adatforrás alfanumerikus mezőiből, a keresési forgatókönyvekben hasznos metaadatokból vagy egy képességkészlet által létrehozott bővített tartalomból (a készségek szöveges leírásokat nyerhetnek ki vagy következtethetnek a képekből és strukturálatlan tartalmakból). A vektortartalom vektorizálása külső beágyazási modell vagy integrált vektorizálás (előzetes verzió) használatával történik.

Az adatok indexelése után az index fizikai adatstruktúrái zárolva lesznek. Az indexek elvetése és újraépítése című témakörben talál útmutatást arról, hogy mit lehet és mit nem lehet módosítani.

Az indexelés nem háttérfolyamat. A keresési szolgáltatás kiegyensúlyozza az indexelést és a lekérdezési számítási feladatokat, de ha a lekérdezés késése túl magas, kapacitást adhat hozzá, vagy azonosíthatja az index betöltéséhez szükséges alacsony lekérdezési tevékenységeket.

Dokumentumok betöltése

A keresési szolgáltatás elfogadja az indexsémának megfelelő JSON-dokumentumokat.

Ezeket a dokumentumokat saját maga is előkészítheti, de ha a tartalom egy támogatott adatforrásban található, az indexelő vagy az Adatimportálás varázsló futtatása automatizálhatja a dokumentumok lekérését, a JSON-szerializálást és az indexelést.

Az Azure Portalon az Adatok importálása varázslókkal hozhat létre és tölthet be indexeket egy zökkenőmentes munkafolyamatban. Ha meglévő indexet szeretne betölteni, válasszon másik módszert.

  1. Jelentkezzen be az Azure Portalra az Azure-fiókjával.

  2. Keresse meg a keresési szolgáltatást , és az Áttekintés lapon válassza az Adatok importálása vagy Adatok importálása és vektorizálása parancsot a parancssávon a keresési index létrehozásához és feltöltéséhez. Az alábbi hivatkozásokra kattintva áttekintheti a munkafolyamatot: Rövid útmutató: Azure AI Search-index létrehozása és rövid útmutató: Integrált vektorizáció (előzetes verzió).

    Screenshot of the Import data command

Ha az indexelők már definiálva vannak, visszaállíthat és futtathat indexelőt az Azure Portalról, ami akkor hasznos, ha fokozatosan ad hozzá mezőket. Az alaphelyzetbe állítás kényszeríti az indexelőt az újrakezdésre, és minden mezőt felvesz az összes forrásdokumentumból.

Árva dokumentumok törlése

Az Azure AI Search támogatja a dokumentumszintű műveleteket, így elkülönítve kereshet, frissíthet és törölhet egy adott dokumentumot. Az alábbi példa bemutatja, hogyan törölhet egy dokumentumot. A keresési szolgáltatásban a dokumentumok nem kapcsolódnak egymáshoz, ezért a törlésnek nincs hatása az index többi részére.

  1. Határozza meg, hogy melyik mező a dokumentumkulcs. A portálon megtekintheti az egyes indexek mezőit. A dokumentumkulcsok sztringmezők, és kulcsikonnal vannak jelölve, hogy könnyebben észrevehetők legyenek.

  2. Ellenőrizze a dokumentumkulcs mező értékeit: search=*&$select=HotelId. Az egyszerű sztringek egyszerűek, de ha az index egy base-64 kódolású mezőt használ, vagy ha keresési dokumentumokat hoztak létre egy parsingMode beállításból, előfordulhat, hogy olyan értékekkel dolgozik, amelyeket nem ismer.

  3. Keresse meg a dokumentumot a dokumentumazonosító értékének ellenőrzéséhez és a dokumentum tartalmának áttekintéséhez a törlés előtt. Adja meg a kérés kulcsát vagy dokumentumazonosítóját. Az alábbi példák egy egyszerű sztringet mutatnak be a Hotels mintaindexhez , valamint egy base-64 kódolású sztringet a fogaskerék-keresés-demo index metadata_storage_path kulcsához.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Törölje a dokumentumot a keresési indexből való eltávolításához.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Lásd még