Adatok indexelése az Azure Blob Storage-ból

2025-05-08

Ebből a cikkből megtudhatja, hogyan konfigurálhat olyan indexelőt, amely tartalmat importál az Azure Blob Storage-ból, és hogyan teszi kereshetővé az Azure AI Searchben. Az indexelő bemenetei a blobok, egyetlen tárolóban. A kimenet egy keresési index, amely az egyes mezőkben tárolt kereshető tartalmakat és metaadatokat tartalmazza.

Az indexelő konfigurálásához és futtatásához a következőt használhatja:

Search Service REST API, bármely verzió.
Bármilyen Azure SDK-csomag.
Adatimportálás varázsló az Azure Portalon.
Adatok importálása és vektorizálása varázsló az Azure Portalon.

Ez a cikk a REST API-kat használja az egyes lépések szemléltetésére.

Feljegyzés

Az Azure AI Search mostantól betöltheti az RBAC-hatókört az indexelés során, és átviheti ezeket az engedélyeket a keresési indexben lévő indexelt tartalomra. Az RBAC-hatókör indexelés közbeni használatáról további információt az Azure Role-Based hozzáférés-vezérlési hatókör indexelőkkel való indexelése című témakörben talál.

Előfeltételek

Azure Blob Storage, Standard teljesítmény (általános célú v2).
A hozzáférési szintek közé tartozik a gyakori elérésű, a ritka elérésű, a ritka elérésű és az archiválás. Az indexelők lekérhetik a blobokat gyakori, ritka elérésű és hideg hozzáférési szinteken.
Szöveges tartalmat és metaadatokat biztosító blobok. Ha a blobok bináris tartalmat vagy strukturálatlan szöveget tartalmaznak, érdemes lehet AI-bővítést hozzáadni a kép- és természetes nyelvi feldolgozáshoz. A blobtartalmak nem léphetik túl a keresési szolgáltatási szint indexelőkorlátait .
Támogatott hálózati konfiguráció és adathozzáférés. Legalább olvasási engedélyekre van szüksége az Azure Storage-ban. A hozzáférési kulcsot tartalmazó tárolási kapcsolati sztring olvasási hozzáférést biztosít a tártartalmakhoz. Ha ehelyett Microsoft Entra-bejelentkezéseket és szerepköröket használ, győződjön meg arról, hogy a keresési szolgáltatás felügyelt identitása rendelkezik Storage Blob Data Reader-engedélyekkel .

Alapértelmezés szerint a keresés és a tárolás is fogadja a nyilvános IP-címekről érkező kéréseket. Ha a hálózati biztonság nem azonnali probléma, akkor csak a kapcsolati sztring és olvasási engedélyek használatával indexelheti a blobadatokat. Ha készen áll a hálózati védelem hozzáadására, tekintse meg az Indexelő azure-beli hálózati biztonsági funkciókkal védett tartalmakhoz való hozzáférését az adathozzáféréssel kapcsolatos útmutatásért.
REST-ügyfél használatával a cikkben bemutatottakhoz hasonló REST-hívásokat hozhat létre.

Támogatott tevékenységek

Ezt az indexelőt a következő feladatokhoz használhatja:

Adatindexelés és növekményes indexelés: Az indexelő képes a blobtárolókból és mappákból származó fájlok és kapcsolódó metaadatok indexelésével. Az új és frissített fájlokat és metaadatokat a beépített változásészlelés segítségével észleli. Az adatfrissítést ütemezés szerint vagy igény szerint konfigurálhatja.
Törlésészlelés: Az indexelő natív helyreállítható törléssel vagy egyéni metaadatokkal észlelheti a törléseket.
Alkalmazott mi a képességkészleteken keresztül:A képességkészleteket az indexelő teljes mértékben támogatja. Ide tartoznak az olyan kulcsfontosságú funkciók, mint az integrált vektorizálás , amely adattömböket és beágyazási lépéseket ad hozzá.
Elemzési módok: Az indexelő támogatja a JSON-elemzési módokat , ha JSON-tömböket vagy sorokat szeretne elemezni az egyes keresési dokumentumokban. Támogatja a Markdown-elemzési módot is.
Kompatibilitás más funkciókkal: Az indexelő úgy lett kialakítva, hogy zökkenőmentesen működjön más indexelő funkciókkal, például hibakeresési munkamenetekkel, indexelő gyorsítótárral a növekményes bővítésekhez és a tudástárhoz.

Támogatott dokumentumformátumok

A blobindexelő a következő dokumentumformátumokból tud szöveget kinyerni:

CSV (lásd : CSV-blobok indexelése)
EML
EPUB
GZ
HTML
JSON (lásd : JSON-blobok indexelése)
KML (XML földrajzi ábrázolásokhoz)
Microsoft Office-formátumok: DOCX/DOC/DOCM, XLSX/XLS/XLSM, PPTX/PPT/PPTM, MSG (Outlook-e-mailek), XML (2003 és 2006 WORD XML)
Dokumentumformátumok megnyitása: ODT, ODS, ODP
PDF
Egyszerű szöveges fájlok (lásd még : Egyszerű szöveg indexelése)
Rich Text Formátum (RTF)
XML
FÜTYÜLÉS

Az indexelendő blobok meghatározása

Mielőtt beállítja az indexelést, tekintse át a forrásadatokat, és állapítsa meg, hogy a módosításokat elöl kell-e elvégezni. Az indexelők egyszerre egyetlen tárolóból is indexelhetik a tartalmat. Alapértelmezés szerint a tárolóban lévő összes blob feldolgozása történik. A szelektív feldolgozás több lehetőséggel is rendelkezik:

Helyezze a blobokat egy virtuális mappába. Az indexelő adatforrás-definíciója tartalmaz egy "lekérdezési" paramétert, amely képes virtuális mappát venni. Ha virtuális mappát ad meg, a rendszer csak a mappában lévő blobokat indexeli.
Blobok belefoglalása vagy kizárása fájltípus szerint. A támogatott dokumentumformátumok listája segít meghatározni, hogy mely blobokat kell kizárni. Előfordulhat például, hogy ki szeretné zárni azokat a kép- vagy hangfájlokat, amelyek nem nyújtanak kereshető szöveget. Ezt a képességet az indexelő konfigurációs beállításai vezérlik.

Tetszőleges blobok belefoglalása vagy kizárása. Ha valamilyen okból ki szeretne hagyni egy adott blobot, a Blob Storage-ban a következő metaadat-tulajdonságokat és értékeket adhat hozzá a blobokhoz. Amikor egy indexelő találkozik ezzel a tulajdonságmal, kihagyja a blobot vagy annak tartalmát az indexelési futtatás során.

Tulajdonság neve	Tulajdonságérték	Magyarázat
AzureSearch_Skip	`"true"`	Utasítja a blobindexelőt, hogy hagyja ki teljesen a blobot. Sem a metaadatok, sem a tartalom kinyerése nem történik meg. Ez akkor hasznos, ha egy adott blob ismétlődően meghiúsul, és megszakítja az indexelési folyamatot.
Azure keresés - SkipContent	`"true"`	Kihagyja a tartalmat, és csak a metaadatokat nyeri ki. ez egyenértékű a `"dataToExtract" : "allMetadata"` konfigurációs beállításokban leírt beállítással, amely csak egy adott blobra terjed ki.

Ha nem állít be befogadási vagy kizárási feltételeket, az indexelő hibaként jelent egy nem jogosult blobot, és továbbléphet. Ha elegendő hiba történik, a feldolgozás leállhat. Az indexelő konfigurációs beállításaiban megadhatja a hibatűrést.

Az indexelők általában blobonként egy keresési dokumentumot hoznak létre, ahol a szöveges tartalom és a metaadatok kereshető mezőkként vannak rögzítve egy indexben. Ha a blobok teljes fájlok, több keresési dokumentumba is elemezheti őket. Elemezheti például egy CSV-fájl sorait, hogy soronként egy keresési dokumentumot hozzon létre.

Összetett vagy beágyazott dokumentum (például ZIP-archívum, mellékleteket tartalmazó beágyazott Outlook-e-maileket tartalmazó Word-dokumentum vagy . A mellékleteket tartalmazó MSG-fájl is egyetlen dokumentumként van indexelve. Például a mellékletekből kinyert összes kép. Az MSG-fájl a normalized_images mezőben lesz visszaadva. Ha rendelkezik képekkel, fontolja meg az AI-bővítés hozzáadását, hogy több keresési segédprogramot kapjon az adott tartalomból.

A dokumentum szöveges tartalma egy "content" nevű sztringmezőbe lesz kinyerve. Standard és felhasználó által definiált metaadatokat is kinyerhet.

Blob metaadatainak indexelése

A blob metaadatai indexelhetők is, és ez akkor hasznos, ha úgy gondolja, hogy a standard vagy egyéni metaadat-tulajdonságok bármelyike hasznos a szűrőkben és a lekérdezésekben.

A rendszer szó szerint kinyeri a felhasználó által megadott metaadat-tulajdonságokat. Az értékek fogadásához meg kell határoznia a típus keresési indexében Edm.Stringlévő mezőt, amelynek neve megegyezik a blob metaadatkulcsával. Ha például egy blob rendelkezik értékekkel rendelkező metaadat-kulccsalSensitivity, meg kell adnia egy, a keresési indexben elnevezett High mezőt, amely az értékkel Sensitivitylesz feltöltve.High

A standard blob metaadat-tulajdonságai az alábbiak szerint hasonló nevű és beírt mezőkbe nyerhetők ki. A blobindexelő automatikusan belső mezőleképezéseket hoz létre ezekhez a blob metaadat-tulajdonságokhoz, és az eredeti kötőjeles nevet ("metadata-storage-name") egy alászúrt egyenértékű névvé ("metadata_storage_name") konvertálja.

Továbbra is hozzá kell adnia az aláhúzott mezőket az indexdefinícióhoz, de kihagyhatja a mezők leképezését, mert az indexelő automatikusan társítja.

metadata_storage_name (Edm.String) – a blob fájlneve. Ha például blob /my-container/my-folder/subfolder/resume.pdf van, akkor ennek a mezőnek az értéke.resume.pdf
metadata_storage_path (Edm.String) - a blob teljes URI-ja, beleértve a tárfiókot is. Például: https://myaccount.blob.core.windows.net/my-container/my-folder/subfolder/resume.pdf
metadata_storage_content_type (Edm.String) – a blob feltöltéséhez használt kód által megadott tartalomtípus. Például: application/octet-stream.
metadata_storage_last_modified (Edm.DateTimeOffset) – a blob utolsó módosított időbélyege. Az Azure AI Search ezzel az időbélyegzővel azonosítja a módosított blobokat, hogy elkerülje a kezdeti indexelés utáni újraindexelést.
metadata_storage_size (Edm.Int64) – a blob mérete bájtban.
metadata_storage_content_md5 (Edm.String) – A blobtartalom MD5 kivonata, ha elérhető.
metadata_storage_sas_token (Edm.String) – Ideiglenes SAS-jogkivonat, amelyet egyéni képességek használhatnak a blobhoz való hozzáféréshez. Ezt a jogkivonatot nem szabad későbbi használatra tárolni, mert előfordulhat, hogy lejár.

Végül az indexelt blobok dokumentumformátumára vonatkozó metaadat-tulajdonságok is megjeleníthetők az indexsémában. A tartalomspecifikus metaadatokról további információt a Tartalom metaadatainak tulajdonságai című témakörben talál.

Fontos kiemelni, hogy nem kell mezőket definiálnia a keresési indexben szereplő összes fenti tulajdonsághoz – csak rögzítse az alkalmazáshoz szükséges tulajdonságokat.

Az indexelő jelenleg nem támogatja a blobindex-címkék indexelését.

Az adatforrás meghatározása

Az adatforrás definíciója meghatározza az adatok indexeléséhez, hitelesítő adataihoz és szabályzataihoz az adatok változásainak azonosításához. Egy adatforrás független erőforrásként van definiálva, így több indexelő is használhatja.

Adatforrás létrehozása vagy frissítése a definíció beállításához:

{
    "name" : "my-blob-datasource",
    "type" : "azureblob",
    "credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<account name>;AccountKey=<account key>;" },
    "container" : { "name" : "my-container", "query" : "<optional-virtual-directory-name>" }
}

Állítsa be a "azureblob" "type" (típus) értéket (kötelező).
Állítsa be a "hitelesítő adatokat" egy Azure Storage-kapcsolati sztring. A következő szakasz a támogatott formátumokat ismerteti.
Állítsa a "tárolót" a blobtárolóra, és a "lekérdezés" használatával adja meg az almappákat.

Az adatforrás-definíciók tartalmazhatnak helyreállítható törlési szabályzatokat is, ha azt szeretné, hogy az indexelő töröljön egy keresési dokumentumot, amikor a forrásdokumentum törlésre van megjelölve.

Támogatott hitelesítő adatok és kapcsolati sztring

Az indexelők az alábbi kapcsolatokkal csatlakozhatnak egy blobtárolóhoz.

Teljes hozzáférésű tárfiók kapcsolati sztring
`{ "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<your storage account>;AccountKey=<your account key>;" }`
A kapcsolati karakterláncot az Azure Portal Tárfiók oldalán a bal oldali panelen található Hozzáférési kulcsok kiválasztásával szerezheti be. Ügyeljen arra, hogy a teljes kapcsolati sztring ne csak egy kulcsot válasszon.

Felügyelt identitás kapcsolati sztring
`{ "connectionString" : "ResourceId=/subscriptions/<your subscription ID>/resourceGroups/<your resource group name>/providers/Microsoft.Storage/storageAccounts/<your storage account name>/;" }`
Ez a kapcsolati sztring nem igényel fiókkulcsot, de korábban konfigurálnia kell egy keresési szolgáltatást a felügyelt identitással való csatlakozáshoz.

Tárfiók megosztott hozzáférésű jogosultságkódja** (SAS) kapcsolati sztring
`{ "connectionString" : "BlobEndpoint=https://<your account>.blob.core.windows.net/;SharedAccessSignature=?sv=2016-05-31&sig=<the signature>&spr=https&se=<the validity end time>&srt=co&ss=b&sp=rl;" }`
Az SAS-nek rendelkeznie kell a tárolókra és objektumokra (ebben az esetben blobokra) vonatkozó listával és olvasási engedélyekkel.

Tároló közös hozzáférésű jogosultságkódja
`{ "connectionString" : "ContainerSharedAccessUri=https://<your storage account>.blob.core.windows.net/<container name>?sv=2016-05-31&sr=c&sig=<the signature>&se=<the validity end time>&sp=rl;" }`
Az SAS-nek rendelkeznie kell a tárolóra vonatkozó listával és olvasási engedélyekkel. További információ: Közös hozzáférésű jogosultságkódok használata.

Feljegyzés

Ha SAS-hitelesítő adatokat használ, a lejáratuk megakadályozása érdekében rendszeresen frissítenie kell az adatforrás hitelesítő adatait megújított aláírásokkal. Ha az SAS hitelesítő adatai lejárnak, az indexelő a következőhöz hasonló hibaüzenettel fog meghiúsulni: "A kapcsolati sztring megadott hitelesítő adatok érvénytelenek vagy lejártak".

Keresési mezők hozzáadása indexhez

Egy keresési indexben adjon hozzá mezőket az Azure-blobok tartalmának és metaadatainak elfogadásához.

Hozzon létre vagy frissítsen egy indexet a blobtartalmakat és metaadatokat tároló keresési mezők definiálásához:

POST https://[service name].search.windows.net/indexes?api-version=2024-07-01
{
    "name" : "my-search-index",
    "fields": [
        { "name": "ID", "type": "Edm.String", "key": true, "searchable": false },
        { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false },
        { "name": "metadata_storage_name", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true  },
        { "name": "metadata_storage_size", "type": "Edm.Int64", "searchable": false, "filterable": true, "sortable": true  },
        { "name": "metadata_storage_content_type", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true },        
    ]
}

Hozzon létre egy dokumentumkulcsmezőt ("key": true). Blobtartalmak esetén a legjobb jelöltek a metaadat-tulajdonságok.
- metadata_storage_path (alapértelmezett) az objektum vagy fájl teljes elérési útja. A kulcsmező ("Azonosító" ebben a példában) a metadata_storage_path értékeivel lesz feltöltve, mert ez az alapértelmezett érték.
- metadata_storage_name, csak akkor használható, ha a nevek egyediek. Ha ezt a mezőt szeretné kulcsként használni, lépjen "key": true erre a meződefinícióra.
- A blobokhoz hozzáadott egyéni metaadat-tulajdonság. Ehhez a beállításhoz a blobfeltöltési folyamatnak hozzá kell adnia ezt a metaadat-tulajdonságot az összes blobhoz. Mivel a kulcs egy kötelező tulajdonság, az érték nélküli blobok indexelése sikertelen lesz. Ha egyéni metaadat-tulajdonságot használ kulcsként, ne módosítsa a tulajdonságot. Az indexelők duplikált dokumentumokat adnak hozzá ugyanahhoz a blobhoz, ha a kulcstulajdonság megváltozik.
A metaadat-tulajdonságok gyakran tartalmaznak olyan karaktereket, például / és -, amelyek érvénytelenek a dokumentumkulcsok esetében. Az indexelő azonban automatikusan kódolja a kulcs metaadat-tulajdonságát, és nincs szükség konfigurációra vagy mezőleképezésre.
Adjon hozzá egy "content" mezőt az egyes fájlokból kinyert szöveg tárolásához a blob "content" tulajdonságán keresztül. Ezt a nevet nem kell használnia, de így kihasználhatja az implicit mezőleképezések előnyeit.
Adjon hozzá mezőket a szabványos metaadat-tulajdonságokhoz. Az indexelő elolvashatja az egyéni metaadat-tulajdonságokat, a szabványos metaadat-tulajdonságokat és a tartalomspecifikus metaadat-tulajdonságokat .

A blobindexelő konfigurálása és futtatása

Az index és az adatforrás létrehozása után készen áll az indexelő létrehozására. Az indexelő konfigurációja meghatározza a futási idő viselkedését vezérlő bemeneteket, paramétereket és tulajdonságokat. Megadhatja azt is, hogy a blob mely részeit indexelje.

Hozzon létre vagy frissítsen egy indexelőt úgy, hogy megad neki egy nevet, és hivatkozik az adatforrásra és a célindexre:

POST https://[service name].search.windows.net/indexers?api-version=2024-07-01
{
  "name" : "my-blob-indexer",
  "dataSourceName" : "my-blob-datasource",
  "targetIndexName" : "my-search-index",
  "parameters": {
      "batchSize": null,
      "maxFailedItems": null,
      "maxFailedItemsPerBatch": null,
      "configuration": {
          "indexedFileNameExtensions" : ".pdf,.docx",
          "excludedFileNameExtensions" : ".png,.jpeg",
          "dataToExtract": "contentAndMetadata",
          "parsingMode": "default"
      }
  },
  "schedule" : { },
  "fieldMappings" : [ ]
}

Állítsa be batchSize , hogy az alapértelmezett (10 dokumentum) kihasználatlan vagy túlterhelt-e a rendelkezésre álló erőforrásokat. Az alapértelmezett kötegméretek adatforrás-specifikusak. A blobindexelés a kötegméretet 10 dokumentumra állítja a nagyobb átlagos dokumentumméret elismeréseként.
A "konfiguráció" alatt szabályozhatja, hogy mely blobokat indexelje a fájltípus alapján, vagy hagyja meg nem határozottul az összes blob lekéréséhez.

Ehhez "indexedFileNameExtensions"adja meg a fájlkiterjesztések vesszővel tagolt listáját (vezető ponttal). Ugyanezzel "excludedFileNameExtensions" a módszerrel jelezheti, hogy mely bővítményeket kell kihagyni. Ha ugyanaz a bővítmény mindkét listában szerepel, akkor a rendszer kizárja az indexelésből.
A "konfiguráció" területen állítsa be a "dataToExtract" értéket a blobok indexelt részeinek szabályozásához:
- A "contentAndMetadata" azt határozza meg, hogy a blobból kinyert összes metaadat és szöveges tartalom indexelve legyen. Ez az alapértelmezett érték.
- A "storageMetadata" azt határozza meg, hogy csak a standard blobtulajdonságok és a felhasználó által megadott metaadatok legyenek indexelve.
- Az "allMetadata" azt határozza meg, hogy a standard blobtulajdonságok és a talált tartalomtípusok metaadatai ki lesznek nyerve a blob tartalmából, és indexelve lesznek.
A "konfiguráció" területen állítsa be a "parsingMode" értéket. Az alapértelmezett elemzési mód blobonként egy keresési dokumentum. Ha a blobok egyszerű szövegesek, jobb teljesítményt érhet el, ha egyszerű szöveges elemzésre vált. Ha részletesebb elemzésre van szüksége, amely blobokat képez le több keresési dokumentumra, adjon meg egy másik módot. Az egy-a-többhöz elemzés az alábbi blobok esetében támogatott:
- JSON-dokumentumok
- CSV-fájlok
Mezőleképezéseket adhat meg, ha a mezőnév vagy a típus eltérést mutat, vagy ha egy forrásmező több verziójára van szüksége a keresési indexben.

A blobindexelés során gyakran kihagyhatja a mezőleképezéseket, mert az indexelő beépített támogatással rendelkezik a "tartalom" és a metaadat tulajdonságainak az index hasonló nevű és beírt mezőihez való leképezéséhez. A metaadat-tulajdonságok esetében az indexelő automatikusan lecseréli a kötőjeleket - aláhúzásjelekre a keresési indexben.
További információt az egyéb tulajdonságokról az Indexelő létrehozása című témakörben talál. A paraméterleírások teljes listáját a REST API-ból tekintheti meg.

Az indexelő automatikusan fut a létrehozásakor. Ezt úgy akadályozhatja meg, hogy a "letiltva" értéket igaz értékre állítja. Az indexelő végrehajtásának szabályozásához futtasson egy indexelőt igény szerint , vagy ütemezze.

Adatok indexelése több Azure Blob-tárolóból egyetlen indexbe

Ne feledje, hogy az indexelők csak egyetlen tárolóból indexelhetik az adatokat. Ha a követelmény az adatok több tárolóból való indexelése és egyetlen AI Search-indexbe való összevonása, ez több indexelő konfigurálásával érhető el, amelyek mindegyike ugyanarra az indexre irányul. Vegye figyelembe, hogy termékváltozatonként legfeljebb hány indexelő érhető el.

A szemléltetés érdekében vegyünk egy példát két indexelőre, amelyek két különböző adatforrásból, névvel és my-blob-datasource1névvel my-blob-datasource2 vonják le az adatokat. Minden adatforrás egy külön Azure Blob-tárolóra mutat, de mindkettő ugyanahhoz az indexhez van osztva.my-search-index

Első indexelődefiníciós példa:

POST https://[service name].search.windows.net/indexers?api-version=2024-07-01
{
  "name" : "my-blob-indexer1",
  "dataSourceName" : "my-blob-datasource1",
  "targetIndexName" : "my-search-index",
  "parameters": {
      "batchSize": null,
      "maxFailedItems": null,
      "maxFailedItemsPerBatch": null,
      "configuration": {
          "indexedFileNameExtensions" : ".pdf,.docx",
          "excludedFileNameExtensions" : ".png,.jpeg",
          "dataToExtract": "contentAndMetadata",
          "parsingMode": "default"
      }
  },
  "schedule" : { },
  "fieldMappings" : [ ]
}

Párhuzamos példában futó második indexelődefiníció:

POST https://[service name].search.windows.net/indexers?api-version=2024-07-01
{
  "name" : "my-blob-indexer2",
  "dataSourceName" : "my-blob-datasource2",
  "targetIndexName" : "my-search-index",
  "parameters": {
      "batchSize": null,
      "maxFailedItems": null,
      "maxFailedItemsPerBatch": null,
      "configuration": {
          "indexedFileNameExtensions" : ".pdf,.docx",
          "excludedFileNameExtensions" : ".png,.jpeg",
          "dataToExtract": "contentAndMetadata",
          "parsingMode": "default"
      }
  },
  "schedule" : { },
  "fieldMappings" : [ ]
}

Az indexelő állapotának ellenőrzése

Az indexelőzmények állapotának és végrehajtási előzményeinek figyeléséhez küldjön egy indexelőzmény-lekéréses kérést:

GET https://myservice.search.windows.net/indexers/myindexer/status?api-version=2024-07-01
  Content-Type: application/json  
  api-key: [admin key]

A válasz tartalmazza az állapotot és a feldolgozott elemek számát. A következő példához hasonlóan kell kinéznie:

    {
        "status":"running",
        "lastResult": {
            "status":"success",
            "errorMessage":null,
            "startTime":"2022-02-21T00:23:24.957Z",
            "endTime":"2022-02-21T00:36:47.752Z",
            "errors":[],
            "itemsProcessed":1599501,
            "itemsFailed":0,
            "initialTrackingState":null,
            "finalTrackingState":null
        },
        "executionHistory":
        [
            {
                "status":"success",
                "errorMessage":null,
                "startTime":"2022-02-21T00:23:24.957Z",
                "endTime":"2022-02-21T00:36:47.752Z",
                "errors":[],
                "itemsProcessed":1599501,
                "itemsFailed":0,
                "initialTrackingState":null,
                "finalTrackingState":null
            },
            ... earlier history items
        ]
    }

A végrehajtási előzmények legfeljebb 50 legutóbbi végrehajtást tartalmaznak, amelyek fordított időrendi sorrendben vannak rendezve, hogy a legújabb végrehajtás legyen az első.

Hibakezelés

Az indexelés során gyakran előforduló hibák közé tartoznak a nem támogatott tartalomtípusok, a hiányzó tartalom vagy a túlméretezett blobok.

Alapértelmezés szerint a blobindexelő leáll, amint nem támogatott tartalomtípussal (például hangfájllal) találkozik. A "excludedFileNameExtensions" paraméter használatával kihagyhat bizonyos tartalomtípusokat. Előfordulhat azonban, hogy az indexelést akkor is folytatni szeretné, ha hibák történnek, majd később hibakeresést végezhet az egyes dokumentumokban. Az indexelő hibáival kapcsolatos további információkért tekintse meg az Indexer hibaelhárítási útmutatóját , valamint az Indexelő hibáit és figyelmeztetéseit.

Öt indexelőtulajdonság vezérli az indexelő válaszát hibák esetén.

PUT /indexers/[indexer name]?api-version=2024-07-01
{
  "parameters" : { 
    "maxFailedItems" : 10, 
    "maxFailedItemsPerBatch" : 10,
    "configuration" : { 
        "failOnUnsupportedContentType" : false, 
        "failOnUnprocessableDocument" : false,
        "indexStorageMetadataOnlyForOversizedDocuments": false
      }
    }
}

Paraméter	Érvényes értékek	Leírás
maximális hibás elemek	-1, null vagy 0, pozitív egész szám	Folytassa az indexelést, ha hibák történnek a feldolgozás bármely pontján, akár blobok elemzésekor, akár dokumentumok indexhez való hozzáadásakor. Állítsa be ezeket a tulajdonságokat az elfogadható hibák számára. A feldolgozás a hibák számától `-1` függetlenül lehetővé teszi a feldolgozást. Ellenkező esetben az érték pozitív egész szám.
maximális sikertelen elemek száma tételenként	-1, null vagy 0, pozitív egész szám	Ugyanaz, mint a fenti, de kötegelt indexeléshez használatos.
Nem támogatott tartalomtípusra hiba	igaz vagy hamis	Ha az indexelő nem tudja meghatározni a tartalomtípust, adja meg, hogy folytatja-e a feladatot, vagy nem.
"hibaNemFeldolgozhatóDokumentumEsetén"	igaz vagy hamis	Ha az indexelő nem tud feldolgozni egy egyébként támogatott tartalomtípusú dokumentumot, adja meg, hogy folytatja-e a feladatot, vagy nem.
indexTárHelyMetaadatCsakTúlméretesDokumentumokhoz	igaz vagy hamis	A túlméretezett blobokat alapértelmezés szerint hibaként kezeli a rendszer. Ha igaz értékre állítja ezt a paramétert, az indexelő akkor is megpróbálja indexelni a metaadatait, ha a tartalom nem indexelhető. A blob méretére vonatkozó korlátozásokért tekintse meg a szolgáltatás korlátait.