Indexers - Create
Vytvoří nový indexer.
POST {endpoint}/indexers?api-version=2025-09-01
Parametry identifikátoru URI
| Name | V | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Adresa URL koncového bodu vyhledávací služby. |
|
api-version
|
query | True |
string |
Verze rozhraní API klienta. |
Hlavička požadavku
| Name | Vyžadováno | Typ | Description |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
ID sledování odeslané s požadavkem na pomoc s laděním. |
Text požadavku
| Name | Vyžadováno | Typ | Description |
|---|---|---|---|
| dataSourceName | True |
string |
Název zdroje dat, ze kterého tento indexer čte data. |
| name | True |
string |
Název indexeru. |
| targetIndexName | True |
string |
Název indexu, do kterého tento indexer zapisuje data. |
| @odata.etag |
string |
Značka ETag indexeru. |
|
| description |
string |
Popis indexeru. |
|
| disabled |
boolean |
Hodnota označující, zda je indexer zakázán. Výchozí hodnota je False. |
|
| encryptionKey |
Popis šifrovacího klíče, který vytvoříte v Azure Key Vault. Tento klíč se používá k poskytnutí další úrovně šifrování neaktivních uložených dat pro definici indexeru (a také stav spuštění indexeru), když chcete mít plnou jistotu, že je nikdo, ani Microsoft, nemůže dešifrovat. Jakmile definici indexeru zašifrujete, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít žádný vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo později. |
||
| fieldMappings |
Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu. |
||
| outputFieldMappings |
Mapování výstupních polí se aplikují po rozšíření a bezprostředně před indexováním. |
||
| parameters |
Parametry pro spuštění indexeru. |
||
| schedule |
Plán pro tento indexer. |
||
| skillsetName |
string |
Název sady dovedností spuštěné s tímto indexerem. |
Odpovědi
| Name | Typ | Description |
|---|---|---|
| 201 Created | ||
| Other Status Codes |
Chybová odpověď. |
Příklady
SearchServiceCreateIndexer
Ukázkový požadavek
POST https://stableexampleservice.search.windows.net/indexers?api-version=2025-09-01
{
"name": "myindexer",
"description": "Description of the indexer",
"dataSourceName": "mydocdbdatasource",
"skillsetName": "myskillset",
"targetIndexName": "stable-test",
"schedule": {
"interval": "P1D",
"startTime": "2025-01-07T19:30:00Z"
},
"parameters": {
"batchSize": 10,
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5,
"configuration": {
"excludedFileNameExtensions": ".png,.mp4",
"indexedFileNameExtensions": ".docx,.pptx",
"failOnUnsupportedContentType": true,
"failOnUnprocessableDocument": false,
"indexStorageMetadataOnlyForOversizedDocuments": true,
"delimitedTextHeaders": "Header1,Header2",
"delimitedTextDelimiter": "|",
"firstLineContainsHeaders": true,
"documentRoot": "/root",
"dataToExtract": "storageMetadata",
"imageAction": "none",
"allowSkillsetToReadFileData": false,
"pdfTextRotationAlgorithm": "none",
"executionEnvironment": "standard"
}
},
"fieldMappings": [
{
"sourceFieldName": "/document",
"targetFieldName": "name",
"mappingFunction": {
"name": "base64Encode"
}
}
],
"outputFieldMappings": [
{
"sourceFieldName": "/document",
"targetFieldName": "name",
"mappingFunction": {
"name": "base64Encode"
}
}
],
"disabled": false,
"@odata.etag": "0x1234568AE7E58A1"
}
Ukázková odpověď
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "myindexer",
"description": "Description of the indexer",
"dataSourceName": "mydocdbdatasource",
"skillsetName": "myskillset",
"targetIndexName": "stable-test",
"disabled": false,
"schedule": {
"interval": "P1D",
"startTime": "2024-06-06T00:01:50.265Z"
},
"parameters": {
"batchSize": 10,
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5,
"configuration": {
"excludedFileNameExtensions": ".png,.mp4",
"indexedFileNameExtensions": ".docx,.pptx",
"failOnUnsupportedContentType": true,
"failOnUnprocessableDocument": false,
"indexStorageMetadataOnlyForOversizedDocuments": true,
"delimitedTextHeaders": "Header1,Header2",
"delimitedTextDelimiter": "|",
"firstLineContainsHeaders": true,
"documentRoot": "/root",
"dataToExtract": "storageMetadata",
"imageAction": "none",
"allowSkillsetToReadFileData": false,
"pdfTextRotationAlgorithm": "none",
"executionEnvironment": "standard"
}
},
"fieldMappings": [
{
"sourceFieldName": "/document",
"targetFieldName": "name",
"mappingFunction": {
"name": "base64Encode"
}
}
],
"outputFieldMappings": [
{
"sourceFieldName": "/document",
"targetFieldName": "name",
"mappingFunction": {
"name": "base64Encode"
}
}
]
}
Definice
| Name | Description |
|---|---|
|
Azure |
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, která se používá pro ověřený přístup k šifrovacím klíčům uloženým v Azure Key Vault. |
|
Blob |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure. |
|
Blob |
Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností. |
|
Blob |
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure. |
|
Blob |
Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure. |
|
Error |
Další informace o chybě správy prostředků |
|
Error |
Podrobnosti o chybě. |
|
Error |
Chybová odpověď |
|
Field |
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu. |
|
Field |
Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním. |
|
Indexer |
Určuje prostředí, ve kterém by měl indexer spuštěn. |
|
Indexing |
Představuje parametry pro spuštění indexeru. |
|
Indexing |
Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
|
Indexing |
Představuje plán provádění indexeru. |
|
Search |
Představuje indexer. |
|
Search |
Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, lze použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym. |
AzureActiveDirectoryApplicationCredentials
Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, která se používá pro ověřený přístup k šifrovacím klíčům uloženým v Azure Key Vault.
| Name | Typ | Description |
|---|---|---|
| applicationId |
string |
ID aplikace AAD, kterému byla udělena požadovaná přístupová oprávnění k Azure Key Vault, které se má použít při šifrování neaktivních uložených dat. ID aplikace by nemělo být zaměňováno s ID objektu pro vaši aplikaci AAD. |
| applicationSecret |
string |
Ověřovací klíč zadané aplikace AAD. |
BlobIndexerDataToExtract
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure.
| Hodnota | Description |
|---|---|
| storageMetadata |
Indexuje pouze standardní vlastnosti objektu blob a metadata zadaná uživatelem. |
| allMetadata |
Extrahuje metadata poskytnutá subsystémem služby Azure Blob Storage a metadata specifická pro typ obsahu (například metadata jedinečná pouze pro .png jsou soubory indexovány). |
| contentAndMetadata |
Extrahuje všechna metadata a textový obsah z každého objektu blob. |
BlobIndexerImageAction
Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností.
| Hodnota | Description |
|---|---|
| none |
Ignoruje vložené obrazy nebo obrazové soubory v sadě dat. Toto je výchozí hodnota. |
| generateNormalizedImages |
Extrahuje text z obrazů (například slovo "STOP" ze značky STOP) a vloží ho do pole obsahu. Tato akce vyžaduje, aby byla hodnota "dataToExtract" nastavena na hodnotu "contentAndMetadata". Normalizovaný obrázek označuje dodatečné zpracování, jehož výsledkem je jednotný obrazový výstup, jehož velikost a otočení podporuje konzistentní vykreslování, když zahrnete obrázky do vizuálních výsledků hledání. Tyto informace se generují pro každý obraz, když použijete tuto volbu. |
| generateNormalizedImagePerPage |
Extrahuje text z obrazů (například slovo "STOP" ze značky STOP) a vloží ho do pole obsahu, ale se soubory PDF zachází odlišně v tom smyslu, že každá stránka bude vykreslena jako obrázek a podle toho normalizována, místo aby se extrahovaly vložené obrazy. S typy souborů, které nejsou ve formátu PDF, se bude zacházet stejně, jako kdyby bylo nastaveno "generateNormalizedImages". |
BlobIndexerParsingMode
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.
| Hodnota | Description |
|---|---|
| default |
Nastavte na výchozí pro normální zpracování souborů. |
| text |
Nastavením na text zlepšíte výkon indexování souborů ve formátu prostého textu v úložišti objektů blob. |
| delimitedText |
Nastavte na delimitedText, pokud jsou objekty blob prosté soubory CSV. |
| json |
Nastavte na json, chcete-li extrahovat strukturovaný obsah ze souborů JSON. |
| jsonArray |
Nastavte na jsonArray , chcete-li extrahovat jednotlivé prvky pole JSON jako samostatné dokumenty. |
| jsonLines |
Nastavte na jsonLines, chcete-li extrahovat jednotlivé entity JSON oddělené novým řádkem jako samostatné dokumenty. |
BlobIndexerPDFTextRotationAlgorithm
Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure.
| Hodnota | Description |
|---|---|
| none |
Využívá normální extrakci textu. Toto je výchozí hodnota. |
| detectAngles |
Může vést k lepší a čitelnější extrakci textu ze souborů PDF, které obsahují otočený text. Všimněte si, že při použití tohoto parametru může dojít k malému dopadu na rychlost výkonu. Tento parametr se vztahuje pouze na soubory PDF a pouze na soubory PDF s vloženým textem. Pokud se otočený text objeví ve vloženém obrazu v PDF, tento parametr se nepoužije. |
ErrorAdditionalInfo
Další informace o chybě správy prostředků
| Name | Typ | Description |
|---|---|---|
| info |
object |
Další informace. |
| type |
string |
Další typ informací. |
ErrorDetail
Podrobnosti o chybě.
| Name | Typ | Description |
|---|---|---|
| additionalInfo |
Další informace o chybě. |
|
| code |
string |
Kód chyby. |
| details |
Podrobnosti o chybě. |
|
| message |
string |
Chybová zpráva. |
| target |
string |
Cíl chyby. |
ErrorResponse
Chybová odpověď
| Name | Typ | Description |
|---|---|---|
| error |
Objekt chyby. |
FieldMapping
Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu.
| Name | Typ | Description |
|---|---|---|
| mappingFunction |
Funkce, která se má použít na každou hodnotu zdrojového pole před indexováním. |
|
| sourceFieldName |
string |
Název pole ve zdroji dat. |
| targetFieldName |
string |
Název cílového pole v rejstříku. Ve výchozím nastavení je stejný jako název zdrojového pole. |
FieldMappingFunction
Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním.
| Name | Typ | Description |
|---|---|---|
| name |
string |
Název funkce mapování polí. |
| parameters |
object |
Slovník párů název/hodnota parametru, který se má předat funkci. Každá hodnota musí být primitivního typu. |
IndexerExecutionEnvironment
Určuje prostředí, ve kterém by měl indexer spuštěn.
| Hodnota | Description |
|---|---|
| standard |
Označuje, že vyhledávací služba může určit, kde se má indexer spustit. Toto je výchozí prostředí, když není nic zadáno a je to doporučená hodnota. |
| private |
Označuje, že indexer by měl běžet s prostředím zřízeným speciálně pro vyhledávací službu. To by mělo být zadáno jako spouštěcí prostředí pouze v případě, že indexer potřebuje zabezpečený přístup k prostředkům přes sdílené prostředky privátního propojení. |
IndexingParameters
Představuje parametry pro spuštění indexeru.
| Name | Typ | Default value | Description |
|---|---|---|---|
| batchSize |
integer (int32) |
Počet položek, které jsou načteny ze zdroje dat a indexovány jako jedna dávka za účelem zlepšení výkonu. Výchozí nastavení závisí na typu zdroje dat. |
|
| configuration |
Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu. |
||
| maxFailedItems |
integer (int32) |
0 |
Maximální počet položek, u kterých může selhat indexování, aby bylo spuštění indexeru stále považováno za úspěšné. -1 znamená bez omezení. Výchozí hodnota je 0. |
| maxFailedItemsPerBatch |
integer (int32) |
0 |
Maximální počet položek v jedné dávce, u kterých může dojít k selhání indexování, aby byla dávka stále považována za úspěšnou. -1 znamená bez omezení. Výchozí hodnota je 0. |
IndexingParametersConfiguration
Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu.
| Name | Typ | Default value | Description |
|---|---|---|---|
| allowSkillsetToReadFileData |
boolean |
False |
Pokud je true, vytvoří se cesta //document//file_data , což je objekt představující původní data souboru stažená z vašeho zdroje dat objektů blob. To vám umožní předat data původního souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti Extrakce dokumentů. |
| dataToExtract | contentAndMetadata |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure. |
|
| delimitedTextDelimiter |
string |
U objektů blob CSV určuje oddělovač jednotlivých znaků na konci řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|"). |
|
| delimitedTextHeaders |
string |
V případě objektů blob CSV určuje čárkami oddělený seznam záhlaví sloupců, což je užitečné pro mapování zdrojových polí na cílová pole v indexu. |
|
| documentRoot |
string |
U polí JSON, která jsou dána strukturovaným nebo částečně strukturovaným dokumentem, můžete pomocí této vlastnosti zadat cestu k poli. |
|
| excludedFileNameExtensions |
string |
Čárkami oddělený seznam přípon názvů souborů, které se mají ignorovat při zpracování z úložiště objektů blob v Azure. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování. |
|
| executionEnvironment | standard |
Určuje prostředí, ve kterém by měl indexer spuštěn. |
|
| failOnUnprocessableDocument |
boolean |
False |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří. |
| failOnUnsupportedContentType |
boolean |
False |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když dojde k výskytu nepodporovaného typu obsahu a předem neznáte všechny typy obsahu (přípony souborů). |
| firstLineContainsHeaders |
boolean |
True |
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje záhlaví. |
| imageAction | none |
Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností. |
|
| indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
U objektů blob Azure nastavte tuto vlastnost na true, aby se metadata úložiště stále indexovala pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob naleznete v tématu https://learn.microsoft.com/azure/search/search-limits-quotas-capacity. |
| indexedFileNameExtensions |
string |
Čárkami oddělený seznam přípon názvů souborů, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování konkrétních souborů aplikace ".docx, .pptx, .msg", aby se konkrétně zahrnovaly tyto typy souborů. |
|
| parsingMode | default |
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure. |
|
| pdfTextRotationAlgorithm | none |
Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure. |
|
| queryTimeout |
string |
00:05:00 |
Zvyšuje časový limit nad rámec 5 minut pro zdroje dat databáze Azure SQL zadaný ve formátu "hh:mm:ss". |
IndexingSchedule
Představuje plán provádění indexeru.
| Name | Typ | Description |
|---|---|---|
| interval |
string (duration) |
Časový interval mezi provedeními indexeru. |
| startTime |
string (date-time) |
Čas, kdy by měl indexer začít běžet. |
SearchIndexer
Představuje indexer.
| Name | Typ | Default value | Description |
|---|---|---|---|
| @odata.etag |
string |
Značka ETag indexeru. |
|
| dataSourceName |
string |
Název zdroje dat, ze kterého tento indexer čte data. |
|
| description |
string |
Popis indexeru. |
|
| disabled |
boolean |
False |
Hodnota označující, zda je indexer zakázán. Výchozí hodnota je False. |
| encryptionKey |
Popis šifrovacího klíče, který vytvoříte v Azure Key Vault. Tento klíč se používá k poskytnutí další úrovně šifrování neaktivních uložených dat pro definici indexeru (a také stav spuštění indexeru), když chcete mít plnou jistotu, že je nikdo, ani Microsoft, nemůže dešifrovat. Jakmile definici indexeru zašifrujete, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít žádný vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo později. |
||
| fieldMappings |
Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu. |
||
| name |
string |
Název indexeru. |
|
| outputFieldMappings |
Mapování výstupních polí se aplikují po rozšíření a bezprostředně před indexováním. |
||
| parameters |
Parametry pro spuštění indexeru. |
||
| schedule |
Plán pro tento indexer. |
||
| skillsetName |
string |
Název sady dovedností spuštěné s tímto indexerem. |
|
| targetIndexName |
string |
Název indexu, do kterého tento indexer zapisuje data. |
SearchResourceEncryptionKey
Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, lze použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym.
| Name | Typ | Description |
|---|---|---|
| accessCredentials |
Volitelné přihlašovací údaje Azure Active Directory používané pro přístup k Azure Key Vault. Není vyžadováno, pokud místo toho používáte spravovanou identitu. |
|
| keyVaultKeyName |
string |
Název vašeho klíče Azure Key Vault, který se má použít k šifrování neaktivních uložených dat. |
| keyVaultKeyVersion |
string |
Verze klíče Azure Key Vault, která se má použít k šifrování neaktivních uložených dat. |
| keyVaultUri |
string |
Identifikátor URI vašeho Azure Key Vault, označovaný také jako název DNS, který obsahuje klíč, který se má použít k šifrování neaktivních uložených dat. Příkladem identifikátoru URI může být |