Sdílet prostřednictvím


Indexers - Create

Vytvoří nový indexer.

POST {endpoint}/indexers?api-version=2025-09-01

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Adresa URL koncového bodu vyhledávací služby.

api-version
query True

string

Verze rozhraní API klienta.

Hlavička požadavku

Name Vyžadováno Typ Description
x-ms-client-request-id

string (uuid)

ID sledování odeslané s požadavkem na pomoc s laděním.

Text požadavku

Name Vyžadováno Typ Description
dataSourceName True

string

Název zdroje dat, ze kterého tento indexer čte data.

name True

string

Název indexeru.

targetIndexName True

string

Název indexu, do kterého tento indexer zapisuje data.

@odata.etag

string

Značka ETag indexeru.

description

string

Popis indexeru.

disabled

boolean

Hodnota označující, zda je indexer zakázán. Výchozí hodnota je False.

encryptionKey

SearchResourceEncryptionKey

Popis šifrovacího klíče, který vytvoříte v Azure Key Vault. Tento klíč se používá k poskytnutí další úrovně šifrování neaktivních uložených dat pro definici indexeru (a také stav spuštění indexeru), když chcete mít plnou jistotu, že je nikdo, ani Microsoft, nemůže dešifrovat. Jakmile definici indexeru zašifrujete, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít žádný vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo později.

fieldMappings

FieldMapping[]

Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu.

outputFieldMappings

FieldMapping[]

Mapování výstupních polí se aplikují po rozšíření a bezprostředně před indexováním.

parameters

IndexingParameters

Parametry pro spuštění indexeru.

schedule

IndexingSchedule

Plán pro tento indexer.

skillsetName

string

Název sady dovedností spuštěné s tímto indexerem.

Odpovědi

Name Typ Description
201 Created

SearchIndexer

Other Status Codes

ErrorResponse

Chybová odpověď.

Příklady

SearchServiceCreateIndexer

Ukázkový požadavek

POST https://stableexampleservice.search.windows.net/indexers?api-version=2025-09-01


{
  "name": "myindexer",
  "description": "Description of the indexer",
  "dataSourceName": "mydocdbdatasource",
  "skillsetName": "myskillset",
  "targetIndexName": "stable-test",
  "schedule": {
    "interval": "P1D",
    "startTime": "2025-01-07T19:30:00Z"
  },
  "parameters": {
    "batchSize": 10,
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5,
    "configuration": {
      "excludedFileNameExtensions": ".png,.mp4",
      "indexedFileNameExtensions": ".docx,.pptx",
      "failOnUnsupportedContentType": true,
      "failOnUnprocessableDocument": false,
      "indexStorageMetadataOnlyForOversizedDocuments": true,
      "delimitedTextHeaders": "Header1,Header2",
      "delimitedTextDelimiter": "|",
      "firstLineContainsHeaders": true,
      "documentRoot": "/root",
      "dataToExtract": "storageMetadata",
      "imageAction": "none",
      "allowSkillsetToReadFileData": false,
      "pdfTextRotationAlgorithm": "none",
      "executionEnvironment": "standard"
    }
  },
  "fieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "outputFieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "disabled": false,
  "@odata.etag": "0x1234568AE7E58A1"
}

Ukázková odpověď

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "myindexer",
  "description": "Description of the indexer",
  "dataSourceName": "mydocdbdatasource",
  "skillsetName": "myskillset",
  "targetIndexName": "stable-test",
  "disabled": false,
  "schedule": {
    "interval": "P1D",
    "startTime": "2024-06-06T00:01:50.265Z"
  },
  "parameters": {
    "batchSize": 10,
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5,
    "configuration": {
      "excludedFileNameExtensions": ".png,.mp4",
      "indexedFileNameExtensions": ".docx,.pptx",
      "failOnUnsupportedContentType": true,
      "failOnUnprocessableDocument": false,
      "indexStorageMetadataOnlyForOversizedDocuments": true,
      "delimitedTextHeaders": "Header1,Header2",
      "delimitedTextDelimiter": "|",
      "firstLineContainsHeaders": true,
      "documentRoot": "/root",
      "dataToExtract": "storageMetadata",
      "imageAction": "none",
      "allowSkillsetToReadFileData": false,
      "pdfTextRotationAlgorithm": "none",
      "executionEnvironment": "standard"
    }
  },
  "fieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "outputFieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ]
}

Definice

Name Description
AzureActiveDirectoryApplicationCredentials

Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, která se používá pro ověřený přístup k šifrovacím klíčům uloženým v Azure Key Vault.

BlobIndexerDataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure.

BlobIndexerImageAction

Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností.

BlobIndexerParsingMode

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

BlobIndexerPDFTextRotationAlgorithm

Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure.

ErrorAdditionalInfo

Další informace o chybě správy prostředků

ErrorDetail

Podrobnosti o chybě.

ErrorResponse

Chybová odpověď

FieldMapping

Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu.

FieldMappingFunction

Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním.

IndexerExecutionEnvironment

Určuje prostředí, ve kterém by měl indexer spuštěn.

IndexingParameters

Představuje parametry pro spuštění indexeru.

IndexingParametersConfiguration

Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

IndexingSchedule

Představuje plán provádění indexeru.

SearchIndexer

Představuje indexer.

SearchResourceEncryptionKey

Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, lze použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym.

AzureActiveDirectoryApplicationCredentials

Přihlašovací údaje registrované aplikace vytvořené pro vaši vyhledávací službu, která se používá pro ověřený přístup k šifrovacím klíčům uloženým v Azure Key Vault.

Name Typ Description
applicationId

string

ID aplikace AAD, kterému byla udělena požadovaná přístupová oprávnění k Azure Key Vault, které se má použít při šifrování neaktivních uložených dat. ID aplikace by nemělo být zaměňováno s ID objektu pro vaši aplikaci AAD.

applicationSecret

string

Ověřovací klíč zadané aplikace AAD.

BlobIndexerDataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure.

Hodnota Description
storageMetadata

Indexuje pouze standardní vlastnosti objektu blob a metadata zadaná uživatelem.

allMetadata

Extrahuje metadata poskytnutá subsystémem služby Azure Blob Storage a metadata specifická pro typ obsahu (například metadata jedinečná pouze pro .png jsou soubory indexovány).

contentAndMetadata

Extrahuje všechna metadata a textový obsah z každého objektu blob.

BlobIndexerImageAction

Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností.

Hodnota Description
none

Ignoruje vložené obrazy nebo obrazové soubory v sadě dat. Toto je výchozí hodnota.

generateNormalizedImages

Extrahuje text z obrazů (například slovo "STOP" ze značky STOP) a vloží ho do pole obsahu. Tato akce vyžaduje, aby byla hodnota "dataToExtract" nastavena na hodnotu "contentAndMetadata". Normalizovaný obrázek označuje dodatečné zpracování, jehož výsledkem je jednotný obrazový výstup, jehož velikost a otočení podporuje konzistentní vykreslování, když zahrnete obrázky do vizuálních výsledků hledání. Tyto informace se generují pro každý obraz, když použijete tuto volbu.

generateNormalizedImagePerPage

Extrahuje text z obrazů (například slovo "STOP" ze značky STOP) a vloží ho do pole obsahu, ale se soubory PDF zachází odlišně v tom smyslu, že každá stránka bude vykreslena jako obrázek a podle toho normalizována, místo aby se extrahovaly vložené obrazy. S typy souborů, které nejsou ve formátu PDF, se bude zacházet stejně, jako kdyby bylo nastaveno "generateNormalizedImages".

BlobIndexerParsingMode

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

Hodnota Description
default

Nastavte na výchozí pro normální zpracování souborů.

text

Nastavením na text zlepšíte výkon indexování souborů ve formátu prostého textu v úložišti objektů blob.

delimitedText

Nastavte na delimitedText, pokud jsou objekty blob prosté soubory CSV.

json

Nastavte na json, chcete-li extrahovat strukturovaný obsah ze souborů JSON.

jsonArray

Nastavte na jsonArray , chcete-li extrahovat jednotlivé prvky pole JSON jako samostatné dokumenty.

jsonLines

Nastavte na jsonLines, chcete-li extrahovat jednotlivé entity JSON oddělené novým řádkem jako samostatné dokumenty.

BlobIndexerPDFTextRotationAlgorithm

Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure.

Hodnota Description
none

Využívá normální extrakci textu. Toto je výchozí hodnota.

detectAngles

Může vést k lepší a čitelnější extrakci textu ze souborů PDF, které obsahují otočený text. Všimněte si, že při použití tohoto parametru může dojít k malému dopadu na rychlost výkonu. Tento parametr se vztahuje pouze na soubory PDF a pouze na soubory PDF s vloženým textem. Pokud se otočený text objeví ve vloženém obrazu v PDF, tento parametr se nepoužije.

ErrorAdditionalInfo

Další informace o chybě správy prostředků

Name Typ Description
info

object

Další informace.

type

string

Další typ informací.

ErrorDetail

Podrobnosti o chybě.

Name Typ Description
additionalInfo

ErrorAdditionalInfo[]

Další informace o chybě.

code

string

Kód chyby.

details

ErrorDetail[]

Podrobnosti o chybě.

message

string

Chybová zpráva.

target

string

Cíl chyby.

ErrorResponse

Chybová odpověď

Name Typ Description
error

ErrorDetail

Objekt chyby.

FieldMapping

Definuje mapování mezi polem ve zdroji dat a cílovým polem v indexu.

Name Typ Description
mappingFunction

FieldMappingFunction

Funkce, která se má použít na každou hodnotu zdrojového pole před indexováním.

sourceFieldName

string

Název pole ve zdroji dat.

targetFieldName

string

Název cílového pole v rejstříku. Ve výchozím nastavení je stejný jako název zdrojového pole.

FieldMappingFunction

Představuje funkci, která transformuje hodnotu ze zdroje dat před indexováním.

Name Typ Description
name

string

Název funkce mapování polí.

parameters

object

Slovník párů název/hodnota parametru, který se má předat funkci. Každá hodnota musí být primitivního typu.

IndexerExecutionEnvironment

Určuje prostředí, ve kterém by měl indexer spuštěn.

Hodnota Description
standard

Označuje, že vyhledávací služba může určit, kde se má indexer spustit. Toto je výchozí prostředí, když není nic zadáno a je to doporučená hodnota.

private

Označuje, že indexer by měl běžet s prostředím zřízeným speciálně pro vyhledávací službu. To by mělo být zadáno jako spouštěcí prostředí pouze v případě, že indexer potřebuje zabezpečený přístup k prostředkům přes sdílené prostředky privátního propojení.

IndexingParameters

Představuje parametry pro spuštění indexeru.

Name Typ Default value Description
batchSize

integer (int32)

Počet položek, které jsou načteny ze zdroje dat a indexovány jako jedna dávka za účelem zlepšení výkonu. Výchozí nastavení závisí na typu zdroje dat.

configuration

IndexingParametersConfiguration

Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

maxFailedItems

integer (int32)

0

Maximální počet položek, u kterých může selhat indexování, aby bylo spuštění indexeru stále považováno za úspěšné. -1 znamená bez omezení. Výchozí hodnota je 0.

maxFailedItemsPerBatch

integer (int32)

0

Maximální počet položek v jedné dávce, u kterých může dojít k selhání indexování, aby byla dávka stále považována za úspěšnou. -1 znamená bez omezení. Výchozí hodnota je 0.

IndexingParametersConfiguration

Slovník vlastností konfigurace specifických pro indexer. Každý název je názvem konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

Name Typ Default value Description
allowSkillsetToReadFileData

boolean

False

Pokud je true, vytvoří se cesta //document//file_data , což je objekt představující původní data souboru stažená z vašeho zdroje dat objektů blob. To vám umožní předat data původního souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti Extrakce dokumentů.

dataToExtract

BlobIndexerDataToExtract

contentAndMetadata

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a sděluje indexeru, která data se mají extrahovat z obsahu obrázku, když je "imageAction" nastavená na jinou hodnotu než "none". To platí pro vložený obrazový obsah v .PDF nebo jiné aplikaci nebo pro obrazové soubory, jako jsou .jpg a .png, v objektech blob Azure.

delimitedTextDelimiter

string

U objektů blob CSV určuje oddělovač jednotlivých znaků na konci řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|").

delimitedTextHeaders

string

V případě objektů blob CSV určuje čárkami oddělený seznam záhlaví sloupců, což je užitečné pro mapování zdrojových polí na cílová pole v indexu.

documentRoot

string

U polí JSON, která jsou dána strukturovaným nebo částečně strukturovaným dokumentem, můžete pomocí této vlastnosti zadat cestu k poli.

excludedFileNameExtensions

string

Čárkami oddělený seznam přípon názvů souborů, které se mají ignorovat při zpracování z úložiště objektů blob v Azure. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování.

executionEnvironment

IndexerExecutionEnvironment

standard

Určuje prostředí, ve kterém by měl indexer spuštěn.

failOnUnprocessableDocument

boolean

False

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnsupportedContentType

boolean

False

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když dojde k výskytu nepodporovaného typu obsahu a předem neznáte všechny typy obsahu (přípony souborů).

firstLineContainsHeaders

boolean

True

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje záhlaví.

imageAction

BlobIndexerImageAction

none

Určuje, jak zpracovat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jakoukoli jinou hodnotu než "none" vyžaduje, aby k tomuto indexeru byla připojena také sada dovedností.

indexStorageMetadataOnlyForOversizedDocuments

boolean

False

U objektů blob Azure nastavte tuto vlastnost na true, aby se metadata úložiště stále indexovala pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob naleznete v tématu https://learn.microsoft.com/azure/search/search-limits-quotas-capacity.

indexedFileNameExtensions

string

Čárkami oddělený seznam přípon názvů souborů, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování konkrétních souborů aplikace ".docx, .pptx, .msg", aby se konkrétně zahrnovaly tyto typy souborů.

parsingMode

BlobIndexerParsingMode

default

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

pdfTextRotationAlgorithm

BlobIndexerPDFTextRotationAlgorithm

none

Určuje algoritmus pro extrakci textu ze souborů PDF v úložišti objektů blob v Azure.

queryTimeout

string

00:05:00

Zvyšuje časový limit nad rámec 5 minut pro zdroje dat databáze Azure SQL zadaný ve formátu "hh:mm:ss".

IndexingSchedule

Představuje plán provádění indexeru.

Name Typ Description
interval

string (duration)

Časový interval mezi provedeními indexeru.

startTime

string (date-time)

Čas, kdy by měl indexer začít běžet.

SearchIndexer

Představuje indexer.

Name Typ Default value Description
@odata.etag

string

Značka ETag indexeru.

dataSourceName

string

Název zdroje dat, ze kterého tento indexer čte data.

description

string

Popis indexeru.

disabled

boolean

False

Hodnota označující, zda je indexer zakázán. Výchozí hodnota je False.

encryptionKey

SearchResourceEncryptionKey

Popis šifrovacího klíče, který vytvoříte v Azure Key Vault. Tento klíč se používá k poskytnutí další úrovně šifrování neaktivních uložených dat pro definici indexeru (a také stav spuštění indexeru), když chcete mít plnou jistotu, že je nikdo, ani Microsoft, nemůže dešifrovat. Jakmile definici indexeru zašifrujete, zůstane vždy zašifrovaná. Vyhledávací služba bude ignorovat pokusy o nastavení této vlastnosti na hodnotu null. Tuto vlastnost můžete podle potřeby změnit, pokud chcete šifrovací klíč otočit; Definice indexeru (a stav spuštění indexeru) nebude mít žádný vliv. Šifrování pomocí klíčů spravovaných zákazníkem není k dispozici pro bezplatné vyhledávací služby a je k dispozici pouze pro placené služby vytvořené 1. ledna 2019 nebo později.

fieldMappings

FieldMapping[]

Definuje mapování mezi poli ve zdroji dat a odpovídajícími cílovými poli v indexu.

name

string

Název indexeru.

outputFieldMappings

FieldMapping[]

Mapování výstupních polí se aplikují po rozšíření a bezprostředně před indexováním.

parameters

IndexingParameters

Parametry pro spuštění indexeru.

schedule

IndexingSchedule

Plán pro tento indexer.

skillsetName

string

Název sady dovedností spuštěné s tímto indexerem.

targetIndexName

string

Název indexu, do kterého tento indexer zapisuje data.

SearchResourceEncryptionKey

Šifrovací klíč spravovaný zákazníkem ve službě Azure Key Vault. Klíče, které vytvoříte a spravujete, lze použít k šifrování nebo dešifrování neaktivních uložených dat, jako jsou indexy a mapy synonym.

Name Typ Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Volitelné přihlašovací údaje Azure Active Directory používané pro přístup k Azure Key Vault. Není vyžadováno, pokud místo toho používáte spravovanou identitu.

keyVaultKeyName

string

Název vašeho klíče Azure Key Vault, který se má použít k šifrování neaktivních uložených dat.

keyVaultKeyVersion

string

Verze klíče Azure Key Vault, která se má použít k šifrování neaktivních uložených dat.

keyVaultUri

string

Identifikátor URI vašeho Azure Key Vault, označovaný také jako název DNS, který obsahuje klíč, který se má použít k šifrování neaktivních uložených dat. Příkladem identifikátoru URI může být https://my-keyvault-name.vault.azure.net.