Sdílet prostřednictvím


IndexingParametersConfiguration interface

Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

Vlastnosti

allowSkillsetToReadFileData

Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů.

dataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.

delimitedTextDelimiter

Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|").

delimitedTextHeaders

Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.

documentRoot

U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti.

excludedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili.

executionEnvironment

Určuje prostředí, ve kterém se má indexer spustit.

failOnUnprocessableDocument

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnsupportedContentType

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů).

firstLineContainsHeaders

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.

imageAction

Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.

indexedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli.

indexStorageMetadataOnlyForOversizedDocuments

V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

pdfTextRotationAlgorithm

Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.

queryTimeout

Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss.

Podrobnosti vlastnosti

allowSkillsetToReadFileData

Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů.

allowSkillsetToReadFileData?: boolean

Hodnota vlastnosti

boolean

dataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.

dataToExtract?: BlobIndexerDataToExtract

Hodnota vlastnosti

delimitedTextDelimiter

Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|").

delimitedTextDelimiter?: string

Hodnota vlastnosti

string

delimitedTextHeaders

Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.

delimitedTextHeaders?: string

Hodnota vlastnosti

string

documentRoot

U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti.

documentRoot?: string

Hodnota vlastnosti

string

excludedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili.

excludedFileNameExtensions?: string

Hodnota vlastnosti

string

executionEnvironment

Určuje prostředí, ve kterém se má indexer spustit.

executionEnvironment?: IndexerExecutionEnvironment

Hodnota vlastnosti

failOnUnprocessableDocument

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnprocessableDocument?: boolean

Hodnota vlastnosti

boolean

failOnUnsupportedContentType

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů).

failOnUnsupportedContentType?: boolean

Hodnota vlastnosti

boolean

firstLineContainsHeaders

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.

firstLineContainsHeaders?: boolean

Hodnota vlastnosti

boolean

imageAction

Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.

imageAction?: BlobIndexerImageAction

Hodnota vlastnosti

indexedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli.

indexedFileNameExtensions?: string

Hodnota vlastnosti

string

indexStorageMetadataOnlyForOversizedDocuments

V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Hodnota vlastnosti

boolean

parsingMode

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

parsingMode?: BlobIndexerParsingMode

Hodnota vlastnosti

pdfTextRotationAlgorithm

Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.

pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm

Hodnota vlastnosti

queryTimeout

Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss.

queryTimeout?: string

Hodnota vlastnosti

string