IndexingParametersConfiguration interface

Reference

Balíček:: @azure/search-documents

Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

Vlastnosti

allowSkillsetToReadFileData	Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů.
dataToExtract	Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.
delimitedTextDelimiter	Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "\|").
delimitedTextHeaders	Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.
documentRoot	U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti.
excludedFileNameExtensions	Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili.
executionEnvironment	Určuje prostředí, ve kterém se má indexer spustit.
failOnUnprocessableDocument	V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.
failOnUnsupportedContentType	V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů).
firstLineContainsHeaders	U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.
imageAction	Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.
indexedFileNameExtensions	Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli.
indexStorageMetadataOnlyForOversizedDocuments	V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
parsingMode	Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.
pdfTextRotationAlgorithm	Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.
queryTimeout	Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss.

Podrobnosti vlastnosti

allowSkillsetToReadFileData

Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů.

allowSkillsetToReadFileData?: boolean

Hodnota vlastnosti

boolean

dataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.

dataToExtract?: BlobIndexerDataToExtract

Hodnota vlastnosti

BlobIndexerDataToExtract

delimitedTextDelimiter

Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|").

delimitedTextDelimiter?: string

Hodnota vlastnosti

string

delimitedTextHeaders

Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.

delimitedTextHeaders?: string

Hodnota vlastnosti

string

documentRoot

U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti.

documentRoot?: string

Hodnota vlastnosti

string

excludedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili.

excludedFileNameExtensions?: string

Hodnota vlastnosti

string

executionEnvironment

Určuje prostředí, ve kterém se má indexer spustit.

executionEnvironment?: IndexerExecutionEnvironment

Hodnota vlastnosti

IndexerExecutionEnvironment

failOnUnprocessableDocument

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnprocessableDocument?: boolean

Hodnota vlastnosti

boolean

failOnUnsupportedContentType

V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů).

failOnUnsupportedContentType?: boolean

Hodnota vlastnosti

boolean

firstLineContainsHeaders

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.

firstLineContainsHeaders?: boolean

Hodnota vlastnosti

boolean

imageAction

Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.

imageAction?: BlobIndexerImageAction

Hodnota vlastnosti

BlobIndexerImageAction

indexedFileNameExtensions

Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli.

indexedFileNameExtensions?: string

Hodnota vlastnosti

string

indexStorageMetadataOnlyForOversizedDocuments

V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Hodnota vlastnosti

boolean

parsingMode

Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.

parsingMode?: BlobIndexerParsingMode

Hodnota vlastnosti

BlobIndexerParsingMode

pdfTextRotationAlgorithm

Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.

pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm

Hodnota vlastnosti

BlobIndexerPDFTextRotationAlgorithm

queryTimeout

Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss.

queryTimeout?: string

Hodnota vlastnosti

string

Sdílet prostřednictvím

IndexingParametersConfiguration interface

Vlastnosti

Podrobnosti vlastnosti

allowSkillsetToReadFileData

Hodnota vlastnosti

dataToExtract

Hodnota vlastnosti

delimitedTextDelimiter

Hodnota vlastnosti

delimitedTextHeaders

Hodnota vlastnosti

documentRoot

Hodnota vlastnosti

excludedFileNameExtensions

Hodnota vlastnosti

executionEnvironment

Hodnota vlastnosti

failOnUnprocessableDocument

Hodnota vlastnosti

failOnUnsupportedContentType

Hodnota vlastnosti

firstLineContainsHeaders

Hodnota vlastnosti

imageAction

Hodnota vlastnosti

indexedFileNameExtensions

Hodnota vlastnosti

indexStorageMetadataOnlyForOversizedDocuments

Hodnota vlastnosti

parsingMode

Hodnota vlastnosti

pdfTextRotationAlgorithm

Hodnota vlastnosti

queryTimeout

Hodnota vlastnosti

Další materiály