IndexingParametersConfiguration interface
Slovník vlastností konfigurace specifických pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.
Vlastnosti
allow |
Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů. |
data |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
delimited |
Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|"). |
delimited |
Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu. |
document |
U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti. |
excluded |
Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili. |
execution |
Určuje prostředí, ve kterém se má indexer spustit. |
fail |
V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří. |
fail |
V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů). |
first |
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky. |
image |
Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností. |
indexed |
Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli. |
index |
V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure. |
pdf |
Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage. |
query |
Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss. |
Podrobnosti vlastnosti
allowSkillsetToReadFileData
Pokud je true, vytvoří cestu //document//file_data, což je objekt představující data původního souboru stažená ze zdroje dat objektů blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo dovednosti extrakce dokumentů.
allowSkillsetToReadFileData?: boolean
Hodnota vlastnosti
boolean
dataToExtract
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než "none". To platí pro vložený obsah obrázků v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.
dataToExtract?: BlobIndexerDataToExtract
Hodnota vlastnosti
delimitedTextDelimiter
Pro objekty blob CSV určuje oddělovač konce řádku pro soubory CSV, kde každý řádek začíná nový dokument (například "|").
delimitedTextDelimiter?: string
Hodnota vlastnosti
string
delimitedTextHeaders
Pro objekty blob CSV určuje seznam záhlaví sloupců oddělených čárkami, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.
delimitedTextHeaders?: string
Hodnota vlastnosti
string
documentRoot
U polí JSON můžete u strukturovaného nebo částečně strukturovaného dokumentu zadat cestu k poli pomocí této vlastnosti.
documentRoot?: string
Hodnota vlastnosti
string
excludedFileNameExtensions
Seznam přípon názvů souborů oddělených čárkami, které se při zpracování ze služby Azure Blob Storage ignorují. Můžete například vyloučit ".png, .mp4", abyste tyto soubory během indexování přeskočili.
excludedFileNameExtensions?: string
Hodnota vlastnosti
string
executionEnvironment
Určuje prostředí, ve kterém se má indexer spustit.
executionEnvironment?: IndexerExecutionEnvironment
Hodnota vlastnosti
failOnUnprocessableDocument
V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.
failOnUnprocessableDocument?: boolean
Hodnota vlastnosti
boolean
failOnUnsupportedContentType
V případě objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, když se zjistí nepodporovaný typ obsahu a neznáte předem všechny typy obsahu (přípony souborů).
failOnUnsupportedContentType?: boolean
Hodnota vlastnosti
boolean
firstLineContainsHeaders
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.
firstLineContainsHeaders?: boolean
Hodnota vlastnosti
boolean
imageAction
Určuje, jak zpracovávat vložené obrázky a soubory obrázků ve službě Azure Blob Storage. Nastavení konfigurace "imageAction" na jinou hodnotu než "none" vyžaduje, aby byla k danému indexeru připojena také sada dovedností.
imageAction?: BlobIndexerImageAction
Hodnota vlastnosti
indexedFileNameExtensions
Seznam přípon názvů souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Například indexování můžete zaměřit na konkrétní soubory aplikace ".docx, .pptx, .msg", abyste tyto typy souborů konkrétně zahrnuli.
indexedFileNameExtensions?: string
Hodnota vlastnosti
string
indexStorageMetadataOnlyForOversizedDocuments
V případě objektů blob Azure nastavte tuto vlastnost na true, aby se stále indexují metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Objekty blob s naddimenzovanou hodnotou se ve výchozím nastavení považují za chyby. Omezení velikosti objektů blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Hodnota vlastnosti
boolean
parsingMode
Představuje režim analýzy pro indexování ze zdroje dat objektů blob Azure.
parsingMode?: BlobIndexerParsingMode
Hodnota vlastnosti
pdfTextRotationAlgorithm
Určuje algoritmus pro extrakci textu ze souborů PDF ve službě Azure Blob Storage.
pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm
Hodnota vlastnosti
queryTimeout
Zvýší časový limit nad 5minutovou výchozí hodnotu pro zdroje dat Azure SQL databáze, která je zadaná ve formátu hh:mm:ss.
queryTimeout?: string
Hodnota vlastnosti
string