IndexingParametersConfiguration interface
Um dicionário de propriedades de configuração específicas do indexador. Cada nome é o nome de uma propriedade específica. Cada valor tem de ser de um tipo primitivo.
Propriedades
allow |
Se for verdadeiro, irá criar um caminho //document//file_data que é um objeto que representa os dados de ficheiro originais transferidos a partir da origem de dados do blob. Isto permite-lhe transmitir os dados de ficheiro originais para uma competência personalizada para processamento no pipeline de melhoramento ou para a competência extração de documentos. |
data |
Especifica os dados a extrair do armazenamento de blobs do Azure e indica ao indexador quais os dados a extrair do conteúdo da imagem quando "imageAction" está definido como um valor diferente de "nenhum". Isto aplica-se a conteúdos de imagens incorporadas numa .PDF ou noutra aplicação, ou ficheiros de imagem, como .jpg e .png, nos blobs do Azure. |
delimited |
Para blobs CSV, especifica o delimitador de carateres únicos de fim de linha para ficheiros CSV em que cada linha inicia um novo documento (por exemplo, "|"). |
delimited |
Para blobs CSV, especifica uma lista delimitada por vírgulas de cabeçalhos de coluna, útil para mapear campos de origem para campos de destino num índice. |
document |
Para matrizes JSON, tendo em conta um documento estruturado ou semiestruturado, pode especificar um caminho para a matriz com esta propriedade. |
excluded |
Lista delimitada por vírgulas de extensões de nome de ficheiro a ignorar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode excluir ".png, .mp4" para ignorar esses ficheiros durante a indexação. |
execution |
Especifica o ambiente no qual o indexador deve ser executado. |
fail |
Para os blobs do Azure, defina como falso se quiser continuar a indexar se um documento falhar a indexação. |
fail |
Para os blobs do Azure, defina como falso se quiser continuar a indexar quando for encontrado um tipo de conteúdo não suportado e não souber com antecedência todos os tipos de conteúdo (extensões de ficheiro). |
first |
Para blobs CSV, indica que a primeira linha (não em branco) de cada blob contém cabeçalhos. |
image |
Determina como processar imagens incorporadas e ficheiros de imagem no armazenamento de blobs do Azure. Definir a configuração "imageAction" para qualquer valor diferente de "nenhum" requer que um conjunto de competências também seja anexado a esse indexador. |
indexed |
Lista delimitada por vírgulas de extensões de nome de ficheiro a selecionar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode focar a indexação em ficheiros de aplicação específicos ".docx, .pptx, .msg" para incluir especificamente esses tipos de ficheiro. |
index |
Para os blobs do Azure, defina esta propriedade como true para indexar metadados de armazenamento para conteúdo de blobs demasiado grande para processar. Os blobs de grandes dimensões são tratados como erros por predefinição. Para obter limites sobre o tamanho do blob, consulte https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
Representa o modo de análise para indexação a partir de uma origem de dados de blobs do Azure. |
pdf |
Determina o algoritmo para extração de texto de ficheiros PDF no armazenamento de blobs do Azure. |
query |
Aumenta o tempo limite para além da predefinição de 5 minutos para SQL do Azure origens de dados da base de dados, especificadas no formato "hh:mm:ss". |
Detalhes de Propriedade
allowSkillsetToReadFileData
Se for verdadeiro, irá criar um caminho //document//file_data que é um objeto que representa os dados de ficheiro originais transferidos a partir da origem de dados do blob. Isto permite-lhe transmitir os dados de ficheiro originais para uma competência personalizada para processamento no pipeline de melhoramento ou para a competência extração de documentos.
allowSkillsetToReadFileData?: boolean
Valor de Propriedade
boolean
dataToExtract
Especifica os dados a extrair do armazenamento de blobs do Azure e indica ao indexador quais os dados a extrair do conteúdo da imagem quando "imageAction" está definido como um valor diferente de "nenhum". Isto aplica-se a conteúdos de imagens incorporadas numa .PDF ou noutra aplicação, ou ficheiros de imagem, como .jpg e .png, nos blobs do Azure.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Valor de Propriedade
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
Para blobs CSV, especifica o delimitador de carateres únicos de fim de linha para ficheiros CSV em que cada linha inicia um novo documento (por exemplo, "|").
delimitedTextDelimiter?: string
Valor de Propriedade
string
delimitedTextHeaders
Para blobs CSV, especifica uma lista delimitada por vírgulas de cabeçalhos de coluna, útil para mapear campos de origem para campos de destino num índice.
delimitedTextHeaders?: string
Valor de Propriedade
string
documentRoot
Para matrizes JSON, tendo em conta um documento estruturado ou semiestruturado, pode especificar um caminho para a matriz com esta propriedade.
documentRoot?: string
Valor de Propriedade
string
excludedFileNameExtensions
Lista delimitada por vírgulas de extensões de nome de ficheiro a ignorar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode excluir ".png, .mp4" para ignorar esses ficheiros durante a indexação.
excludedFileNameExtensions?: string
Valor de Propriedade
string
executionEnvironment
Especifica o ambiente no qual o indexador deve ser executado.
executionEnvironment?: "standard" | "private"
Valor de Propriedade
"standard" | "private"
failOnUnprocessableDocument
Para os blobs do Azure, defina como falso se quiser continuar a indexar se um documento falhar a indexação.
failOnUnprocessableDocument?: boolean
Valor de Propriedade
boolean
failOnUnsupportedContentType
Para os blobs do Azure, defina como falso se quiser continuar a indexar quando for encontrado um tipo de conteúdo não suportado e não souber com antecedência todos os tipos de conteúdo (extensões de ficheiro).
failOnUnsupportedContentType?: boolean
Valor de Propriedade
boolean
firstLineContainsHeaders
Para blobs CSV, indica que a primeira linha (não em branco) de cada blob contém cabeçalhos.
firstLineContainsHeaders?: boolean
Valor de Propriedade
boolean
imageAction
Determina como processar imagens incorporadas e ficheiros de imagem no armazenamento de blobs do Azure. Definir a configuração "imageAction" para qualquer valor diferente de "nenhum" requer que um conjunto de competências também seja anexado a esse indexador.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Valor de Propriedade
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Lista delimitada por vírgulas de extensões de nome de ficheiro a selecionar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode focar a indexação em ficheiros de aplicação específicos ".docx, .pptx, .msg" para incluir especificamente esses tipos de ficheiro.
indexedFileNameExtensions?: string
Valor de Propriedade
string
indexStorageMetadataOnlyForOversizedDocuments
Para os blobs do Azure, defina esta propriedade como true para indexar metadados de armazenamento para conteúdo de blobs demasiado grande para processar. Os blobs de grandes dimensões são tratados como erros por predefinição. Para obter limites sobre o tamanho do blob, consulte https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Valor de Propriedade
boolean
parsingMode
Representa o modo de análise para indexação a partir de uma origem de dados de blobs do Azure.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
Valor de Propriedade
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Determina o algoritmo para extração de texto de ficheiros PDF no armazenamento de blobs do Azure.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Valor de Propriedade
"none" | "detectAngles"
queryTimeout
Aumenta o tempo limite para além da predefinição de 5 minutos para SQL do Azure origens de dados da base de dados, especificadas no formato "hh:mm:ss".
queryTimeout?: string
Valor de Propriedade
string