Partilhar via


IndexingParametersConfiguration interface

Um dicionário de propriedades de configuração específicas do indexador. Cada nome é o nome de uma propriedade específica. Cada valor tem de ser de um tipo primitivo.

Propriedades

allowSkillsetToReadFileData

Se for verdadeiro, irá criar um caminho //document//file_data que é um objeto que representa os dados de ficheiro originais transferidos a partir da origem de dados do blob. Isto permite-lhe transmitir os dados de ficheiro originais para uma competência personalizada para processamento no pipeline de melhoramento ou para a competência extração de documentos.

dataToExtract

Especifica os dados a extrair do armazenamento de blobs do Azure e indica ao indexador quais os dados a extrair do conteúdo da imagem quando "imageAction" está definido como um valor diferente de "nenhum". Isto aplica-se a conteúdos de imagens incorporadas numa .PDF ou noutra aplicação, ou ficheiros de imagem, como .jpg e .png, nos blobs do Azure.

delimitedTextDelimiter

Para blobs CSV, especifica o delimitador de carateres únicos de fim de linha para ficheiros CSV em que cada linha inicia um novo documento (por exemplo, "|").

delimitedTextHeaders

Para blobs CSV, especifica uma lista delimitada por vírgulas de cabeçalhos de coluna, útil para mapear campos de origem para campos de destino num índice.

documentRoot

Para matrizes JSON, tendo em conta um documento estruturado ou semiestruturado, pode especificar um caminho para a matriz com esta propriedade.

excludedFileNameExtensions

Lista delimitada por vírgulas de extensões de nome de ficheiro a ignorar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode excluir ".png, .mp4" para ignorar esses ficheiros durante a indexação.

executionEnvironment

Especifica o ambiente no qual o indexador deve ser executado.

failOnUnprocessableDocument

Para os blobs do Azure, defina como falso se quiser continuar a indexar se um documento falhar a indexação.

failOnUnsupportedContentType

Para os blobs do Azure, defina como falso se quiser continuar a indexar quando for encontrado um tipo de conteúdo não suportado e não souber com antecedência todos os tipos de conteúdo (extensões de ficheiro).

firstLineContainsHeaders

Para blobs CSV, indica que a primeira linha (não em branco) de cada blob contém cabeçalhos.

imageAction

Determina como processar imagens incorporadas e ficheiros de imagem no armazenamento de blobs do Azure. Definir a configuração "imageAction" para qualquer valor diferente de "nenhum" requer que um conjunto de competências também seja anexado a esse indexador.

indexedFileNameExtensions

Lista delimitada por vírgulas de extensões de nome de ficheiro a selecionar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode focar a indexação em ficheiros de aplicação específicos ".docx, .pptx, .msg" para incluir especificamente esses tipos de ficheiro.

indexStorageMetadataOnlyForOversizedDocuments

Para os blobs do Azure, defina esta propriedade como true para indexar metadados de armazenamento para conteúdo de blobs demasiado grande para processar. Os blobs de grandes dimensões são tratados como erros por predefinição. Para obter limites sobre o tamanho do blob, consulte https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

Representa o modo de análise para indexação a partir de uma origem de dados de blobs do Azure.

pdfTextRotationAlgorithm

Determina o algoritmo para extração de texto de ficheiros PDF no armazenamento de blobs do Azure.

queryTimeout

Aumenta o tempo limite para além da predefinição de 5 minutos para SQL do Azure origens de dados da base de dados, especificadas no formato "hh:mm:ss".

Detalhes de Propriedade

allowSkillsetToReadFileData

Se for verdadeiro, irá criar um caminho //document//file_data que é um objeto que representa os dados de ficheiro originais transferidos a partir da origem de dados do blob. Isto permite-lhe transmitir os dados de ficheiro originais para uma competência personalizada para processamento no pipeline de melhoramento ou para a competência extração de documentos.

allowSkillsetToReadFileData?: boolean

Valor de Propriedade

boolean

dataToExtract

Especifica os dados a extrair do armazenamento de blobs do Azure e indica ao indexador quais os dados a extrair do conteúdo da imagem quando "imageAction" está definido como um valor diferente de "nenhum". Isto aplica-se a conteúdos de imagens incorporadas numa .PDF ou noutra aplicação, ou ficheiros de imagem, como .jpg e .png, nos blobs do Azure.

dataToExtract?: BlobIndexerDataToExtract

Valor de Propriedade

delimitedTextDelimiter

Para blobs CSV, especifica o delimitador de carateres únicos de fim de linha para ficheiros CSV em que cada linha inicia um novo documento (por exemplo, "|").

delimitedTextDelimiter?: string

Valor de Propriedade

string

delimitedTextHeaders

Para blobs CSV, especifica uma lista delimitada por vírgulas de cabeçalhos de coluna, útil para mapear campos de origem para campos de destino num índice.

delimitedTextHeaders?: string

Valor de Propriedade

string

documentRoot

Para matrizes JSON, tendo em conta um documento estruturado ou semiestruturado, pode especificar um caminho para a matriz com esta propriedade.

documentRoot?: string

Valor de Propriedade

string

excludedFileNameExtensions

Lista delimitada por vírgulas de extensões de nome de ficheiro a ignorar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode excluir ".png, .mp4" para ignorar esses ficheiros durante a indexação.

excludedFileNameExtensions?: string

Valor de Propriedade

string

executionEnvironment

Especifica o ambiente no qual o indexador deve ser executado.

executionEnvironment?: IndexerExecutionEnvironment

Valor de Propriedade

failOnUnprocessableDocument

Para os blobs do Azure, defina como falso se quiser continuar a indexar se um documento falhar a indexação.

failOnUnprocessableDocument?: boolean

Valor de Propriedade

boolean

failOnUnsupportedContentType

Para os blobs do Azure, defina como falso se quiser continuar a indexar quando for encontrado um tipo de conteúdo não suportado e não souber com antecedência todos os tipos de conteúdo (extensões de ficheiro).

failOnUnsupportedContentType?: boolean

Valor de Propriedade

boolean

firstLineContainsHeaders

Para blobs CSV, indica que a primeira linha (não em branco) de cada blob contém cabeçalhos.

firstLineContainsHeaders?: boolean

Valor de Propriedade

boolean

imageAction

Determina como processar imagens incorporadas e ficheiros de imagem no armazenamento de blobs do Azure. Definir a configuração "imageAction" para qualquer valor diferente de "nenhum" requer que um conjunto de competências também seja anexado a esse indexador.

imageAction?: BlobIndexerImageAction

Valor de Propriedade

indexedFileNameExtensions

Lista delimitada por vírgulas de extensões de nome de ficheiro a selecionar ao processar a partir do armazenamento de blobs do Azure. Por exemplo, pode focar a indexação em ficheiros de aplicação específicos ".docx, .pptx, .msg" para incluir especificamente esses tipos de ficheiro.

indexedFileNameExtensions?: string

Valor de Propriedade

string

indexStorageMetadataOnlyForOversizedDocuments

Para os blobs do Azure, defina esta propriedade como true para indexar metadados de armazenamento para conteúdo de blobs demasiado grande para processar. Os blobs de grandes dimensões são tratados como erros por predefinição. Para obter limites sobre o tamanho do blob, consulte https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Valor de Propriedade

boolean

parsingMode

Representa o modo de análise para indexação a partir de uma origem de dados de blobs do Azure.

parsingMode?: BlobIndexerParsingMode

Valor de Propriedade

pdfTextRotationAlgorithm

Determina o algoritmo para extração de texto de ficheiros PDF no armazenamento de blobs do Azure.

pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm

Valor de Propriedade

queryTimeout

Aumenta o tempo limite para além da predefinição de 5 minutos para SQL do Azure origens de dados da base de dados, especificadas no formato "hh:mm:ss".

queryTimeout?: string

Valor de Propriedade

string