Partilhar via


SplitSkill interface

Uma habilidade para dividir uma cadeia de caracteres em pedaços de texto.

Extends

Propriedades

azureOpenAITokenizerParameters

Só se aplica se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.

defaultLanguageCode

Um valor que indica qual código de idioma usar. A predefinição é en.

maximumPagesToTake

Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão após o processamento das primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.

maxPageLength

O comprimento máximo de página desejado. O padrão é 10000.

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

pageOverlapLength

Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final do nono bloco.

textSplitMode

Um valor que indica qual modo de divisão executar.

unit

Só se aplica se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá a medida do comprimento (maximumPageLength e pageOverlapLength). O padrão é 'caracteres', o que significa que o comprimento será medido por caractere.

Propriedades Herdadas

context

Representa o nível no qual as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.

description

A descrição da habilidade que descreve as entradas, saídas e uso da habilidade.

inputs

As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade a montante.

name

O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixada com o caractere '#'.

outputs

A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como uma entrada por outra habilidade.

Detalhes de Propriedade

azureOpenAITokenizerParameters

Só se aplica se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Valor de Propriedade

defaultLanguageCode

Um valor que indica qual código de idioma usar. A predefinição é en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Valor de Propriedade

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão após o processamento das primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.

maximumPagesToTake?: number

Valor de Propriedade

number

maxPageLength

O comprimento máximo de página desejado. O padrão é 10000.

maxPageLength?: number

Valor de Propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Valor de Propriedade

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final do nono bloco.

pageOverlapLength?: number

Valor de Propriedade

number

textSplitMode

Um valor que indica qual modo de divisão executar.

textSplitMode?: "pages" | "sentences"

Valor de Propriedade

"pages" | "sentences"

unit

Só se aplica se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá a medida do comprimento (maximumPageLength e pageOverlapLength). O padrão é 'caracteres', o que significa que o comprimento será medido por caractere.

unit?: string

Valor de Propriedade

string

Detalhes da Propriedade Herdada

context

Representa o nível no qual as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.

context?: string

Valor de Propriedade

string

Herdado deSearchIndexerSkill.context

description

A descrição da habilidade que descreve as entradas, saídas e uso da habilidade.

description?: string

Valor de Propriedade

string

Herdado deSearchIndexerSkill.description

inputs

As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade a montante.

inputs: InputFieldMappingEntry[]

Valor de Propriedade

Herdado deSearchIndexerSkill.inputs

name

O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixada com o caractere '#'.

name?: string

Valor de Propriedade

string

Herdado deSearchIndexerSkill.name

outputs

A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como uma entrada por outra habilidade.

outputs: OutputFieldMappingEntry[]

Valor de Propriedade

Herdado deSearchIndexerSkill.outputs