Compartilhar via


SplitSkill interface

Uma habilidade para dividir uma cadeia de caracteres em partes de texto.

Extends

Propriedades

azureOpenAITokenizerParameters

Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.

defaultLanguageCode

Um valor que indica qual código de idioma usar. O padrão é en.

maximumPagesToTake

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.

maxPageLength

O comprimento máximo de página desejado. O padrão é 10000.

odatatype

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

pageOverlapLength

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk.

textSplitMode

Um valor que indica qual modo de divisão executar.

unit

Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere.

Propriedades herdadas

context

Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.

description

A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade.

inputs

As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream.

name

O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'.

outputs

A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade.

Detalhes da propriedade

azureOpenAITokenizerParameters

Aplica-se somente se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Valor da propriedade

defaultLanguageCode

Um valor que indica qual código de idioma usar. O padrão é en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Valor da propriedade

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão depois de processar as primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.

maximumPagesToTake?: number

Valor da propriedade

number

maxPageLength

O comprimento máximo de página desejado. O padrão é 10000.

maxPageLength?: number

Valor da propriedade

number

odatatype

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Valor da propriedade

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Aplicável somente quando textSplitMode é definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final da nth chunk.

pageOverlapLength?: number

Valor da propriedade

number

textSplitMode

Um valor que indica qual modo de divisão executar.

textSplitMode?: "pages" | "sentences"

Valor da propriedade

"pages" | "sentences"

unit

Aplica-se somente se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá o comprimento (maximumPageLength e pageOverlapLength). O padrão é "caracteres", o que significa que o comprimento será medido por caractere.

unit?: string

Valor da propriedade

string

Detalhes das propriedades herdadas

context

Representa o nível em que as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.

context?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.context

description

A descrição da habilidade que descreve as entradas, as saídas e o uso da habilidade.

description?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.description

inputs

As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade upstream.

inputs: InputFieldMappingEntry[]

Valor da propriedade

Herdado deSearchIndexerSkill.inputs

name

O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixado com o caractere '#'.

name?: string

Valor da propriedade

string

Herdado deSearchIndexerSkill.name

outputs

A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como entrada por outra habilidade.

outputs: OutputFieldMappingEntry[]

Valor da propriedade

Herdado deSearchIndexerSkill.outputs