SplitSkill interface
Uma habilidade para dividir uma cadeia de caracteres em pedaços de texto.
- Extends
Propriedades
| azure |
Só se aplica se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'. |
| default |
Um valor que indica qual código de idioma usar. A predefinição é |
| maximum |
Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão após o processamento das primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento. |
| max |
O comprimento máximo de página desejado. O padrão é 10000. |
| odatatype | Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser |
| page |
Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final do nono bloco. |
| text |
Um valor que indica qual modo de divisão executar. |
| unit | Só se aplica se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá a medida do comprimento (maximumPageLength e pageOverlapLength). O padrão é 'caracteres', o que significa que o comprimento será medido por caractere. |
Propriedades Herdadas
| context | Representa o nível no qual as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document. |
| description | A descrição da habilidade que descreve as entradas, saídas e uso da habilidade. |
| inputs | As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade a montante. |
| name | O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixada com o caractere '#'. |
| outputs | A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como uma entrada por outra habilidade. |
Detalhes de Propriedade
azureOpenAITokenizerParameters
Só se aplica se a unidade estiver definida como azureOpenAITokens. Se especificado, o splitSkill usará esses parâmetros ao executar a tokenização. Os parâmetros são um 'encoderModelName' válido e uma propriedade opcional 'allowedSpecialTokens'.
azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters
Valor de Propriedade
defaultLanguageCode
Um valor que indica qual código de idioma usar. A predefinição é en.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
Valor de Propriedade
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, o SplitSkill interromperá a divisão após o processamento das primeiras páginas 'maximumPagesToTake', a fim de melhorar o desempenho quando apenas algumas páginas iniciais forem necessárias de cada documento.
maximumPagesToTake?: number
Valor de Propriedade
number
maxPageLength
O comprimento máximo de página desejado. O padrão é 10000.
maxPageLength?: number
Valor de Propriedade
number
odatatype
Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser
odatatype: "#Microsoft.Skills.Text.SplitSkill"
Valor de Propriedade
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
Aplicável apenas quando textSplitMode está definido como 'pages'. Se especificado, n+1º bloco começará com esse número de caracteres/tokens a partir do final do nono bloco.
pageOverlapLength?: number
Valor de Propriedade
number
textSplitMode
Um valor que indica qual modo de divisão executar.
textSplitMode?: "pages" | "sentences"
Valor de Propriedade
"pages" | "sentences"
unit
Só se aplica se textSplitMode estiver definido como páginas. Há dois valores possíveis. A escolha dos valores decidirá a medida do comprimento (maximumPageLength e pageOverlapLength). O padrão é 'caracteres', o que significa que o comprimento será medido por caractere.
unit?: string
Valor de Propriedade
string
Detalhes da Propriedade Herdada
context
Representa o nível no qual as operações ocorrem, como a raiz do documento ou o conteúdo do documento (por exemplo, /document ou /document/content). O padrão é /document.
context?: string
Valor de Propriedade
string
Herdado deSearchIndexerSkill.context
description
A descrição da habilidade que descreve as entradas, saídas e uso da habilidade.
description?: string
Valor de Propriedade
string
Herdado deSearchIndexerSkill.description
inputs
As entradas das habilidades podem ser uma coluna no conjunto de dados de origem ou a saída de uma habilidade a montante.
inputs: InputFieldMappingEntry[]
Valor de Propriedade
Herdado deSearchIndexerSkill.inputs
name
O nome da habilidade que a identifica exclusivamente dentro do conjunto de habilidades. Uma habilidade sem nome definido receberá um nome padrão de seu índice baseado em 1 na matriz de habilidades, prefixada com o caractere '#'.
name?: string
Valor de Propriedade
string
Herdado deSearchIndexerSkill.name
outputs
A saída de uma habilidade é um campo em um índice de pesquisa ou um valor que pode ser consumido como uma entrada por outra habilidade.
outputs: OutputFieldMappingEntry[]
Valor de Propriedade
Herdado deSearchIndexerSkill.outputs