SplitSkill interface
Aptitud para dividir una cadena en fragmentos de texto.
- Extends
Propiedades
| azure |
Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens". |
| default |
Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es |
| maximum |
Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento. |
| max |
Longitud máxima de página deseada. El valor predeterminado es 10000. |
| odatatype | Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto. |
| page |
Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento. |
| text |
Valor que indica qué modo de división se va a realizar. |
| unit | Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter. |
Propiedades heredadas
| context | Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document. |
| description | Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud. |
| inputs | Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente. |
| name | Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#". |
| outputs | La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada. |
Detalles de las propiedades
azureOpenAITokenizerParameters
Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens".
azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters
Valor de propiedad
defaultLanguageCode
Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es en.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
Valor de propiedad
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento.
maximumPagesToTake?: number
Valor de propiedad
number
maxPageLength
Longitud máxima de página deseada. El valor predeterminado es 10000.
maxPageLength?: number
Valor de propiedad
number
odatatype
Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.
odatatype: "#Microsoft.Skills.Text.SplitSkill"
Valor de propiedad
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento.
pageOverlapLength?: number
Valor de propiedad
number
textSplitMode
Valor que indica qué modo de división se va a realizar.
textSplitMode?: "pages" | "sentences"
Valor de propiedad
"pages" | "sentences"
unit
Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter.
unit?: string
Valor de propiedad
string
Detalles de las propiedades heredadas
context
Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document.
context?: string
Valor de propiedad
string
Heredado deSearchIndexerSkill.context
description
Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud.
description?: string
Valor de propiedad
string
Heredado deSearchIndexerSkill.description
inputs
Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente.
inputs: InputFieldMappingEntry[]
Valor de propiedad
Heredado deSearchIndexerSkill.inputs
name
Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#".
name?: string
Valor de propiedad
string
Heredado deSearchIndexerSkill.name
outputs
La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada.
outputs: OutputFieldMappingEntry[]
Valor de propiedad
Heredado deSearchIndexerSkill.outputs