SplitSkill interface

Paquete:: @azure/search-documents

Aptitud para dividir una cadena en fragmentos de texto.

Extends: BaseSearchIndexerSkill

Propiedades

azureOpenAITokenizerParameters	Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens".
defaultLanguageCode	Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es `en`.
maximumPagesToTake	Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento.
maxPageLength	Longitud máxima de página deseada. El valor predeterminado es 10000.
odatatype	Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.
pageOverlapLength	Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento.
textSplitMode	Valor que indica qué modo de división se va a realizar.
unit	Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter.

Propiedades heredadas

context	Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document.
description	Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud.
inputs	Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente.
name	Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#".
outputs	La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada.

Detalles de las propiedades

azureOpenAITokenizerParameters

Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens".

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Valor de propiedad

AzureOpenAITokenizerParameters

defaultLanguageCode

Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Valor de propiedad

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento.

maximumPagesToTake?: number

Valor de propiedad

number

maxPageLength

Longitud máxima de página deseada. El valor predeterminado es 10000.

maxPageLength?: number

Valor de propiedad

number

odatatype

Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Valor de propiedad

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento.

pageOverlapLength?: number

Valor de propiedad

number

textSplitMode

Valor que indica qué modo de división se va a realizar.

textSplitMode?: "pages" | "sentences"

Valor de propiedad

"pages" | "sentences"

unit

Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter.

unit?: string

Valor de propiedad

string

Detalles de las propiedades heredadas

context

Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document.

context?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.context

description

Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud.

description?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.description

inputs

Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente.

inputs: InputFieldMappingEntry[]

Valor de propiedad

InputFieldMappingEntry[]

Heredado deSearchIndexerSkill.inputs

name

Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#".

name?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.name

outputs

La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada.

outputs: OutputFieldMappingEntry[]

Valor de propiedad

OutputFieldMappingEntry[]

Heredado deSearchIndexerSkill.outputs

Comentarios

¿Le ha resultado útil esta página?

Compartir a través de

SplitSkill interface

Propiedades

Propiedades heredadas

Detalles de las propiedades

azureOpenAITokenizerParameters

Valor de propiedad

defaultLanguageCode

Valor de propiedad

maximumPagesToTake

Valor de propiedad

maxPageLength

Valor de propiedad

odatatype

Valor de propiedad

pageOverlapLength

Valor de propiedad

textSplitMode

Valor de propiedad

unit

Valor de propiedad

Detalles de las propiedades heredadas

context

Valor de propiedad

description

Valor de propiedad

inputs

Valor de propiedad

name

Valor de propiedad

outputs

Valor de propiedad

Comentarios