SplitSkill interface
문자열을 텍스트 청크로 분할하는 기술입니다.
- Extends
속성
| default |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
| maximum |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 SplitSkill은 각 문서에서 몇 개의 초기 페이지만 필요할 때 성능을 향상시키기 위해 첫 번째 'maximumPagesToTake' 페이지를 처리한 후 분할을 중단합니다. |
| max |
원하는 최대 페이지 길이입니다. 기본값은 10000입니다. |
| odatatype | 이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자 |
| page |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 n+1번째 청크는 n번째 청크 끝에서 이 수의 문자/토큰으로 시작합니다. |
| text |
수행할 분할 모드를 나타내는 값입니다. |
상속된 속성
| context | 문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
| description | 기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
| inputs | 기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
| name | 기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
| outputs | 기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
속성 세부 정보
defaultLanguageCode
사용할 언어 코드를 나타내는 값입니다. 기본값은 en입니다.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "bs" | "cs" | "et" | "he" | "hi" | "hr" | "hu" | "id" | "ja" | "lv" | "nb" | "nl" | "pl" | "ru" | "sk" | "sl" | "sv" | "tr" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
속성 값
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "bs" | "cs" | "et" | "he" | "hi" | "hr" | "hu" | "id" | "ja" | "lv" | "nb" | "nl" | "pl" | "ru" | "sk" | "sl" | "sv" | "tr" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 SplitSkill은 각 문서에서 몇 개의 초기 페이지만 필요할 때 성능을 향상시키기 위해 첫 번째 'maximumPagesToTake' 페이지를 처리한 후 분할을 중단합니다.
maximumPagesToTake?: number
속성 값
number
maxPageLength
원하는 최대 페이지 길이입니다. 기본값은 10000입니다.
maxPageLength?: number
속성 값
number
odatatype
이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자
odatatype: "#Microsoft.Skills.Text.SplitSkill"
속성 값
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 n+1번째 청크는 n번째 청크 끝에서 이 수의 문자/토큰으로 시작합니다.
pageOverlapLength?: number
속성 값
number
textSplitMode
수행할 분할 모드를 나타내는 값입니다.
textSplitMode?: "pages" | "sentences"
속성 값
"pages" | "sentences"
상속된 속성 세부 정보
context
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다.
context?: string
속성 값
string
다음에서 상속됨SearchIndexerSkill.context
description
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다.
description?: string
속성 값
string
다음에서 상속됨SearchIndexerSkill.description
inputs
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다.
inputs: InputFieldMappingEntry[]
속성 값
SearchIndexerSkill.inputs에서 상속됨
name
outputs
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다.
outputs: OutputFieldMappingEntry[]
속성 값
SearchIndexerSkill.outputs에서 상속됨