SplitSkill interface

套件:: @azure/search-documents

將字串分割成文字區塊的技能。

Extends: BaseSearchIndexerSkill

屬性

azureOpenAITokenizerParameters	只有在單位設定為 azureOpenAITokens 時才適用。如果指定，splitSkill 會在執行令牌化時使用這些參數。參數是有效的 'encoderModelName' 和選擇性的 'allowedSpecialTokens' 屬性。
defaultLanguageCode	值，指出要使用的語言程序代碼。預設值為 `en`。
maximumPagesToTake	只有在 textSplitMode 設定為 'pages' 時才適用。如果指定，SplitSkill 會在處理第一個『maximumPagesToTake』頁面之後停止分割，以便在每個檔只需要幾個初始頁面時改善效能。
maxPageLength	所需的頁面長度上限。預設值為 10000。
odatatype	多型歧視性，指定這個物件可以是的不同類型
pageOverlapLength	只有在 textSplitMode 設定為 'pages' 時才適用。如果指定，n+1 區塊會從第 n 個區塊結尾的這個字元/標記數目開始。
textSplitMode	值，表示要執行的分割模式。
unit	只有在 textSplitMode 設定為頁面時才適用。有兩個可能的值。值的選擇將決定長度（maximumPageLength 和 pageOverlapLength）測量。默認值為 'characters'，這表示長度會以字元來測量。

繼承的屬性

context	代表作業發生的層級，例如檔根目錄或文件內容（例如 /document 或 /document/content）。預設值為 /document。
description	描述技能的描述，描述技能的輸入、輸出和使用方式。
inputs	技能的輸入可以是源數據集中的數據行，或上游技能的輸出。
name	技能的名稱，可唯一識別技能集內的技能。未定義名稱的技能將會在技能數位中指定其以 1 起始索引的預設名稱，前面加上字元『#』。
outputs	技能的輸出是搜尋索引中的字段，或是另一個技能可作為輸入的值。

屬性詳細資料

azureOpenAITokenizerParameters

只有在單位設定為 azureOpenAITokens 時才適用。如果指定，splitSkill 會在執行令牌化時使用這些參數。參數是有效的 'encoderModelName' 和選擇性的 'allowedSpecialTokens' 屬性。

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

屬性值

AzureOpenAITokenizerParameters

defaultLanguageCode

值，指出要使用的語言程序代碼。預設值為 en。

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

屬性值

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

只有在 textSplitMode 設定為 'pages' 時才適用。如果指定，SplitSkill 會在處理第一個『maximumPagesToTake』頁面之後停止分割，以便在每個檔只需要幾個初始頁面時改善效能。

maximumPagesToTake?: number

屬性值

number

maxPageLength

所需的頁面長度上限。預設值為 10000。

maxPageLength?: number

屬性值

number

odatatype

多型歧視性，指定這個物件可以是的不同類型

odatatype: "#Microsoft.Skills.Text.SplitSkill"

屬性值

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

只有在 textSplitMode 設定為 'pages' 時才適用。如果指定，n+1 區塊會從第 n 個區塊結尾的這個字元/標記數目開始。

pageOverlapLength?: number

屬性值

number

textSplitMode

值，表示要執行的分割模式。

textSplitMode?: "pages" | "sentences"

屬性值

"pages" | "sentences"

unit

只有在 textSplitMode 設定為頁面時才適用。有兩個可能的值。值的選擇將決定長度（maximumPageLength 和 pageOverlapLength）測量。默認值為 'characters'，這表示長度會以字元來測量。

unit?: string

屬性值

string

繼承的屬性詳細資料

context

代表作業發生的層級，例如檔根目錄或文件內容（例如 /document 或 /document/content）。預設值為 /document。

context?: string

屬性值

string

繼承自SearchIndexerSkill.context

description

描述技能的描述，描述技能的輸入、輸出和使用方式。

description?: string

屬性值

string

繼承自SearchIndexerSkill.description

inputs

技能的輸入可以是源數據集中的數據行，或上游技能的輸出。

inputs: InputFieldMappingEntry[]

屬性值

InputFieldMappingEntry[]

繼承自SearchIndexerSkill.inputs

name

技能的名稱，可唯一識別技能集內的技能。未定義名稱的技能將會在技能數位中指定其以 1 起始索引的預設名稱，前面加上字元『#』。

name?: string

屬性值

string

繼承自SearchIndexerSkill.name

outputs

技能的輸出是搜尋索引中的字段，或是另一個技能可作為輸入的值。

outputs: OutputFieldMappingEntry[]

屬性值

OutputFieldMappingEntry[]

繼承自SearchIndexerSkill.outputs

意見反應

此頁面對您有幫助嗎？

共用方式為

SplitSkill interface

屬性

繼承的屬性

屬性詳細資料

azureOpenAITokenizerParameters

屬性值

defaultLanguageCode

屬性值

maximumPagesToTake

屬性值

maxPageLength

屬性值

odatatype

屬性值

pageOverlapLength

屬性值

textSplitMode

屬性值

unit

屬性值

繼承的屬性詳細資料

context

屬性值

description

屬性值

inputs

屬性值

name

屬性值

outputs

屬性值

意見反應