共用方式為


WordsSegmenter 類別

定義

區段器類別,可根據特定語言) ,將提供的文字分割成單字或字幹 (。

public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
繼承
Object Platform::Object IInspectable WordsSegmenter
屬性

Windows 需求

裝置系列
Windows 10 (已於 10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox 引進)
API contract
Windows.Foundation.UniversalApiContract (已於 v1.0 引進)

備註

對於在日文、中文、韓文和泰文) 等字 (組之間未使用空格的語言,使用區隔器是取得文字處理案例之個別單字的唯一方法,例如關鍵字搜尋。

建構此物件時所提供的語言會與系統上具有斷詞工具的語言進行比對,而且會使用最佳的文字分割規則。 語言不一定是應用程式的其中一種支援語言。 如果該語言沒有特別支援的語言規則,則會使用語言中性規則 (Unicode 標準附錄 #29 Unicode 文字分割) 實作, 而 ResolvedLanguage 屬性會設定為 「und」 (未決定的語言) 。

對於關鍵字搜尋案例,一律建議以文字內容的語言要求區段器。

針對拼字檢查案例,某些語言區段 (例如德文) 可能會傳回單一複合字組的多個字幹欄位。 相反地,拼字檢查 API 可能會預期單字會保持在一起。 針對這類語言,您可以選擇藉由明確要求「und」 (未決定的語言) 區段器來強制語言中性區隔規則。 不過,這麼做可大幅減少非空格語言的重大品質。 因此,建議您使用 Language.Script API 來判斷內容語言是否使用下列其中一個非空格腳本:

指令碼 語言
Bopo 注音符號
兄弟 Brahmi
Egyp 埃吉那吉文
Goth 哥 特 式
停止回應 韓文
停止回應 平假名
停止回應 舊韓文
哈尼文
斜體 舊斜體
Java 爪哇文
假名 片假名
Khar Kharoshthi
Khmr 高棉文
Laoo 寮文
傈僳族 傈僳族
Mymr 緬甸
Talu 新傣文
泰文 泰文
Tibt 西藏文
Xsux 楔 形
Y iii 爨文

如果找不到這些腳本,則使用「und」 進行拼字檢查案例分割應該很安全。

建構函式

WordsSegmenter(String)

建立 WordsSegmenter 物件。 如需如何使用此建構函式所提供語言的描述,請參閱 WordsSegmenter 簡介。

屬性

ResolvedLanguage

取得這個 WordsSegmenter 物件所使用的規則語言。

如果我們使用語言中性規則,則會傳回 「und」 (未決定) 。

方法

GetTokenAt(String, UInt32)

會決定並傳回包含或追蹤所提供文字之指定索引的字幹或字幹。

GetTokens(String)

會決定並傳回所提供文字中的所有單字或字幹。

Tokenize(String, UInt32, WordSegmentsTokenizingHandler)

使用兩個反覆運算器呼叫提供的處理常式,以逐一查看指定索引之前的字組,並將指定的索引追蹤至提供的文字。

適用於