WordsSegmenter クラス

定義

指定されたテキストを単語または単語の語幹にセグメント化できるスセグメント化クラス (特定の言語に応じて)。

public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
継承
Object Platform::Object IInspectable WordsSegmenter
属性

Windows の要件

デバイス ファミリ
Windows 10 (10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox で導入)
API contract
Windows.Foundation.UniversalApiContract (v1.0 で導入)

注釈

単語間にスペースを使用しない言語 (日本語、中国語、韓国語、タイ語など) の場合、スセグメントを使用することは、キーワード (keyword)検索などのテキスト処理シナリオで個々の単語を取得する唯一の方法です。

このオブジェクトの構築時に指定された言語は、システム上のワード ブレーカーを持つ言語と照合され、使用可能な最適な単語セグメント化ルールが使用されます。 言語は、アプリでサポートされている言語の 1 つである必要はありません。 その言語に対して特にサポートされている言語規則がない場合は、言語に依存しない規則 ( Unicode 標準付属書 #29 Unicode テキスト セグメント化の実装) が使用され、 ResolvedLanguage プロパティは "und" (未確定言語) に設定されます。

キーワード (keyword)検索シナリオでは、常にテキスト コンテンツの言語でセグメント化を要求することをお勧めします。

スペル チェックのシナリオでは、一部の言語セグメント (ドイツ語など) は、1 つの複合語に対して複数の単語幹セグメントを返す場合があります。 これに対し、スペル チェック API では、単語を 1 つの単語としてまとめて保持することが想定される場合があります。 このような言語の場合は、"und" (未決定の言語) セゲライザーを明示的に要求することで、言語に依存しないセグメント化規則を強制することができます。 ただし、このようにすると、スペースのない言語の破壊的品質が大幅に低下します。 そのため、 Language.Script API を使用して、コンテンツ言語で次のいずれかの空白以外のスクリプトが使用されているかどうかを判断することをお勧めします。

スクリプト Language
Bopo Bopomofo
Brah Brahmi
Egyp エジプトヒエログリフ
ゴス ゴート文字
中止 ハングル
中止 ひらがな
中止 古いハングル
ハニ語
Ital 古代イタリア文字
Java ジャワ文字
Kana カタカナ
Khar Kharoshthi
Khmr クメール語
Laoo ラオス語
リス リス
Mymr ミャンマー
Talu 新タイ ロ文字
タイ語 タイ語
Tibt チベット語
Xsux 楔形文字
Yiii イ語

これらのスクリプトが見つからない場合は、スペル チェック シナリオのセグメント化に "und" を使用しても問題ありません。

コンストラクター

WordsSegmenter(String)

WordsSegmenter オブジェクトを作成します。 このコンストラクターに提供される言語の使用方法については、 WordsSegmenter の概要に関するページを参照してください。

プロパティ

ResolvedLanguage

この WordsSegmenter オブジェクトで使用されるルールの言語を取得します。

言語に依存しないルールを使用している場合は、"und" (未確定) が返されます。

メソッド

GetTokenAt(String, UInt32)

指定したインデックスを含む、または指定したテキストに従う単語または語幹を決定し、返します。

GetTokens(String)

指定されたテキスト内のすべての単語または単語の語幹を決定して返します。

Tokenize(String, UInt32, WordSegmentsTokenizingHandler)

指定されたインデックスの前と後の単語を指定されたテキストに反復処理する 2 つの反復子を使用して、指定されたハンドラーを呼び出します。

適用対象