MicrosoftLanguageStemmingTokenizer クラス

定義

言語固有のルールを使用してテキストが分割され、基本フォームに単語が減らされます。

public class MicrosoftLanguageStemmingTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageStemmingTokenizer = class
    inherit LexicalTokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits LexicalTokenizer
継承
MicrosoftLanguageStemmingTokenizer

コンストラクター

MicrosoftLanguageStemmingTokenizer(String)

MicrosoftLanguageStemmingTokenizer の新しいインスタンスを初期化します。

プロパティ

IsSearchTokenizer

トークナイザーの使用方法を示す値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。

Language

使用する言語。 既定値は英語です。

MaxTokenLength

トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは最大トークン長セットに基づいて分割されます。 既定値は 255 です。

Name

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

(継承元 LexicalTokenizer)

適用対象