MicrosoftLanguageTokenizer クラス

定義

言語固有のルールを使用してテキストが分割されます。

public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageTokenizer = class
    inherit LexicalTokenizer
Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer
継承
MicrosoftLanguageTokenizer

コンストラクター

MicrosoftLanguageTokenizer(String)

MicrosoftLanguageTokenizer の新しいインスタンスを初期化します。

プロパティ

IsSearchTokenizer

トークナイザーの使用方法を示す 値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。

Language

使用する言語。 既定値は英語です。

MaxTokenLength

トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは、設定された最大トークン長に基づいて分割されます。 既定値は 255 です。

Name

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

(継承元 LexicalTokenizer)

適用対象