MicrosoftLanguageTokenizer クラス

定義

重要

一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。

言語固有のルールを使用してテキストが分割されます。

public class MicrosoftLanguageTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer

type MicrosoftLanguageTokenizer = class
    inherit LexicalTokenizer

Public Class MicrosoftLanguageTokenizer
Inherits LexicalTokenizer

MicrosoftLanguageTokenizer の新しいインスタンスを初期化します。

IsSearchTokenizer	トークナイザーの使用方法を示す値。検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。既定値は false です。
Language	使用する言語。既定値は英語です。
MaxTokenLength	トークンの最大長。最大長より長いトークンは分割されます。使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは、設定された最大トークン長に基づいて分割されます。既定値は 255 です。
Name	トークナイザーの名前。アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 LexicalTokenizer)