CustomAnalyzer interface

パッケージ:: @azure/search-documents

テキストをインデックス可能/検索可能なトークンに変換するプロセスを制御できます。これは、1 つの定義済みのトークナイザーと 1 つ以上のフィルターで構成されるユーザー定義の構成です。トークナイザーは、テキストをトークンに分割し、トークナイザーによって出力されるトークンを変更するためのフィルターを担当します。

プロパティ

charFilters	トークナイザーによって処理される前に入力テキストを準備するために使用される文字フィルターの一覧。たとえば、特定の文字や記号を置き換えることができます。フィルターは、一覧表示されている順序で実行されます。
name	アナライザーの名前。文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。
odatatype	ポリモーフィック識別子
tokenFilters	トークナイザーによって生成されたトークンをフィルターで除外または変更するために使用されるトークンフィルターの一覧。たとえば、すべての文字を小文字に変換する小文字フィルターを指定できます。フィルターは、一覧表示されている順序で実行されます。
tokenizerName	文を単語に分割するなど、連続するテキストをトークンのシーケンスに分割するために使用するトークナイザーの名前。 KnownTokenizerNames は、組み込みのトークナイザー名を含む列挙型です。

プロパティの詳細

charFilters

トークナイザーによって処理される前に入力テキストを準備するために使用される文字フィルターの一覧。たとえば、特定の文字や記号を置き換えることができます。フィルターは、一覧表示されている順序で実行されます。

charFilters?: string[]

プロパティ値

string[]

name

アナライザーの名前。文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。

name: string

プロパティ値

string

odatatype

ポリモーフィック識別子

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

プロパティ値

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

トークナイザーによって生成されたトークンをフィルターで除外または変更するために使用されるトークンフィルターの一覧。たとえば、すべての文字を小文字に変換する小文字フィルターを指定できます。フィルターは、一覧表示されている順序で実行されます。

tokenFilters?: string[]

プロパティ値

string[]

tokenizerName

文を単語に分割するなど、連続するテキストをトークンのシーケンスに分割するために使用するトークナイザーの名前。 KnownTokenizerNames は、組み込みのトークナイザー名を含む列挙型です。

tokenizerName: string

プロパティ値

string