CustomAnalyzer interface
テキストをインデックス付き/検索可能なトークンに変換するプロセスを制御できます。 これは、1 つの定義済みトークナイザーと 1 つ以上のフィルターで構成されるユーザー定義の構成です。 トークナイザーは、テキストをトークンに分割し、トークナイザーによって出力されるトークンを変更するためのフィルターを担当します。
プロパティ
char |
トークナイザーによって処理される前に入力テキストを準備するために使用される文字フィルターの一覧。 たとえば、それらを使用して、特定の文字や記号を置き換えることができます。 フィルターは、一覧表示されている順序で実行されます。 |
name | アナライザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 |
odatatype | ポリモーフィック識別子 |
token |
トークナイザーによって生成されたトークンをフィルター処理または変更するために使用されるトークン フィルターの一覧。 たとえば、すべての文字を小文字に変換する lowercase フィルターを指定することができます。 フィルターは、一覧表示されている順序で実行されます。 |
tokenizer |
文を単語に分割するなど、連続するテキストをトークンのシーケンスに分割するために使用するトークナイザーの名前。 KnownTokenizerNames は、組み込みのトークナイザー名を含む列挙型です。 |
プロパティの詳細
charFilters
トークナイザーによって処理される前に入力テキストを準備するために使用される文字フィルターの一覧。 たとえば、それらを使用して、特定の文字や記号を置き換えることができます。 フィルターは、一覧表示されている順序で実行されます。
charFilters?: string[]
プロパティ値
string[]
name
アナライザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。
name: string
プロパティ値
string
odatatype
ポリモーフィック識別子
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
プロパティ値
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
トークナイザーによって生成されたトークンをフィルター処理または変更するために使用されるトークン フィルターの一覧。 たとえば、すべての文字を小文字に変換する lowercase フィルターを指定することができます。 フィルターは、一覧表示されている順序で実行されます。
tokenFilters?: string[]
プロパティ値
string[]
tokenizerName
文を単語に分割するなど、連続するテキストをトークンのシーケンスに分割するために使用するトークナイザーの名前。 KnownTokenizerNames は、組み込みのトークナイザー名を含む列挙型です。
tokenizerName: string
プロパティ値
string