PatternAnalyzer interface

正規表現パターンを使用して、テキストを用語に柔軟に分割します。このアナライザーは、Apache Lucene を使用して実装されます。

プロパティ

flags	正規表現フラグ。使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。
lowerCaseTerms	用語を小文字にするかどうかを示す値。既定値は true です。既定値: true。
name	アナライザーの名前。文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。
odatatype	ポリモーフィック識別子
pattern	トークン区切り記号と一致する正規表現パターン。既定値は、1 つ以上の空白文字と一致する式です。既定値: `\W+`.
stopwords	ストップワードの一覧。

正規表現フラグ。使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

用語を小文字にするかどうかを示す値。既定値は true です。既定値: true。

lowerCaseTerms?: boolean

boolean

アナライザーの名前。文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。

name: string

string

ポリモーフィック識別子

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

"#Microsoft.Azure.Search.PatternAnalyzer"

トークン区切り記号と一致する正規表現パターン。既定値は、1 つ以上の空白文字と一致する式です。既定値: \W+.

pattern?: string

string

ストップワードの一覧。

stopwords?: string[]

string[]