PatternAnalyzer interface
正規表現パターンを使用して、テキストを用語に柔軟に分割します。 このアナライザーは、Apache Lucene を使用して実装されます。
プロパティ
| flags | 正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。 |
| lower |
用語を小文字にするかどうかを示す値。 既定値は true です。 既定値: true。 |
| name | アナライザーの名前。 文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。 |
| odatatype | ポリモーフィック識別子 |
| pattern | トークン区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: |
| stopwords | ストップワードの一覧。 |
プロパティの詳細
flags
正規表現フラグ。 使用できる値は、'CANON_EQ'、'CASE_INSENSITIVE'、'COMMENTS'、'DOTALL'、'LITERAL'、'MULTILINE'、'UNICODE_CASE'、'UNIX_LINES' です。
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
プロパティ値
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
用語を小文字にするかどうかを示す値。 既定値は true です。 既定値: true。
lowerCaseTerms?: boolean
プロパティ値
boolean
name
アナライザーの名前。 文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。
name: string
プロパティ値
string
odatatype
ポリモーフィック識別子
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
プロパティ値
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
トークン区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の空白文字と一致する式です。 既定値: \W+.
pattern?: string
プロパティ値
string
stopwords
ストップワードの一覧。
stopwords?: string[]
プロパティ値
string[]