Поделиться через


PatternAnalyzer interface

Гибкий разделяет текст на термины с помощью шаблона регулярного выражения. Этот анализатор реализуется с помощью Apache Lucene.

Свойства

flags

Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "ЛИТЕРАЛ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

lowerCaseTerms

Значение, указывающее, должны ли термины быть строчными. Значение по умолчанию — true. Значение по умолчанию: true.

name

Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

odatatype

Полиморфная дискриминация

pattern

Шаблон регулярного выражения для сопоставления разделителей маркеров. По умолчанию используется выражение, соответствующее одному или нескольким символам пробелов. Значение по умолчанию: \W+.

stopwords

Список стоп-слов.

Сведения о свойстве

flags

Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "ЛИТЕРАЛ", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Значение свойства

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Значение, указывающее, должны ли термины быть строчными. Значение по умолчанию — true. Значение по умолчанию: true.

lowerCaseTerms?: boolean

Значение свойства

boolean

name

Имя анализатора. Он должен содержать только буквы, цифры, пробелы, дефисы или символы подчеркивания, может начинаться и заканчиваться буквенно-цифровыми символами и ограничен 128 символами.

name: string

Значение свойства

string

odatatype

Полиморфная дискриминация

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Значение свойства

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Шаблон регулярного выражения для сопоставления разделителей маркеров. По умолчанию используется выражение, соответствующее одному или нескольким символам пробелов. Значение по умолчанию: \W+.

pattern?: string

Значение свойства

string

stopwords

Список стоп-слов.

stopwords?: string[]

Значение свойства

string[]