Поделиться через


PatternTokenizer interface

Создатель маркеров, использующий сопоставление шаблонов регулярных выражений для создания уникальных маркеров. Этот создатель маркеров реализуется с помощью Apache Lucene.

Свойства

flags

Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES".

group

Отсчитываемый от нуля порядковый номер соответствующей группы в шаблоне регулярного выражения для извлечения в маркеры. Используйте значение -1, если вы хотите использовать весь шаблон для разделения входных данных на маркеры независимо от соответствующих групп. Значение по умолчанию — -1. Значение по умолчанию: -1.

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

odatatype

Полиморфный дискриминатор

pattern

Шаблон регулярного выражения для сопоставления разделителей маркеров. Значение по умолчанию — это выражение, соответствующее одному или нескольким пробелам. Значение по умолчанию: \W+.

Сведения о свойстве

flags

Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES".

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Значение свойства

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

group

Отсчитываемый от нуля порядковый номер соответствующей группы в шаблоне регулярного выражения для извлечения в маркеры. Используйте значение -1, если вы хотите использовать весь шаблон для разделения входных данных на маркеры независимо от соответствующих групп. Значение по умолчанию — -1. Значение по умолчанию: -1.

group?: number

Значение свойства

number

name

Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.

name: string

Значение свойства

string

odatatype

Полиморфный дискриминатор

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Значение свойства

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Шаблон регулярного выражения для сопоставления разделителей маркеров. Значение по умолчанию — это выражение, соответствующее одному или нескольким пробелам. Значение по умолчанию: \W+.

pattern?: string

Значение свойства

string