PatternTokenizer interface
Создатель маркеров, использующий сопоставление шаблонов регулярных выражений для создания уникальных маркеров. Этот создатель маркеров реализуется с помощью Apache Lucene.
Свойства
flags | Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES". |
group | Отсчитываемый от нуля порядковый номер соответствующей группы в шаблоне регулярного выражения для извлечения в маркеры. Используйте значение -1, если вы хотите использовать весь шаблон для разделения входных данных на маркеры независимо от соответствующих групп. Значение по умолчанию — -1. Значение по умолчанию: -1. |
name | Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков. |
odatatype | Полиморфный дискриминатор |
pattern | Шаблон регулярного выражения для сопоставления разделителей маркеров. Значение по умолчанию — это выражение, соответствующее одному или нескольким пробелам. Значение по умолчанию: |
Сведения о свойстве
flags
Флаги регулярных выражений. Возможные значения: "CANON_EQ", "CASE_INSENSITIVE", "COMMENTS", "DOTALL", "LITERAL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES".
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Значение свойства
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
Отсчитываемый от нуля порядковый номер соответствующей группы в шаблоне регулярного выражения для извлечения в маркеры. Используйте значение -1, если вы хотите использовать весь шаблон для разделения входных данных на маркеры независимо от соответствующих групп. Значение по умолчанию — -1. Значение по умолчанию: -1.
group?: number
Значение свойства
number
name
Имя создателя маркеров. Название должно содержать только буквы, цифры, тире или знаки подчеркивания. Оно может начинаться и заканчиваться только буквенно-цифровыми знаками, и его длина не должна превышать 128 знаков.
name: string
Значение свойства
string
odatatype
Полиморфный дискриминатор
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Значение свойства
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Шаблон регулярного выражения для сопоставления разделителей маркеров. Значение по умолчанию — это выражение, соответствующее одному или нескольким пробелам. Значение по умолчанию: \W+
.
pattern?: string
Значение свойства
string