Megosztás a következőn keresztül:


PatternTokenizer interface

Tokenizer, amely regex mintaegyeztetés használatával hoz létre különböző jogkivonatokat. Ez a tokenizer az Apache Lucene használatával van implementálva.

Tulajdonságok

flags

Reguláris kifejezésjelölők. Lehetséges értékek: "CANON_EQ", "CASE_INSENSITIVE", "MEGJEGYZÉSEK", "DOTALL", "LITERÁL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

group

A reguláris kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesz kinyerve. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. Alapértelmezett érték: -1.

name

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

odatatype

Polimorf diszkriminatív

pattern

Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett kifejezés egy vagy több szóközkarakternek felel meg. Alapértelmezett érték: \W+.

Tulajdonság adatai

flags

Reguláris kifejezésjelölők. Lehetséges értékek: "CANON_EQ", "CASE_INSENSITIVE", "MEGJEGYZÉSEK", "DOTALL", "LITERÁL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Tulajdonság értéke

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

group

A reguláris kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesz kinyerve. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. Alapértelmezett érték: -1.

group?: number

Tulajdonság értéke

number

name

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

name: string

Tulajdonság értéke

string

odatatype

Polimorf diszkriminatív

odatatype: "#Microsoft.Azure.Search.PatternTokenizer"

Tulajdonság értéke

"#Microsoft.Azure.Search.PatternTokenizer"

pattern

Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett kifejezés egy vagy több szóközkarakternek felel meg. Alapértelmezett érték: \W+.

pattern?: string

Tulajdonság értéke

string