PatternTokenizer interface
Tokenizer, amely regex mintaegyeztetés használatával hoz létre különböző jogkivonatokat. Ez a tokenizer az Apache Lucene használatával van implementálva.
Tulajdonságok
flags | Reguláris kifejezésjelölők. Lehetséges értékek: "CANON_EQ", "CASE_INSENSITIVE", "MEGJEGYZÉSEK", "DOTALL", "LITERÁL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES" |
group | A reguláris kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesz kinyerve. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. Alapértelmezett érték: -1. |
name | A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
odatatype | Polimorf diszkriminatív |
pattern | Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett kifejezés egy vagy több szóközkarakternek felel meg. Alapértelmezett érték: |
Tulajdonság adatai
flags
Reguláris kifejezésjelölők. Lehetséges értékek: "CANON_EQ", "CASE_INSENSITIVE", "MEGJEGYZÉSEK", "DOTALL", "LITERÁL", "MULTILINE", "UNICODE_CASE", "UNIX_LINES"
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Tulajdonság értéke
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
group
A reguláris kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesz kinyerve. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. Alapértelmezett érték: -1.
group?: number
Tulajdonság értéke
number
name
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
name: string
Tulajdonság értéke
string
odatatype
Polimorf diszkriminatív
odatatype: "#Microsoft.Azure.Search.PatternTokenizer"
Tulajdonság értéke
"#Microsoft.Azure.Search.PatternTokenizer"
pattern
Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett kifejezés egy vagy több szóközkarakternek felel meg. Alapértelmezett érték: \W+
.
pattern?: string
Tulajdonság értéke
string