逸出字元
更新:2007 年 11 月
大部分重要的規則運算式語言運算子是不可逸出的單一字元。逸出字元 \ (單一反斜線) 會對規則運算式剖析器信號通知,表示跟在反斜線之後的字元不是運算子。例如,剖析器會把星號 (*) 當成重複的數量詞,而星號後接反斜線 (\*) 則會被當成 Unicode 字元 002A。
以下表格所列的逸出字元在規則運算式和取代模式中會被辨識出來。
逸出字元 |
說明 |
||
---|---|---|---|
普通字元 |
自我符合且為 .$ ^ { [ ( | ) * + ? \ 以外的字元。 |
||
\a |
符合鬧鐘 (警示) \u0007。 |
||
\b |
如果是在 [] 字元類別中則符合退格鍵 \u0008,否則,請參閱本表格下方的注意事項。 |
||
\t |
符合定位點 \u0009。 |
||
\r |
符合歸位字元 \u000D。 |
||
\v |
符合垂直定位點 \u000B。 |
||
\f |
符合換頁字元 \u000C。 |
||
\n |
符合新行字元 \u000A。 |
||
\e |
符合逸出字元 \u001B。 |
||
\040 |
符合八進位的 ASCII 字元 (最多三個數字);如果前置字元不為零的編號只有一個數字,或是對應到擷取的群組編號,則為反向參考 (如需詳細資訊,請參閱反向參考)。例如,字元 \040 表示空格。 |
||
\x20 |
符合使用十六進位表示的 ASCII 字元 (剛好兩個數字)。 |
||
\cC |
符合 ASCII 控制字元;例如,\cC 為 control-C。 |
||
\u0020 |
符合使用十六進位表示的 Unicode 字元 (剛好四個數字)。
|
||
\ |
如果無法識別後面所接的字元為逸出字元,則符合該字元。例如,\* 與 \x2A 相同。 |
注意事項: |
---|
逸出字元 \b 是特殊案例。在規則運算式中,\b 代表除了 [] 字元類別外的字緣 (介於 \w 和 \W 字元間),其中 \b 表示退格鍵 (Backspace)。在取代模式中,\b 永遠代表退格鍵 (Backspace)。 |