Coincidencia de caracteres
Actualización: noviembre 2007
El punto (.) coincide con cualquier carácter imprimible o no imprimible de una cadena salvo con un carácter. Esta excepción es el carácter de nueva línea (\n). La siguiente expresión regular coincide con aac, abc, acc, adc, etc., así como con a1c, a2c, a-c y a#c:
/a.c/
Para hacer coincidir una cadena que contenga un nombre de archivo con un punto (.) en la cadena de entrada, incluya una barra diagonal inversa (\) antes del punto en la expresión regular. A continuación, se muestra un ejemplo de expresión regular que coincide con filename.ext:
/filename\.ext/
Estas expresiones sólo permiten coincidencias con cualquier carácter individual. Puede buscar coincidencias con los caracteres específicos de una lista. Por ejemplo, puede buscar encabezados de capítulo expresados numéricamente (Capítulo 1, Capítulo 2, etc.).
Expresiones de corchetes
Para crear una lista de caracteres coincidentes, coloque uno o más caracteres individuales entre corchetes ([ y ]). Cuando los caracteres se encierran entre corchetes, la lista se denomina expresión de corchete. Dentro de los corchetes, al igual que en cualquier otra parte, un carácter ordinario se representa a sí mismo, es decir, coincide con una aparición de sí mismo en el texto de entrada. La mayoría de los caracteres especiales pierden su significado cuando se incluyen en una expresión con corchetes. A continuación, se muestran algunas excepciones:
El carácter ] finaliza una lista si no es el primer elemento. Para buscar coincidencias con el carácter ] en una lista, colóquelo en primer lugar inmediatamente después del carácter [ de apertura.
El carácter \ sigue siendo el carácter de escape. Para buscar coincidencias con el carácter \, utilice \\.
Los caracteres encerrados en una expresión de corchetes coinciden sólo con el único carácter que ocupa una posición en la expresión regular. La siguiente expresión regular coincide con Chapter 1, Chapter 2, Chapter 3, Chapter 4, y Chapter 5:
/Chapter [12345]/
Observe que la palabra Chapter y el espacio que va detrás de esta palabra ocupan una posición fija con respecto a los caracteres dentro de los corchetes. La expresión entre corchetes se utiliza para especificar sólo el conjunto de caracteres que coincide con la posición de un solo carácter inmediatamente después de la palabra Chapter y un espacio. Ésta es la novena posición del carácter.
Para expresar los caracteres de coincidencia utilizando un intervalo en vez de los caracteres mismos, utilice un guión (-) para separar los caracteres inicial y final del intervalo. El valor del carácter de los caracteres individuales determina el orden relativo dentro del intervalo. La siguiente expresión regular contiene una expresión de intervalo equivalente a la lista entre corchetes mostrada en el ejemplo anterior.
/Chapter [1-5]/
Cuando se especifica un intervalo de esta forma, los valores inicial y final están incluidos en el intervalo. Es importante tener en cuenta que el valor inicial debe ir antes del valor final en el criterio de ordenación Unicode.
Para incluir un guión en una expresión de corchetes, siga uno de estos procedimientos:
Coloque una barra diagonal inversa delante del guión:
[\-]
Coloque el guión al principio o al final de la lista con corchetes. Las expresiones siguientes coinciden con todas las letras en minúsculas y con el guión:
[-a-z] [a-z-]
Cree un intervalo en el que el valor del carácter inicial sea menor que el guión y el carácter final sea igual o mayor que el guión. Las dos expresiones regulares siguientes cumplen este requisito:
[!--] [!-~]
Para buscar todos los caracteres que no estén en una lista o intervalo, coloque el símbolo de intercalación (^) al principio de la lista. Si el carácter de intercalación aparece en otra posición dentro de la lista, coincide consigo mismo. La siguiente expresión regular coincide con los encabezados de capítulo cuyo número es mayor que 5:
/Chapter [^12345]/
En los ejemplos anteriores, la expresión coincide con cualquier dígito que se encuentre en la novena posición, salvo con 1, 2, 3, 4 o 5. Así, por ejemplo, coincide con Chapter 7 y con Chapter 9.
Las expresiones anteriores se pueden representar mediante el guión (-):
/Chapter [^1-5]/
La expresión de corchetes se utiliza normalmente para especificar coincidencias de caracteres alfabéticos en mayúsculas y minúsculas o de dígitos. La siguiente expresión especifica este tipo de coincidencia:
/[A-Za-z0-9]/