Expressões regulares (Visual Studio)

Artigo
08/01/2011

Expressões regulares são uma notação concisa e flexível para localizar e substituir padrões de texto. Você pode usar um conjunto específico de expressões regulares no Localizar e Substituir campos da Localizar e substituir janela ao executar Localização rápida, Find in Files, Substituição rápida, ou Replace in Files operações.

Para ativar as expressões regulares, expanda encontrar opções na Localizar e substituir janela, selecione usoe selecione expressões regulares. O triangular Construtor de expressões botões ao lado do Localizar e Substituir campos se tornam disponíveis. Clique no botão para exibir uma lista de expressões regulares usadas com freqüência. Quando você clica em uma expressão regular na lista, ele é inserido no local do cursor na Localizar ou Substituir campos. Quando você clica em Lista completa de caracteres na parte inferior do Construtor de expressões, um tópico de ajuda será exibido. O tópico contém todas as expressões regulares são reconhecidas pelo Visual Studio Localizar e substituir. Você pode copiar uma expressão regular no tópico e cole-o Localizar ou Substituir campos.

Observação
Há muitas diferenças de sintaxe entre as expressões regulares que podem ser usadas em Localizar e Substituir e aqueles que são válidos em .NET Framework programação. Por exemplo, o Localizar e substituir janela, chaves {} são usados para marcação de expressões a ser substituído: Para alterar todas as ocorrências de não para não não, você usaria a expressão de localização {does} e substituir expressão \ 1 não. A sintaxe da expressão regular difere .NET Framework, onde a {} a notação usada para quantificadores, para que a expressão zo{1} corresponderia a todas as ocorrências de z seguido de exatamente um o, como em zone , mas não em zoo.

Há muitas diferenças de sintaxe entre as expressões regulares que podem ser usadas em Localizar e Substituir e aqueles que são válidos em .NET Framework programação. Por exemplo, o Localizar e substituir janela, chaves {} são usados para marcação de expressões a ser substituído: Para alterar todas as ocorrências de não para não não, você usaria a expressão de localização {does} e substituir expressão \ 1 não. A sintaxe da expressão regular difere .NET Framework, onde a {} a notação usada para quantificadores, para que a expressão zo{1} corresponderia a todas as ocorrências de z seguido de exatamente um o, como em zone , mas não em zoo.

Expressões regulares para localizar e substituir

Utilizados em expressões regulares que aparecem na Construtor de expressões são como segue.

Expression	Syntax	Description	Example
Qualquer caractere	.	Corresponde a qualquer caractere único exceto uma quebra de linha.	a.o corresponde a "TOA" em "cerca" e "abo" Na caixa "sobre" mas não "onfigurações de" no "xadrez".
Zero ou mais	*	Corresponde a zero ou mais ocorrências da expressão precedente e torna todas as correspondências possíveis.	um * b corresponde a "b" em "bat" e "ab" Na caixa "sobre". e.*e corresponde à palavra "empresa".
Um ou mais	+	Corresponde a pelo menos uma ocorrência da expressão precedente.	AC + corresponde a palavras que contêm a letra "a" e pelo menos uma instância de "c", como, por exemplo, "race" e "ace". a. + s corresponde à palavra "acesso".
Início da linha	^	Ancora a seqüência de caracteres de correspondência para o início de uma linha.	^ carro corresponde à palavra "car" somente quando ele aparece como o primeiro conjunto de caracteres em uma linha do editor.
Fim da linha	$	Ancora a seqüência de caracteres de correspondência ao final de uma linha.	Finalizar$ corresponde à palavra "end" somente quando ele aparece como o último conjunto de caracteres possíveis no final de uma linha no editor.
Início da palavra	<	Corresponde somente quando uma palavra começa nesse ponto no texto.	< na corresponde a palavras como "interna" e "em" que começam com as letras "in".
Fim da palavra	>	Corresponde somente quando uma palavra termina nesse ponto no texto.	SS > corresponde a palavras como "xadrez" e "perda" que terminam com as letras "ss".
Quebra de linha	\n	Corresponde a uma quebra de linha independente do sistema operacional. Em uma expressão de substituição, insere uma quebra de linha.	End\nBegin corresponde à palavra "End" e "Begin" somente quando "End" é a última seqüência de caracteres em uma linha e "Begin" é a primeira seqüência de caracteres na linha seguinte. Em uma expressão de substituição Begin\nEnd substitui a palavra "End" com "Begin" na primeira linha, quebra de insere uma linha e, em seguida, substitui a palavra "Begin" com a palavra "End".
Qualquer caractere no conjunto	[]	Corresponde a qualquer um dos caracteres em [a]. Para especificar um intervalo de caracteres, liste os inicial e final de caracteres separados por um traço (-), como em [a-z].	ser [n-t corresponde a "apostar" em "entre", "ben" em "posterior" e "bes" em "ao lado" mas não "rótu" em "abaixo".
Qualquer caractere não está no conjunto	[^...]	Corresponde a qualquer caractere que não esteja no conjunto de caracteres que segue o ^.	ser [^ n-t corresponde a "bef" em "antes", "beh" em "atrasado" e "rótu" em "abaixo", mas não "ben" em "posterior".
Or	\|	Corresponde a expressão antes ou um após o símbolo ou (\|). Usado principalmente em um grupo.	banheira de (sponge\|mud) corresponde a "banho de esponja" e "banho de lama".
Escape	\	Corresponde ao caractere que segue a barra invertida (\) como um literal. Isso permite que você localize os caracteres que são usados na notação de expressão regular, como {e ^.	\ ^ procura o ^ caractere.
Expressão marcada (ou retrorreferência)	{}	Usa o texto que está dentro das chaves para identificar os locais onde o texto deve ser substituído.	{faz} n' identifica o texto que precede a substituição na seqüência de caracteres de substituição \1 not alterar todas as ocorrências de não para não não.
Identificador de C/C++	: i	Forma abreviada para a expressão ([a-zA-Z_$][a-zA-Z0-9_$]*).	Corresponde a qualquer identificador de C/C++ possível.
A seqüência de caracteres entre aspas	: q	Forma abreviada para a expressão (("[^"] * ") \| (^'] *')), que corresponde a todos os caracteres são colocados entre aspas duplas ou simples, e também as aspas próprios.	: q corresponde a "cotação de teste" e 'testar cotação' mas não o T' de impossível.
Espaço ou tabulação	: b	Corresponde a caracteres de espaço ou tabulação.	Público: bInterface coincide com a frase "Interface pública" no texto.
Integer	: z	Forma abreviada para a expressão ([0-9] +), que corresponde a qualquer combinação de caracteres numéricos.	Corresponde a qualquer inteiro, como, por exemplo, "1", "234", "56" e assim por diante.

A lista de todas as expressões regulares que são válidos em operações de localizar e substituir é mais do que podem ser exibidos na Construtor de expressão. Embora as seguintes expressões regulares não aparecem no Construtor de expressões, você pode usá-los na Localizar ou Substituir campos.

Expression	Syntax	Description	Example
Mínimo, zero ou mais	@	Corresponde a zero ou mais ocorrências da expressão precedente e coincide com o menor número de caracteres possíveis.	e.@e corresponde a "ente" e "erprise" em "empresa", mas não a palavra inteira "empresa".
Mínimo, um ou mais	#	Corresponde a uma ou mais ocorrências da expressão precedente e coincide com o menor número de caracteres possíveis.	AC # corresponde a palavras que contêm a letra "a" e pelo menos uma instância de "c", como, por exemplo, "ace". r. # s corresponde a "acessar" a palavra "acesso".
Repetir n vezes	^n	Correspondências n ocorrências da expressão precedente.	[0-9] ^ 4 corresponde a qualquer seqüência de 4 dígitos.
Grouping	()	Permite agrupar um conjunto de expressões. Se desejar procurar em duas expressões diferentes em uma única pesquisa, você pode usar a expressão de agrupamento para combiná-las.	Se você quiser procurar -[a-z] [1-3 ou -[0-9] [a-z, você pode combiná-las: (-[a-z][1-3]) \| (-[0-9][a-z]).
nésimo texto marcado	\n	Em uma expressão de localização ou substituição, indica o texto que corresponde a nth tagged expressão, onde n é um número de 1 a 9. Em uma expressão de substituição \0 insere o texto completo de correspondente.	Se você procurar {[0-9]} e substitua por \ 1, todas as ocorrências de "a" seguido por um dígito são substituídos pelo dígito ela segue. Por exemplo, "a1" é substituído por "1" e da mesma forma "a2" é substituído por "2".
Campo justificado à direita	\(w,n)	Em uma expressão de substituição, justifica à direita do nth tagged expressão em um campo de pelo menos w wide de caracteres.	Se você procurar {[0-9]} e substitua por \(10,1), as ocorrências de "uman" são substituídos pelo número inteiro e justificado à direita por 10 espaços.
Campo justificado à esquerda	\(-w,n)	Em uma expressão de substituição, esquerda justifica o nth tagged expressão em um campo de pelo menos w wide de caracteres.	Se você procurar {[0-9]} e substitua por \(-10,1), as ocorrências de "uman" são substituídos pelo número inteiro e justificado à esquerda por 10 espaços.
Evitar correspondência	~(X)	Evita uma correspondência quando x aparece nesse ponto na expressão.	real~(ity) corresponde o "real" em "realeza" e "realmente", mas não o "real" em "realidade".
Caractere alfanumérico	: um	Corresponde à expressão ([a-zA-Z0-9]).	Qualquer tecla alfanuméricos de correspondências de caracteres, como, por exemplo, "a", "A", "w", "W", "5" e assim por diante.
Caractere alfabético	: c	Corresponde à expressão ([a-zA-Z]).	Correspondências em ordem alfabética de qualquer caractere, como, por exemplo, "a", "A", "w", "W" e assim por diante.
Dígito decimal	: d	Corresponde à expressão ([0-9]).	Corresponde a qualquer dígito, como, por exemplo, "4" e "6".
Dígito hexadecimal	: h	Corresponde à expressão ([0-9a-fA-F] +).	Corresponde a qualquer número hexadecimal, como, por exemplo, "1A", "ef" e "007".
Número racional	: n	Corresponde à expressão (([0-9] +. [0-9] ) \|([0-9] .[0-9] +) \|([0-9]+)).	Corresponde a qualquer número racional, como, por exemplo, "2007", "1.0" e ". 9".
A seqüência de caracteres alfabética	: w	Corresponde à expressão ([a-zA-Z] +).	Corresponde a qualquer seqüência de caracteres que contenha apenas caracteres alfabéticos.
Escape	\e	Unicode U + 001B.	Corresponde a "Escape" caractere de controle.
Bell	\g	Unicode U + 0007.	Corresponde a "Bela" caractere de controle.
BACKSPACE	\h	Unicode U + 0008.	Corresponde a "Backspace" caractere de controle.
Tab	\t	Unicode U + 0009.	Corresponde a um caractere de tabulação.
Caractere Unicode	\x#### ou \u####	Corresponde a um caractere fornecido pelo valor Unicode onde # # # # são dígitos hexadecimais. Você pode especificar um caractere que está fora do Basic Multilingual Plane (isto é, um substituto) com o ponto de código ISO 10646 ou com dois pontos de código Unicode, atribua os valores do par substituto.	\u0065 coincide com o caractere "e".

A tabela a seguir lista as abreviações de duas letras que são usadas para especificar as categorias gerais que estão listadas no banco de dados de propriedades de caractere Unicode. Você pode usar essas abreviações como parte de um conjunto de caracteres de expressão regular. Por exemplo, a expressão [:Nd:Nl:No] corresponde a qualquer tipo de dígito.

Para obter mais informações sobre o banco de dados de propriedades de caractere Unicode, consulte Propriedades de caractere Unicode padrão 5.0.

Expression	Syntax	Description
Letra maiúscula	: O Lu	Corresponde a qualquer uma letra maiúscula. For example: : Luhe corresponde a "A" mas não "o".
Letra minúscula	: Ll	Corresponde a qualquer uma letra minúscula. For example: : Llhe corresponde a "a" mas não "O".
Carta de ocorrência do título	: Lt	Corresponde a caracteres que combinam uma letra maiúscula com uma letra minúscula, por exemplo, Nj e dz.
Letra Modificadora	: O Lm	Correspondências de letras ou pontuação, como vírgulas, entre acentos e linha dupla, que são usadas para indicar modificações à letra anterior.
Outra letra.	: Lo	Corresponde a outras letras, como, por exemplo, ahsa de letra gothic.
Dígito decimal	: O Nd	Corresponde a dígitos decimais, como, por exemplo, 0-9 e seus equivalentes de largura total.
Dígito de letra	: Nl	Correspondências letra dígitos, como, por exemplo, numerais romanos e ideográficos número zero.
Outro dígito	: Nenhuma	Corresponde a outros dígitos, como o antigo número um em itálico.
Pontuação de abertura	: O Ps	Abra o correspondências abrindo a pontuação, como colchetes e chaves.
Pontuação de fechamento	: O pe	Correspondências de pontuação, como colchetes e chaves de fechamento de fechamento.
Pontuação de aspas iniciais	: O pi	Corresponde a aspas iniciais.
Pontuação de aspas finais	: Pf	Corresponde a aspas simples e aspas finais.
Pontuação de traço	: Pd	Corresponde à marca de traço.
Pontuação de conector	: O pc	Corresponde à marca de sublinhado.
Outros sinais de pontuação	: O pedido de compra	Correspondências (,),?, ",!, @, #, %), &, *, \, (:), (;) ', e /.
Separador de espaço	: Zs	Corresponde a vazios.
Separador de linha	: Zl	Correspondências Unicode U + 2028 de caracteres.
Separador de parágrafo	: Zp	Correspondências Unicode U + 2029 de caracteres.
Marca sem espaçamento	: Mn	Corresponde a marcas de sem espaçamento.
Marca combinável	: O Mc	A combinação de marcas de correspondências.
Marca de delimitação	: Me	Delimitador de marcas de correspondências.
Símbolo matemático	: Sm	Corresponde a + =, ~, \|, <, e >.
Símbolo de moeda	: O Sc	Corresponde a $ e outros símbolos de moeda.
Símbolo de modificador	: Sk	Símbolos de modificador de correspondências, como, por exemplo, acento circunflexo e acento grave mácron.
Outro símbolo	: Tão	Corresponde a outros símbolos, como, por exemplo, o símbolo de copyright, indicador de parágrafo e o símbolo de grau.
Outro controle	: O cc	Corresponde a caracteres de controle Unicode como guia e a nova linha.
Outro formato	: Cf	Caractere formatação de controle, como, por exemplo, os caracteres de controle bidirecional.
Substituto	: O Cs	Corresponde a metade de um par substituto.
Outros de uso particular	: O Co	Corresponde a qualquer caractere da área de uso particular.
Outros não atribuídos	: O Cn	Corresponde a caracteres que não são mapeadas para um caractere Unicode.

Além de para propriedades de caractere Unicode padrão, as propriedades a seguir podem ser especificadas como parte de um conjunto de caracteres.

Expression	Syntax	Description
Alpha	: Al	Corresponde a qualquer caractere. Por exemplo, : Alhe corresponde a palavras como "Ele", "then" e "atingido".
Numérico	: Nu	Corresponde a qualquer número ou dígito.
Pontuação	: Pu	Corresponde a qualquer marca de pontuação, como?, @, ' e assim por diante.
Espaço em branco	: Qu	Corresponde a todos os tipos de espaço em branco, como, por exemplo, os espaços de ideogramas e publicação.
BiDi	: Bi	Corresponde a caracteres de scripts da direita para esquerda, como, por exemplo, árabe e hebraico.
Hangul	: Ha	Corresponde a Hangul coreano e combinando Jamos.
Hiragana	: Hi	Corresponde a caracteres hiragana.
Katakana	: Ka	Corresponde a caracteres katakana.
Ideogramas/Han/Kanji	: A id	Corresponde a caracteres ideográficos, como Han e kanji.