Options des expressions régulières

Par défaut, la comparaison d’une chaîne d’entrée avec des caractères littéraux dans un modèle d’expression régulière respecte la casse, l’espace blanc dans un modèle d’expression régulière est interprété comme un espace blanc littéral et les groupes de capture dans une expression régulière sont nommés de manière implicite aussi bien qu’explicite. Vous pouvez modifier ces aspects, ainsi que d'autres, du comportement par défaut des expressions régulières en spécifiant des options d'expression régulière. Certaines de ces options, qui sont listées dans le tableau suivant, peuvent être incluses inline dans le cadre du modèle d’expression régulière ou fournies à un constructeur de classe System.Text.RegularExpressions.Regex ou à une méthode de mise en correspondance de modèle statique en tant que valeur d’énumération System.Text.RegularExpressions.RegexOptions.

Membre `RegexOptions`	Caractère inline	Effet	Informations complémentaires
None	Non disponible	Utilise le comportement par défaut.	Options par défaut
IgnoreCase	`i`	Utilise la correspondance qui ne respecte pas la casse.	Correspondance qui ne respecte pas la casse
Multiline	`m`	Utilise le mode multiligne, où `^` et `$` indiquent le début et la fin de chaque ligne (plutôt que le début et la fin de la chaîne d’entrée).	Mode multiligne
Singleline	`s`	Utilise le mode à ligne simple, où le point (.) correspond à chaque caractère (y compris `\n`).	Mode à ligne simple
ExplicitCapture	`n`	Ne captez pas les groupes sans nom. Les seules captures valides sont les groupes explicitement nommés ou numérotés de la forme `(?<`nom`>`sous-expression`)`.	Captures explicites uniquement
Compiled	Non disponible	Compile l'expression régulière en un assembly.	Expressions régulières compilées
IgnorePatternWhitespace	`x`	Exclure du modèle l'espace blanc sans séquence d'échappement et autoriser les commentaires après un signe dièse (`#`).	Ignorer l’espace blanc
RightToLeft	Non disponible	Modifie le sens de la recherche. La recherche s'effectue de droite à gauche au lieu de gauche à droite.	Mode de recherche de droite à gauche
ECMAScript	Non disponible	Active le comportement compatible ECMAScript pour l’expression.	Comportement de correspondance ECMAScript
CultureInvariant	Non disponible	Ignorer les différences culturelles propres à la langue.	Comparaison utilisant la culture invariante
NonBacktracking	Non disponible	Met en correspondance par une approche qui évite le retour sur trace et qui garantit un traitement en temps linéaire dans la longueur de l’entrée. (Disponible dans .NET 7 et versions ultérieures.)	Mode de non-retour arrière
AnyNewLine	Non disponible	Reconnaissez toutes les séquences de nouvelles lignes communes avec `^`, `$`, `\Z` et `.` au lieu de uniquement `\n`. (Disponible dans .NET 11 et versions ultérieures.)	Mode AnyNewLine

Spécifier les options

Vous pouvez spécifier les options des expressions régulières de trois façons :

Dans le paramètre options d’un constructeur de classe System.Text.RegularExpressions.Regex ou d’une méthode statique (Shared dans Visual Basic), par exemple Regex(String, RegexOptions) ou Regex.Match(String, String, RegexOptions). Le paramètre options est une combinaison OR au niveau du bit de valeurs énumérées System.Text.RegularExpressions.RegexOptions.

Quand des options sont fournies à une instance de Regex à l'aide du paramètre options d'un constructeur de classe, les options sont affectées à la propriété System.Text.RegularExpressions.RegexOptions. Cependant, la propriété System.Text.RegularExpressions.RegexOptions ne reflète pas les options inline dans le modèle d'expression régulière lui-même.

L'exemple suivant illustre cette situation. Il utilise le paramètre options de la méthode Regex.Match(String, String, RegexOptions) pour autoriser la correspondance qui ne respecte pas la casse et pour ignorer l’espace blanc du modèle pendant l’identification des mots commençant par la lettre « d ».
```
string pattern = @"d \w+ \s";
string input = "Dogs are decidedly good pets.";
RegexOptions options = RegexOptions.IgnoreCase | RegexOptions.IgnorePatternWhitespace;

foreach (Match match in Regex.Matches(input, pattern, options))
    Console.WriteLine($"'{match.Value}// found at index {match.Index}.");
// The example displays the following output:
//    'Dogs // found at index 0.
//    'decidedly // found at index 9.
```
```
Dim pattern As String = "d \w+ \s"
Dim input As String = "Dogs are decidedly good pets."
Dim options As RegexOptions = RegexOptions.IgnoreCase Or RegexOptions.IgnorePatternWhitespace

For Each match As Match In Regex.Matches(input, pattern, options)
    Console.WriteLine("'{0}' found at index {1}.", match.Value, match.Index)
Next
' The example displays the following output:
'    'Dogs ' found at index 0.
'    'decidedly ' found at index 9.      
```
En appliquant des options inline dans un modèle d'expression régulière avec la syntaxe (?imnsx-imnsx). L’option s’applique au modèle depuis le point où elle est définie jusqu’à la fin du modèle ou jusqu’au point auquel sa définition est annulée par une autre option inline. Notez que la propriété System.Text.RegularExpressions.RegexOptions d'une instance de Regex ne reflète pas ces options inline. Pour plus d’informations, consultez la rubrique Constructions diverses.

L'exemple suivant illustre cette situation. Il utilise des options inline pour autoriser la correspondance qui ne respecte pas la casse et pour ignorer l’espace blanc du modèle pendant l’identification des mots commençant par la lettre « d ».
```
string pattern = @"(?ix) d \w+ \s";
string input = "Dogs are decidedly good pets.";

foreach (Match match in Regex.Matches(input, pattern))
    Console.WriteLine($"'{match.Value}// found at index {match.Index}.");
// The example displays the following output:
//    'Dogs // found at index 0.
//    'decidedly // found at index 9.
```
```
Dim pattern As String = "\b(?ix) d \w+ \s"
Dim input As String = "Dogs are decidedly good pets."

For Each match As Match In Regex.Matches(input, pattern)
    Console.WriteLine("'{0}' found at index {1}.", match.Value, match.Index)
Next
' The example displays the following output:
'    'Dogs ' found at index 0.
'    'decidedly ' found at index 9.      
```
En appliquant des options inline dans une construction de regroupement particulière au sein d’un modèle d’expression régulière avec la syntaxe (?imnsx-imnsx:sous-expression). L'absence de signe avant un jeu d'options active ce dernier, tandis qu'un signe moins le désactive. (? est une partie fixe de la syntaxe de la construction du langage qui est obligatoire, que les options soient activées ou désactivées.) L’option ne s’applique qu’à ce groupe. Pour plus d’informations, consultez Constructions de regroupement.

L'exemple suivant illustre cette situation. Il utilise des options inline dans une construction de regroupement pour autoriser la correspondance qui ne respecte pas la casse et pour ignorer l’espace blanc du modèle pendant l’identification des mots commençant par la lettre « d ».
```
string pattern = @"\b(?ix: d \w+)\s";
string input = "Dogs are decidedly good pets.";

foreach (Match match in Regex.Matches(input, pattern))
    Console.WriteLine($"'{match.Value}// found at index {match.Index}.");
// The example displays the following output:
//    'Dogs // found at index 0.
//    'decidedly // found at index 9.
```
```
Dim pattern As String = "\b(?ix: d \w+)\s"
Dim input As String = "Dogs are decidedly good pets."

For Each match As Match In Regex.Matches(input, pattern)
    Console.WriteLine("'{0}' found at index {1}.", match.Value, match.Index)
Next
' The example displays the following output:
'    'Dogs ' found at index 0.
'    'decidedly ' found at index 9.      
```

Si des options sont spécifiées inline, un signe moins (-) avant une option ou un jeu d'options désactive ces options. Par exemple, la construction inline (?ix-ms) active les options RegexOptions.IgnoreCase et RegexOptions.IgnorePatternWhitespace et désactive les options RegexOptions.Multiline et RegexOptions.Singleline. Toutes les options d'expression régulière sont désactivées par défaut.

Note

Si les options d'expression régulière spécifiées dans le paramètre options d'un appel de constructeur ou de méthode entrent en conflit avec les options spécifiées inline dans un modèle d'expression régulière, ces dernières sont utilisées.

Les cinq options d'expression régulière suivantes peuvent être définies avec le paramètre options et inline :

Les sept options d’expression régulière suivantes peuvent être définies à l’aide du options paramètre, mais ne peuvent pas être définies inline :

Déterminer les options

Vous pouvez déterminer les options initialement fournies à un objet Regex au moment de son instanciation en récupérant la valeur de la propriété Regex.Options en lecture seule.

Pour tester la présence d'une option autre que RegexOptions.None, effectuez une opération AND avec la valeur de la propriété Regex.Options et la valeur RegexOptions qui vous intéresse. Ensuite, déterminez si le résultat est égal à cette valeur RegexOptions. L'exemple suivant détermine si l'option RegexOptions.IgnoreCase a été définie.

if ((rgx.Options & RegexOptions.IgnoreCase) == RegexOptions.IgnoreCase)
    Console.WriteLine("Case-insensitive pattern comparison.");
else
    Console.WriteLine("Case-sensitive pattern comparison.");

If (rgx.Options And RegexOptions.IgnoreCase) = RegexOptions.IgnoreCase Then
    Console.WriteLine("Case-insensitive pattern comparison.")
Else
    Console.WriteLine("Case-sensitive pattern comparison.")
End If

Pour tester la présence de RegexOptions.None, déterminez si la valeur de la propriété Regex.Options est égale à RegexOptions.None, comme le montre l'exemple suivant.

if (rgx.Options == RegexOptions.None)
    Console.WriteLine("No options have been set.");

If rgx.Options = RegexOptions.None Then
    Console.WriteLine("No options have been set.")
End If

Les sections suivantes répertorient les options prises en charge par l’expression régulière dans .NET.

Options par défaut

L'option RegexOptions.None indique qu'aucune option n'a été spécifiée et que le moteur d'expression régulière utilise son comportement par défaut. Notamment :

Le modèle est interprété en tant qu'expression régulière canonique, plutôt qu'en tant qu'expression régulière ECMAScript.
Le modèle d'expression régulière est appliqué à la chaîne d'entrée de la gauche vers la droite.
Les comparaisons respectent la casse.
Les éléments de langage ^ et $ indiquent le début et la fin de la chaîne d’entrée. La fin de la chaîne d’entrée peut être un caractère \n de saut de ligne de fin.
L'élément de langage . correspond à chaque caractère à l'exception de \n.
Tout espace blanc dans un modèle d'expression régulière est interprété en tant qu'espace littéral.
Les conventions de la culture actuelle sont utilisées pendant la comparaison du modèle à la chaîne d'entrée.
Les groupes de capture dans le modèle d’expression régulière sont implicites aussi bien qu’explicites.

Note

L'option RegexOptions.None n'a pas d'équivalent inline. Quand les options d'expression régulière sont appliquées inline, le comportement par défaut est restauré option par option, via la désactivation de chaque option concernée. Par exemple, (?i) active la comparaison sans respect de la casse, tandis que (?-i) restaure la comparaison avec respect de la casse par défaut.

Comme l'option RegexOptions.None représente le comportement par défaut du moteur d'expression régulière, elle est rarement spécifiée de manière explicite dans un appel de méthode. Un constructeur ou une méthode de mise en correspondance de modèle statique sans paramètre options est appelé à la place.

Correspondance qui ne respecte pas la casse

L'option IgnoreCase, ou l'option inline i, fournit une correspondance qui ne respecte pas la casse. Par défaut, les conventions de gestion de la casse de la culture actuelle sont utilisées.

L'exemple suivant définit un modèle d'expression régulière, \bthe\w*\b, qui met en correspondance tous les mots commençant par « the ». Comme le premier appel de la méthode Match utilise la comparaison avec respect de la casse par défaut, la chaîne « The » n'apparaît pas parmi les résultats de ce premier appel. Par contre, elle est trouvée quand la méthode Match est appelée avec le paramètre options défini sur IgnoreCase.

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string pattern = @"\bthe\w*\b";
      string input = "The man then told them about that event.";
      foreach (Match match in Regex.Matches(input, pattern))
         Console.WriteLine($"Found {match.Value} at index {match.Index}.");

      Console.WriteLine();
      foreach (Match match in Regex.Matches(input, pattern,
                                            RegexOptions.IgnoreCase))
         Console.WriteLine($"Found {match.Value} at index {match.Index}.");
   }
}
// The example displays the following output:
//       Found then at index 8.
//       Found them at index 18.
//
//       Found The at index 0.
//       Found then at index 8.
//       Found them at index 18.

Imports System.Text.RegularExpressions

Module Example
    Public Sub Main()
        Dim pattern As String = "\bthe\w*\b"
        Dim input As String = "The man then told them about that event."
        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("Found {0} at index {1}.", match.Value, match.Index)
        Next
        Console.WriteLine()
        For Each match As Match In Regex.Matches(input, pattern, _
                                                 RegexOptions.IgnoreCase)
            Console.WriteLine("Found {0} at index {1}.", match.Value, match.Index)
        Next
    End Sub
End Module
' The example displays the following output:
'       Found then at index 8.
'       Found them at index 18.
'       
'       Found The at index 0.
'       Found then at index 8.
'       Found them at index 18.

L'exemple suivant modifie le modèle d'expression régulière proposé dans l'exemple précédent de manière à utiliser des options inline au lieu du paramètre options pour effectuer une comparaison sans respect de la casse. Le premier modèle définit l’option de non-respect de la casse dans une construction de regroupement qui s’applique uniquement à la lettre « t » de la chaîne « the ». Comme la construction de l’option intervient au début du modèle, le second modèle applique l’option de non-respect de la casse à l’expression régulière entière.

using System;
using System.Text.RegularExpressions;

public class CaseExample
{
    public static void Main()
    {
        string pattern = @"\b(?i:t)he\w*\b";
        string input = "The man then told them about that event.";
        foreach (Match match in Regex.Matches(input, pattern))
            Console.WriteLine($"Found {match.Value} at index {match.Index}.");

        Console.WriteLine();
        pattern = @"(?i)\bthe\w*\b";
        foreach (Match match in Regex.Matches(input, pattern,
                                              RegexOptions.IgnoreCase))
            Console.WriteLine($"Found {match.Value} at index {match.Index}.");
    }
}
// The example displays the following output:
//       Found The at index 0.
//       Found then at index 8.
//       Found them at index 18.
//
//       Found The at index 0.
//       Found then at index 8.
//       Found them at index 18.

Imports System.Text.RegularExpressions

Module CaseExample
    Public Sub Main()
        Dim pattern As String = "\b(?i:t)he\w*\b"
        Dim input As String = "The man then told them about that event."
        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("Found {0} at index {1}.", match.Value, match.Index)
        Next
        Console.WriteLine()
        pattern = "(?i)\bthe\w*\b"
        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("Found {0} at index {1}.", match.Value, match.Index)
        Next
    End Sub
End Module

' The example displays the following output:
'       Found The at index 0.
'       Found then at index 8.
'       Found them at index 18.
'       
'       Found The at index 0.
'       Found then at index 8.
'       Found them at index 18.

Mode multiligne

L'option RegexOptions.Multiline, ou l'option inline m, permet au moteur d'expression régulière de gérer une chaîne d'entrée constituée de plusieurs lignes. Elle modifie l’interprétation des éléments de langage ^ et $ de manière à ce qu’ils indiquent le début et la fin de ligne, et non le début et la fin de la chaîne d’entrée.

Par défaut, $ est satisfait uniquement à la fin de la chaîne d’entrée. Si vous spécifiez l’option RegexOptions.Multiline, elle est satisfaite par le caractère de saut de ligne (\n) ou la fin de la chaîne d’entrée.

Dans aucun des cas, $ ne reconnaît la combinaison de caractères retour chariot/saut de ligne (\r\n). $ ignore toujours tout retour chariot (\r). Pour terminer votre correspondance avec \r\n ou \n, utilisez la sous-expression \r?$ au lieu de $. Notez que \r fait alors partie de la correspondance.

Conseil

À compter de .NET 11, vous pouvez utiliser RegexOptions.AnyNewLine pour rendre ^, $, \Z et . reconnaître toutes les séquences de nouvelles lignes courantes au lieu de uniquement \n, en supprimant le besoin de solutions de contournement \r?. AnyNewLine traite également \r\n comme une séquence de saut de ligne atomique, de sorte que \r n’est jamais incluse dans la correspondance. Pour plus d’informations, consultez la section mode AnyNewLine .

L’exemple suivant extrait les prénoms et scores des lanceurs, puis les ajoute à une collection SortedList<TKey,TValue> qui les trie dans l’ordre décroissant. La méthode Matches est appelée deux fois. Dans le premier appel de la méthode, l'expression régulière est ^(\w+)\s(\d+)$ et aucune option n'est définie. Comme le montre la sortie, aucune correspondance n’est trouvée, car le moteur d’expression régulière ne peut pas mettre en correspondance le modèle d’entrée avec le début et la fin de la chaîne d’entrée. Dans le second appel de la méthode, l'expression régulière devient ^(\w+)\s(\d+)\r?$ et les options sont définies sur RegexOptions.Multiline. Comme le montre le résultat, les noms et les scores sont correctement mis en correspondance, et les scores apparaissent dans l'ordre décroissant.

using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;

public class Multiline1Example
{
    public static void Main()
    {
        SortedList<int, string> scores = new SortedList<int, string>(new DescendingComparer1<int>());

        string input = "Joe 164\n" +
                       "Sam 208\n" +
                       "Allison 211\n" +
                       "Gwen 171\n";
        string pattern = @"^(\w+)\s(\d+)$";
        bool matched = false;

        Console.WriteLine("Without Multiline option:");
        foreach (Match match in Regex.Matches(input, pattern))
        {
            scores.Add(Int32.Parse(match.Groups[2].Value), (string)match.Groups[1].Value);
            matched = true;
        }
        if (!matched)
            Console.WriteLine("   No matches.");
        Console.WriteLine();

        // Redefine pattern to handle multiple lines.
        pattern = @"^(\w+)\s(\d+)\r*$";
        Console.WriteLine("With multiline option:");
        foreach (Match match in Regex.Matches(input, pattern, RegexOptions.Multiline))
            scores.Add(Int32.Parse(match.Groups[2].Value), (string)match.Groups[1].Value);

        // List scores in descending order.
        foreach (KeyValuePair<int, string> score in scores)
            Console.WriteLine($"{score.Value}: {score.Key}");
    }
}

public class DescendingComparer1<T> : IComparer<T>
{
    public int Compare(T x, T y)
    {
        return Comparer<T>.Default.Compare(x, y) * -1;
    }
}
// The example displays the following output:
//   Without Multiline option:
//      No matches.
//
//   With multiline option:
//   Allison: 211
//   Sam: 208
//   Gwen: 171
//   Joe: 164

Imports System.Collections.Generic
Imports System.Text.RegularExpressions

Module Multiline1Example
    Public Sub Main()
        Dim scores As New SortedList(Of Integer, String)(New DescendingComparer1(Of Integer)())

        Dim input As String = "Joe 164" + vbCrLf +
                              "Sam 208" + vbCrLf +
                              "Allison 211" + vbCrLf +
                              "Gwen 171" + vbCrLf
        Dim pattern As String = "^(\w+)\s(\d+)$"
        Dim matched As Boolean = False

        Console.WriteLine("Without Multiline option:")
        For Each match As Match In Regex.Matches(input, pattern)
            scores.Add(CInt(match.Groups(2).Value), match.Groups(1).Value)
            matched = True
        Next
        If Not matched Then Console.WriteLine("   No matches.")
        Console.WriteLine()

        ' Redefine pattern to handle multiple lines.
        pattern = "^(\w+)\s(\d+)\r*$"
        Console.WriteLine("With multiline option:")
        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.Multiline)
            scores.Add(CInt(match.Groups(2).Value), match.Groups(1).Value)
        Next
        ' List scores in descending order. 
        For Each score As KeyValuePair(Of Integer, String) In scores
            Console.WriteLine("{0}: {1}", score.Value, score.Key)
        Next
    End Sub
End Module

Public Class DescendingComparer1(Of T) : Implements IComparer(Of T)
    Public Function Compare(x As T, y As T) As Integer _
           Implements IComparer(Of T).Compare
        Return Comparer(Of T).Default.Compare(x, y) * -1
    End Function
End Class
' The example displays the following output:
'    Without Multiline option:
'       No matches.
'    
'    With multiline option:
'    Allison: 211
'    Sam: 208
'    Gwen: 171
'    Joe: 164

Le modèle d'expression régulière ^(\w+)\s(\d+)\r*$ est défini comme indiqué dans le tableau suivant.

Motif	Description
`^`	Commencer au début de la ligne.
`(\w+)`	Mettre en correspondance un ou plusieurs caractères alphabétiques. Il s'agit du premier groupe de capture.
`\s`	Mettre en correspondance un espace blanc.
`(\d+)`	Mettre en correspondance un ou plusieurs chiffres décimaux. Il s'agit du deuxième groupe de capture.
`\r?`	Mettre en correspondance zéro ou un caractère de retour chariot.
`$`	Terminer à la fin de la ligne.

L'exemple suivant est équivalent à l'exemple précédent, à la différence qu'il utilise l'option inline (?m) pour définir l'option multiligne.

using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;

public class Multiline2Example
{
    public static void Main()
    {
        SortedList<int, string> scores = new SortedList<int, string>(new DescendingComparer<int>());

        string input = "Joe 164\n" +
                       "Sam 208\n" +
                       "Allison 211\n" +
                       "Gwen 171\n";
        string pattern = @"(?m)^(\w+)\s(\d+)\r*$";

        foreach (Match match in Regex.Matches(input, pattern, RegexOptions.Multiline))
            scores.Add(Convert.ToInt32(match.Groups[2].Value), match.Groups[1].Value);

        // List scores in descending order.
        foreach (KeyValuePair<int, string> score in scores)
            Console.WriteLine($"{score.Value}: {score.Key}");
    }
}

public class DescendingComparer<T> : IComparer<T>
{
    public int Compare(T x, T y)
    {
        return Comparer<T>.Default.Compare(x, y) * -1;
    }
}
// The example displays the following output:
//    Allison: 211
//    Sam: 208
//    Gwen: 171
//    Joe: 164

Imports System.Collections.Generic
Imports System.Text.RegularExpressions

Module Multiline2Example
    Public Sub Main()
        Dim scores As New SortedList(Of Integer, String)(New DescendingComparer(Of Integer)())

        Dim input As String = "Joe 164" + vbCrLf +
                              "Sam 208" + vbCrLf +
                              "Allison 211" + vbCrLf +
                              "Gwen 171" + vbCrLf
        Dim pattern As String = "(?m)^(\w+)\s(\d+)\r*$"

        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.Multiline)
            scores.Add(CInt(match.Groups(2).Value), match.Groups(1).Value)
        Next
        ' List scores in descending order. 
        For Each score As KeyValuePair(Of Integer, String) In scores
            Console.WriteLine("{0}: {1}", score.Value, score.Key)
        Next
    End Sub
End Module

Public Class DescendingComparer(Of T) : Implements IComparer(Of T)
    Public Function Compare(x As T, y As T) As Integer _
           Implements IComparer(Of T).Compare
        Return Comparer(Of T).Default.Compare(x, y) * -1
    End Function
End Class
' The example displays the following output:
'    Allison: 211
'    Sam: 208
'    Gwen: 171
'    Joe: 164

Mode à ligne simple

L'option RegexOptions.Singleline, ou l'option inline s, indique au moteur d'expression régulière de traiter la chaîne d'entrée comme si elle était composée d'une seule ligne. Pour ce faire, elle change le comportement de l’élément de langage point (.) de manière à mettre en correspondance chaque caractère, y compris le caractère de saut de ligne \n.

L'exemple suivant montre comment l'utilisation de l'option . modifie le comportement de l'élément de langage RegexOptions.Singleline. L'expression régulière ^.+ commence au début de la chaîne et correspond à tous les caractères. Par défaut, la correspondance se termine à la fin de la première ligne ; le modèle d’expression régulière correspond au caractère de retour chariot, \r, mais il ne correspond pas à \n. Étant donné que l'option RegexOptions.Singleline interprète la chaîne d'entrée entière comme une ligne unique, il correspond à chaque caractère de la chaîne d'entrée, notamment \n.

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string pattern = "^.+";
      string input = "This is one line and" + Environment.NewLine + "this is the second.";
      foreach (Match match in Regex.Matches(input, pattern))
         Console.WriteLine(Regex.Escape(match.Value));

      Console.WriteLine();
      foreach (Match match in Regex.Matches(input, pattern, RegexOptions.Singleline))
         Console.WriteLine(Regex.Escape(match.Value));
   }
}
// The example displays the following output:
//       This\ is\ one\ line\ and\r
//
//       This\ is\ one\ line\ and\r\nthis\ is\ the\ second\.

Imports System.Text.RegularExpressions

Module Example
    Public Sub Main()
        Dim pattern As String = "^.+"
        Dim input As String = "This is one line and" + vbCrLf + "this is the second."
        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine(Regex.Escape(match.Value))
        Next
        Console.WriteLine()
        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.SingleLine)
            Console.WriteLine(Regex.Escape(match.Value))
        Next
    End Sub
End Module
' The example displays the following output:
'       This\ is\ one\ line\ and\r
'       
'       This\ is\ one\ line\ and\r\nthis\ is\ the\ second\.

L'exemple suivant est équivalent à l'exemple précédent, à la différence qu'il utilise l'option inline (?s) pour activer le mode à ligne simple.

using System;
using System.Text.RegularExpressions;

public class SingleLineExample
{
    public static void Main()
    {
        string pattern = "(?s)^.+";
        string input = "This is one line and" + Environment.NewLine + "this is the second.";

        foreach (Match match in Regex.Matches(input, pattern))
            Console.WriteLine(Regex.Escape(match.Value));
    }
}
// The example displays the following output:
//       This\ is\ one\ line\ and\r\nthis\ is\ the\ second\.

Imports System.Text.RegularExpressions

Module SingleLineExample
    Public Sub Main()
        Dim pattern As String = "(?s)^.+"
        Dim input As String = "This is one line and" + vbCrLf + "this is the second."

        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine(Regex.Escape(match.Value))
        Next
    End Sub
End Module
' The example displays the following output:
'       This\ is\ one\ line\ and\r\nthis\ is\ the\ second\.

Captures explicites uniquement

Par défaut, les groupes de capture sont définis à l’aide de parenthèses dans le modèle d’expression régulière. Les groupes nommés se voient affecter un nom ou un nombre par l’option de langage (?<nom>sous-expression), tandis que les groupes sans nom sont accessibles en fonction de leur index. Dans l'objet GroupCollection, les groupes sans nom précèdent les groupes nommés.

Les constructions de regroupement sont souvent utilisées pour simplement appliquer des quantificateurs à plusieurs éléments de langage, et les sous-chaînes capturées ne présentent aucun intérêt. Par exemple, si l'expression régulière suivante :

\b$?((\w+),?\s?)+[\.!?]$?

est uniquement destinée à extraire d'un document les phrases qui se terminent par un point, un point d'exclamation ou un point d'interrogation, seule la phrase résultante (représentée par l'objet Match) présente un intérêt. Les différents mots de la collection n’en présentent pas.

Les groupes de capture qui ne sont pas utilisés par la suite peuvent être coûteux, car le moteur d'expressions régulières doit remplir les deux objets de collection GroupCollection et CaptureCollection. En guise de solution, vous pouvez utiliser l'option RegexOptions.ExplicitCapture ou l'option inline n pour indiquer que les seules captures valides sont les groupes explicitement nommés ou numérotés désignés par la construction (?<nom>sous-expression).

L’exemple suivant affiche des informations sur les correspondances retournées par le modèle d’expression régulière \b$?((\w+),?\s?)+[\.!?]$? quand la méthode Match est appelée avec et sans l’option RegexOptions.ExplicitCapture. Comme le montre la sortie du premier appel de la méthode, le moteur d’expression régulière remplit entièrement les objets de collection GroupCollection et CaptureCollection avec des informations relatives aux sous-chaînes capturées. Comme la seconde méthode est appelée avec options défini sur RegexOptions.ExplicitCapture, elle ne capture pas d'information sur les groupes.

using System;
using System.Text.RegularExpressions;

public class Explicit1Example
{
    public static void Main()
    {
        string input = "This is the first sentence. Is it the beginning " +
                       "of a literary masterpiece? I think not. Instead, " +
                       "it is a nonsensical paragraph.";
        string pattern = @"\b\(?((?>\w+),?\s?)+[\.!?]\)?";
        Console.WriteLine("With implicit captures:");
        foreach (Match match in Regex.Matches(input, pattern))
        {
            Console.WriteLine($"The match: {match.Value}");
            int groupCtr = 0;
            foreach (Group group in match.Groups)
            {
                Console.WriteLine($"   Group {groupCtr}: {group.Value}");
                groupCtr++;
                int captureCtr = 0;
                foreach (Capture capture in group.Captures)
                {
                    Console.WriteLine($"      Capture {captureCtr}: {capture.Value}");
                    captureCtr++;
                }
            }
        }
        Console.WriteLine();
        Console.WriteLine("With explicit captures only:");
        foreach (Match match in Regex.Matches(input, pattern, RegexOptions.ExplicitCapture))
        {
            Console.WriteLine($"The match: {match.Value}");
            int groupCtr = 0;
            foreach (Group group in match.Groups)
            {
                Console.WriteLine($"   Group {groupCtr}: {group.Value}");
                groupCtr++;
                int captureCtr = 0;
                foreach (Capture capture in group.Captures)
                {
                    Console.WriteLine($"      Capture {captureCtr}: {capture.Value}");
                    captureCtr++;
                }
            }
        }
    }
}
// The example displays the following output:
//    With implicit captures:
//    The match: This is the first sentence.
//       Group 0: This is the first sentence.
//          Capture 0: This is the first sentence.
//       Group 1: sentence
//          Capture 0: This
//          Capture 1: is
//          Capture 2: the
//          Capture 3: first
//          Capture 4: sentence
//       Group 2: sentence
//          Capture 0: This
//          Capture 1: is
//          Capture 2: the
//          Capture 3: first
//          Capture 4: sentence
//    The match: Is it the beginning of a literary masterpiece?
//       Group 0: Is it the beginning of a literary masterpiece?
//          Capture 0: Is it the beginning of a literary masterpiece?
//       Group 1: masterpiece
//          Capture 0: Is
//          Capture 1: it
//          Capture 2: the
//          Capture 3: beginning
//          Capture 4: of
//          Capture 5: a
//          Capture 6: literary
//          Capture 7: masterpiece
//       Group 2: masterpiece
//          Capture 0: Is
//          Capture 1: it
//          Capture 2: the
//          Capture 3: beginning
//          Capture 4: of
//          Capture 5: a
//          Capture 6: literary
//          Capture 7: masterpiece
//    The match: I think not.
//       Group 0: I think not.
//          Capture 0: I think not.
//       Group 1: not
//          Capture 0: I
//          Capture 1: think
//          Capture 2: not
//       Group 2: not
//          Capture 0: I
//          Capture 1: think
//          Capture 2: not
//    The match: Instead, it is a nonsensical paragraph.
//       Group 0: Instead, it is a nonsensical paragraph.
//          Capture 0: Instead, it is a nonsensical paragraph.
//       Group 1: paragraph
//          Capture 0: Instead,
//          Capture 1: it
//          Capture 2: is
//          Capture 3: a
//          Capture 4: nonsensical
//          Capture 5: paragraph
//       Group 2: paragraph
//          Capture 0: Instead
//          Capture 1: it
//          Capture 2: is
//          Capture 3: a
//          Capture 4: nonsensical
//          Capture 5: paragraph
//
//    With explicit captures only:
//    The match: This is the first sentence.
//       Group 0: This is the first sentence.
//          Capture 0: This is the first sentence.
//    The match: Is it the beginning of a literary masterpiece?
//       Group 0: Is it the beginning of a literary masterpiece?
//          Capture 0: Is it the beginning of a literary masterpiece?
//    The match: I think not.
//       Group 0: I think not.
//          Capture 0: I think not.
//    The match: Instead, it is a nonsensical paragraph.
//       Group 0: Instead, it is a nonsensical paragraph.
//          Capture 0: Instead, it is a nonsensical paragraph.

Imports System.Text.RegularExpressions

Module Explicit1Example
    Public Sub Main()
        Dim input As String = "This is the first sentence. Is it the beginning " +
                              "of a literary masterpiece? I think not. Instead, " +
                              "it is a nonsensical paragraph."
        Dim pattern As String = "\b\(?((?>\w+),?\s?)+[\.!?]\)?"
        Console.WriteLine("With implicit captures:")
        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("The match: {0}", match.Value)
            Dim groupCtr As Integer = 0
            For Each group As Group In match.Groups
                Console.WriteLine("   Group {0}: {1}", groupCtr, group.Value)
                groupCtr += 1
                Dim captureCtr As Integer = 0
                For Each capture As Capture In group.Captures
                    Console.WriteLine("      Capture {0}: {1}", captureCtr, capture.Value)
                    captureCtr += 1
                Next
            Next
        Next
        Console.WriteLine()
        Console.WriteLine("With explicit captures only:")
        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.ExplicitCapture)
            Console.WriteLine("The match: {0}", match.Value)
            Dim groupCtr As Integer = 0
            For Each group As Group In match.Groups
                Console.WriteLine("   Group {0}: {1}", groupCtr, group.Value)
                groupCtr += 1
                Dim captureCtr As Integer = 0
                For Each capture As Capture In group.Captures
                    Console.WriteLine("      Capture {0}: {1}", captureCtr, capture.Value)
                    captureCtr += 1
                Next
            Next
        Next
    End Sub
End Module
' The example displays the following output:
'    With implicit captures:
'    The match: This is the first sentence.
'       Group 0: This is the first sentence.
'          Capture 0: This is the first sentence.
'       Group 1: sentence
'          Capture 0: This
'          Capture 1: is
'          Capture 2: the
'          Capture 3: first
'          Capture 4: sentence
'       Group 2: sentence
'          Capture 0: This
'          Capture 1: is
'          Capture 2: the
'          Capture 3: first
'          Capture 4: sentence
'    The match: Is it the beginning of a literary masterpiece?
'       Group 0: Is it the beginning of a literary masterpiece?
'          Capture 0: Is it the beginning of a literary masterpiece?
'       Group 1: masterpiece
'          Capture 0: Is
'          Capture 1: it
'          Capture 2: the
'          Capture 3: beginning
'          Capture 4: of
'          Capture 5: a
'          Capture 6: literary
'          Capture 7: masterpiece
'       Group 2: masterpiece
'          Capture 0: Is
'          Capture 1: it
'          Capture 2: the
'          Capture 3: beginning
'          Capture 4: of
'          Capture 5: a
'          Capture 6: literary
'          Capture 7: masterpiece
'    The match: I think not.
'       Group 0: I think not.
'          Capture 0: I think not.
'       Group 1: not
'          Capture 0: I
'          Capture 1: think
'          Capture 2: not
'       Group 2: not
'          Capture 0: I
'          Capture 1: think
'          Capture 2: not
'    The match: Instead, it is a nonsensical paragraph.
'       Group 0: Instead, it is a nonsensical paragraph.
'          Capture 0: Instead, it is a nonsensical paragraph.
'       Group 1: paragraph
'          Capture 0: Instead,
'          Capture 1: it
'          Capture 2: is
'          Capture 3: a
'          Capture 4: nonsensical
'          Capture 5: paragraph
'       Group 2: paragraph
'          Capture 0: Instead
'          Capture 1: it
'          Capture 2: is
'          Capture 3: a
'          Capture 4: nonsensical
'          Capture 5: paragraph
'    
'    With explicit captures only:
'    The match: This is the first sentence.
'       Group 0: This is the first sentence.
'          Capture 0: This is the first sentence.
'    The match: Is it the beginning of a literary masterpiece?
'       Group 0: Is it the beginning of a literary masterpiece?
'          Capture 0: Is it the beginning of a literary masterpiece?
'    The match: I think not.
'       Group 0: I think not.
'          Capture 0: I think not.
'    The match: Instead, it is a nonsensical paragraph.
'       Group 0: Instead, it is a nonsensical paragraph.
'          Capture 0: Instead, it is a nonsensical paragraph.

Le modèle d'expression régulière \b$?((?>\w+),?\s?)+[\.!?]$? est défini comme indiqué dans le tableau suivant.

Motif	Description
`\b`	Commencer à la limite d'un mot.
`\(?`	Mettre en correspondance zéro occurrence, ou plus, de la parenthèse ouvrante (« ( »).
`(?>\w+),?`	Faire correspondre un ou plusieurs caractères de mots, suivis de zéro ou une virgule. Ne pas effectuer de recherches rétroactives quand des caractères alphabétiques sont mis en correspondance.
`\s?`	Mettre en correspondance zéro ou des espaces blancs.
`((\w+),?\s?)+`	Mettre en correspondance la combinaison d'un ou plusieurs caractères alphabétiques, suivis de zéro ou d'une virgule, suivies de zéro ou d'un espace blanc, une ou plusieurs fois.
`[\.!?]\)?`	Mettre en correspondance n'importe lequel des trois symboles de ponctuation, suivi de zéro ou d'une parenthèse fermante (« ) »).

Vous pouvez également utiliser l'élément inline (?n) pour supprimer les captures automatiques. L’exemple suivant modifie le modèle d’expression régulière précédent pour utiliser l’élément inline (?n) au lieu de l’option RegexOptions.ExplicitCapture.

using System;
using System.Text.RegularExpressions;

public class Explicit2Example
{
    public static void Main()
    {
        string input = "This is the first sentence. Is it the beginning " +
                       "of a literary masterpiece? I think not. Instead, " +
                       "it is a nonsensical paragraph.";
        string pattern = @"(?n)\b\(?((?>\w+),?\s?)+[\.!?]\)?";

        foreach (Match match in Regex.Matches(input, pattern))
        {
            Console.WriteLine($"The match: {match.Value}");
            int groupCtr = 0;
            foreach (Group group in match.Groups)
            {
                Console.WriteLine($"   Group {groupCtr}: {group.Value}");
                groupCtr++;
                int captureCtr = 0;
                foreach (Capture capture in group.Captures)
                {
                    Console.WriteLine($"      Capture {captureCtr}: {capture.Value}");
                    captureCtr++;
                }
            }
        }
    }
}
// The example displays the following output:
//       The match: This is the first sentence.
//          Group 0: This is the first sentence.
//             Capture 0: This is the first sentence.
//       The match: Is it the beginning of a literary masterpiece?
//          Group 0: Is it the beginning of a literary masterpiece?
//             Capture 0: Is it the beginning of a literary masterpiece?
//       The match: I think not.
//          Group 0: I think not.
//             Capture 0: I think not.
//       The match: Instead, it is a nonsensical paragraph.
//          Group 0: Instead, it is a nonsensical paragraph.
//             Capture 0: Instead, it is a nonsensical paragraph.

Imports System.Text.RegularExpressions

Module Explicit2Example
    Public Sub Main()
        Dim input As String = "This is the first sentence. Is it the beginning " +
                              "of a literary masterpiece? I think not. Instead, " +
                              "it is a nonsensical paragraph."
        Dim pattern As String = "(?n)\b\(?((?>\w+),?\s?)+[\.!?]\)?"

        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("The match: {0}", match.Value)
            Dim groupCtr As Integer = 0
            For Each group As Group In match.Groups
                Console.WriteLine("   Group {0}: {1}", groupCtr, group.Value)
                groupCtr += 1
                Dim captureCtr As Integer = 0
                For Each capture As Capture In group.Captures
                    Console.WriteLine("      Capture {0}: {1}", captureCtr, capture.Value)
                    captureCtr += 1
                Next
            Next
        Next
    End Sub
End Module
' The example displays the following output:
'       The match: This is the first sentence.
'          Group 0: This is the first sentence.
'             Capture 0: This is the first sentence.
'       The match: Is it the beginning of a literary masterpiece?
'          Group 0: Is it the beginning of a literary masterpiece?
'             Capture 0: Is it the beginning of a literary masterpiece?
'       The match: I think not.
'          Group 0: I think not.
'             Capture 0: I think not.
'       The match: Instead, it is a nonsensical paragraph.
'          Group 0: Instead, it is a nonsensical paragraph.
'             Capture 0: Instead, it is a nonsensical paragraph.

Enfin, vous pouvez utiliser l'élément de groupe inline (?n:) pour supprimer les captures automatiques groupe par groupe. L'exemple suivant modifie le modèle précédent pour supprimer les captures sans nom du groupe externe, ((?>\w+),?\s?). Notez que cette opération supprime également les captures sans nom du groupe interne.

using System;
using System.Text.RegularExpressions;

public class Explicit3Example
{
    public static void Main()
    {
        string input = "This is the first sentence. Is it the beginning " +
                       "of a literary masterpiece? I think not. Instead, " +
                       "it is a nonsensical paragraph.";
        string pattern = @"\b\(?(?n:(?>\w+),?\s?)+[\.!?]\)?";

        foreach (Match match in Regex.Matches(input, pattern))
        {
            Console.WriteLine($"The match: {match.Value}");
            int groupCtr = 0;
            foreach (Group group in match.Groups)
            {
                Console.WriteLine($"   Group {groupCtr}: {group.Value}");
                groupCtr++;
                int captureCtr = 0;
                foreach (Capture capture in group.Captures)
                {
                    Console.WriteLine($"      Capture {captureCtr}: {capture.Value}");
                    captureCtr++;
                }
            }
        }
    }
}
// The example displays the following output:
//       The match: This is the first sentence.
//          Group 0: This is the first sentence.
//             Capture 0: This is the first sentence.
//       The match: Is it the beginning of a literary masterpiece?
//          Group 0: Is it the beginning of a literary masterpiece?
//             Capture 0: Is it the beginning of a literary masterpiece?
//       The match: I think not.
//          Group 0: I think not.
//             Capture 0: I think not.
//       The match: Instead, it is a nonsensical paragraph.
//          Group 0: Instead, it is a nonsensical paragraph.
//             Capture 0: Instead, it is a nonsensical paragraph.

Imports System.Text.RegularExpressions

Module Explicit3Example
    Public Sub Main()
        Dim input As String = "This is the first sentence. Is it the beginning " +
                              "of a literary masterpiece? I think not. Instead, " +
                              "it is a nonsensical paragraph."
        Dim pattern As String = "\b\(?(?n:(?>\w+),?\s?)+[\.!?]\)?"

        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine("The match: {0}", match.Value)
            Dim groupCtr As Integer = 0
            For Each group As Group In match.Groups
                Console.WriteLine("   Group {0}: {1}", groupCtr, group.Value)
                groupCtr += 1
                Dim captureCtr As Integer = 0
                For Each capture As Capture In group.Captures
                    Console.WriteLine("      Capture {0}: {1}", captureCtr, capture.Value)
                    captureCtr += 1
                Next
            Next
        Next
    End Sub
End Module
' The example displays the following output:
'       The match: This is the first sentence.
'          Group 0: This is the first sentence.
'             Capture 0: This is the first sentence.
'       The match: Is it the beginning of a literary masterpiece?
'          Group 0: Is it the beginning of a literary masterpiece?
'             Capture 0: Is it the beginning of a literary masterpiece?
'       The match: I think not.
'          Group 0: I think not.
'             Capture 0: I think not.
'       The match: Instead, it is a nonsensical paragraph.
'          Group 0: Instead, it is a nonsensical paragraph.
'             Capture 0: Instead, it is a nonsensical paragraph.

Expressions régulières compilées

Note

Si possible, utilisez des expressions régulières générées par la source au lieu de compiler des expressions régulières avec l’option RegexOptions.Compiled. Grâce à la génération de source, votre application peut démarrer plus vite, s’exécuter plus rapidement et mieux se prêter au découpage. Pour savoir quand la génération de source est possible, consultez Quand l’utiliser.

Par défaut, les expressions régulières dans .NET sont interprétées. Quand un objet Regex est instancié ou qu'une méthode Regex statique est appelée, le modèle d'expression régulière est analysé de manière à générer un ensemble d'opcodes personnalisés, puis un interpréteur utilise ces opcodes pour exécuter l'expression régulière. Cela implique un compromis : le coût d’initialisation du moteur d’expression régulière est réduit au détriment des performances du runtime.

Vous pouvez utiliser des expressions régulières compilées à la place d'expressions régulières interprétées en utilisant l'option RegexOptions.Compiled. Dans ce cas, quand un modèle est passé au moteur d’expression régulière, il est décomposé en un ensemble d’opcodes, puis converti en code CIL (Common Intermediate Language), qui peut être passé directement au Common Language Runtime. Les expressions régulières compilées optimisent les performances du runtime au détriment du temps d’initialisation.

Note

Pour compiler une expression régulière, vous devez fournir la valeur RegexOptions.Compiled au paramètre options d’un constructeur de classe Regex ou d’une méthode de mise en correspondance de modèle statique. Ce n'est pas disponible en tant qu'option en ligne.

Vous pouvez utiliser des expressions régulières compilées dans les appels d'expressions régulières statiques et d'instance. Dans les expressions régulières statiques, l'option RegexOptions.Compiled est transmise au paramètre options de la méthode de mise en correspondance de modèle d'expression régulière. Dans les expressions régulières d'instance, elle est transmise au paramètre options du constructeur de classe Regex. Dans les deux cas, les performances s'en trouvent améliorées.

Toutefois, cette amélioration ne se produit que dans les conditions suivantes :

Un objet Regex qui représente une expression régulière particulière est utilisé dans plusieurs appels de méthodes de mise en correspondance de modèle d'expression régulière.
L'objet Regex n'est pas autorisé à sortir de sa portée, ce qui permet sa réutilisation.
Une expression régulière statique est utilisée dans plusieurs appels de méthodes de mise en correspondance de modèle d’expression régulière. (L'amélioration des performances est possible, car les expressions régulières utilisées dans les appels de méthode statique sont mises en cache par le moteur d'expression régulière.)

Note

L'option RegexOptions.Compiled n'est pas liée à la méthode Regex.CompileToAssembly obsolète, qui crée un assembly à usage particulier contenant des expressions régulières compilées prédéfinies.

Ignorer l’espace blanc

Par défaut, l’espace blanc dans un modèle d’expression régulière est significatif ; il oblige le moteur d’expression régulière à mettre en correspondance un espace blanc dans la chaîne d’entrée. Ainsi, les expressions régulières « \b\w+\s » et « \b\w+ » sont pratiquement équivalentes. En outre, quand le signe dièse (#) est rencontré dans un modèle d’expression régulière, il est interprété comme un caractère littéral à mettre en correspondance.

L'option RegexOptions.IgnorePatternWhitespace, ou l'option inline x, modifie ce comportement par défaut comme suit :

L’espace blanc sans séquence d’échappement dans le modèle d’expression régulière est ignoré. Pour faire partie d’un modèle d’expression régulière, les espaces blancs doivent être inclus dans une séquence d’échappement (par exemple, as \s ou « \ »).
Le signe dièse (#) est interprété comme le début d'un commentaire, plutôt que comme un caractère littéral. Tout le texte d’un modèle d’expression régulière depuis le caractère # jusqu’au caractère \n suivant ou jusqu’à la fin de la chaîne est interprété comme un commentaire.

Toutefois, dans les cas suivants, les espaces blancs d’une expression régulière ne sont pas ignorés, même si vous utilisez l’option RegexOptions.IgnorePatternWhitespace :

L'espace blanc dans une classe de caractères est toujours interprété de façon littérale. Par exemple, le modèle d'expression régulière [ .,;:] met en correspondance n'importe quel espace blanc, point, virgule, point-virgule ou symbole deux-points unique.
L’espace blanc n’est pas autorisé dans un quantificateur entre accolades, comme {n}, {n,}, and {n,m}. Par exemple, le modèle d'expression régulière \d{1, 3} ne peut pas mettre en correspondance les séquences d'un à trois chiffres, car il contient un espace blanc.
L'espace blanc n'est pas autorisé dans une séquence de caractères qui introduit un élément de langage. Par exemple :
- L’élément de langage (?:sous-expression) représente un groupe sans capture, et la partie (?: de l’élément ne peut pas comporter d’espaces. Le modèle (? :sous-expression) génère une ArgumentException au moment de l'exécution car le moteur d'expressions régulières ne peut pas analyser le modèle, et le modèle ( ?:sous-expression) ne correspond pas à la sous-expression.
- L’élément de langage \p{nom}, qui représente une catégorie Unicode ou un bloc nommé, ne peut pas comporter d’espaces dans sa partie \p{. Si vous incluez un espace blanc, l’élément génère un ArgumentException à l'exécution.

L'activation de cette option permet de simplifier les expressions régulières qui sont souvent difficiles à analyser et à comprendre. Elle améliore la lisibilité et rend possible la documentation d'une expression régulière.

L’exemple ci-après définit le modèle d’expression régulière suivant :

\b $? ( (?>\w+) ,?\s? )+ [\.!?] $? # Matches an entire sentence.

Ce modèle est similaire au modèle défini dans la section Captures explicites uniquement, à la différence qu’il utilise l’option RegexOptions.IgnorePatternWhitespace pour ignorer l’espace blanc du modèle.

using System;
using System.Text.RegularExpressions;

public class Whitespace1Example
{
    public static void Main()
    {
        string input = "This is the first sentence. Is it the beginning " +
                       "of a literary masterpiece? I think not. Instead, " +
                       "it is a nonsensical paragraph.";
        string pattern = @"\b \(? ( (?>\w+) ,?\s? )+ [\.!?] \)? # Matches an entire sentence.";

        foreach (Match match in Regex.Matches(input, pattern, RegexOptions.IgnorePatternWhitespace))
            Console.WriteLine(match.Value);
    }
}
// The example displays the following output:
//       This is the first sentence.
//       Is it the beginning of a literary masterpiece?
//       I think not.
//       Instead, it is a nonsensical paragraph.

Imports System.Text.RegularExpressions

Module Whitespace1Example
    Public Sub Main()
        Dim input As String = "This is the first sentence. Is it the beginning " +
                              "of a literary masterpiece? I think not. Instead, " +
                              "it is a nonsensical paragraph."
        Dim pattern As String = "\b \(? ( (?>\w+) ,?\s? )+  [\.!?] \)? # Matches an entire sentence."

        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.IgnorePatternWhitespace)
            Console.WriteLine(match.Value)
        Next
    End Sub
End Module
' The example displays the following output:
'       This is the first sentence.
'       Is it the beginning of a literary masterpiece?
'       I think not.
'       Instead, it is a nonsensical paragraph.

L'exemple suivant utilise l'option inline (?x) pour ignorer l'espace blanc du modèle.

using System;
using System.Text.RegularExpressions;

public class Whitespace2Example
{
    public static void Main()
    {
        string input = "This is the first sentence. Is it the beginning " +
                       "of a literary masterpiece? I think not. Instead, " +
                       "it is a nonsensical paragraph.";
        string pattern = @"(?x)\b \(? ( (?>\w+) ,?\s? )+  [\.!?] \)? # Matches an entire sentence.";

        foreach (Match match in Regex.Matches(input, pattern))
            Console.WriteLine(match.Value);
    }
}
// The example displays the following output:
//       This is the first sentence.
//       Is it the beginning of a literary masterpiece?
//       I think not.
//       Instead, it is a nonsensical paragraph.

Imports System.Text.RegularExpressions

Module Whitespace2Example
    Public Sub Main()
        Dim input As String = "This is the first sentence. Is it the beginning " +
                              "of a literary masterpiece? I think not. Instead, " +
                              "it is a nonsensical paragraph."
        Dim pattern As String = "(?x)\b \(? ( (?>\w+) ,?\s? )+  [\.!?] \)? # Matches an entire sentence."

        For Each match As Match In Regex.Matches(input, pattern)
            Console.WriteLine(match.Value)
        Next
    End Sub
End Module
' The example displays the following output:
'       This is the first sentence.
'       Is it the beginning of a literary masterpiece?
'       I think not.
'       Instead, it is a nonsensical paragraph.

Mode de recherche de droite à gauche

Par défaut, le moteur d'expression régulière recherche de gauche à droite. Vous pouvez inverser le sens de la recherche à l'aide de l'option RegexOptions.RightToLeft. La recherche de droite à gauche commence automatiquement à la position du dernier caractère de la chaîne. Pour les méthodes de mise en correspondance de modèle qui comprennent un paramètre de position de début, comme Regex.Match(String, Int32), la position de début spécifiée est l’index de la position du caractère le plus à droite à laquelle la recherche doit commencer.

Note

Pour utiliser le mode de motif de droite à gauche, vous devez fournir uniquement la valeur RegexOptions.RightToLeft au paramètre options d’un constructeur de classe Regex ou d’une méthode de mise en correspondance de motif statique. Ce n'est pas disponible en tant qu'option en ligne.

Exemple

L’expression régulière \bb\w+\s met en correspondance les mots d’au moins deux caractères qui commencent par la lettre « b » et qui sont suivis d’un espace blanc. Dans l'exemple suivant, la chaîne d'entrée se compose de trois mots qui comprennent un ou plusieurs caractères « b ». Les premiers et deuxième mots commencent par « b » et le troisième mot se termine par « b ». Comme le montre la sortie de l’exemple de recherche de droite à gauche, seuls les premier et deuxième mots correspondent au modèle d’expression régulière, avec le deuxième mot mis en correspondance en premier.

using System;
using System.Text.RegularExpressions;

public class RTL1Example
{
    public static void Main()
    {
        string pattern = @"\bb\w+\s";
        string input = "build band tab";
        foreach (Match match in Regex.Matches(input, pattern, RegexOptions.RightToLeft))
            Console.WriteLine($"'{match.Value}' found at position {match.Index}.");
    }
}
// The example displays the following output:
//       'band ' found at position 6.
//       'build ' found at position 0.

Imports System.Text.RegularExpressions

Module RTL1Example
    Public Sub Main()
        Dim pattern As String = "\bb\w+\s"
        Dim input As String = "build band tab"
        For Each match As Match In Regex.Matches(input, pattern, RegexOptions.RightToLeft)
            Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index)
        Next
    End Sub
End Module
' The example displays the following output:
'       'band ' found at position 6.
'       'build ' found at position 0.

Ordre d’évaluation

L’option RegexOptions.RightToLeft change la direction de la recherche et inverse également l’ordre dans lequel le modèle d’expression régulière est évalué. Dans une recherche de droite à gauche, le modèle de recherche est lu de droite à gauche. Cette distinction est importante, car elle peut affecter des éléments tels que les groupes de capture et les références arrière. Par exemple, l’expression Regex.Match("abcabc", @"\1(abc)", RegexOptions.RightToLeft) trouve une correspondance abcabc, mais dans une recherche de gauche à droite (Regex.Match("abcabc", @"\1(abc)", RegexOptions.None)), aucune correspondance n’est trouvée. Cela est dû au fait que l’élément (abc) doit être évalué avant l’élément de groupe de capture numéroté (\1) pour qu’une correspondance soit trouvée.

Assertions avant et arrière

L’emplacement d’une correspondance pour une assertion avant ((?=subexpression)) ou arrière ((?<=subexpression)) ne change pas dans une recherche de droite à gauche. Les assertions avant regardent à droite de l’emplacement de correspondance actuel, tandis que les assertions arrière regardent à gauche de l’emplacement de correspondance actuel.

Conseil

Qu’une recherche soit effectuée de droite à gauche ou non, les postanalyses sont implémentées avec une recherche de droite à gauche commençant à l’emplacement de correspondance actuel.

Par exemple, l'expression régulière (?<=\d{1,2}\s)\w+,\s\d{4} utilise l'assertion de postanalyse pour déterminer si une date précède le nom d'un mois. Ensuite, l'expression régulière met en correspondance le mois et l'année. Pour plus d’informations sur les assertions de préanalyse et de postanalyse, voir Constructions de regroupement.

using System;
using System.Text.RegularExpressions;

public class RTL2Example
{
    public static void Main()
    {
        string[] inputs = { "1 May, 1917", "June 16, 2003" };
        string pattern = @"(?<=\d{1,2}\s)\w+,\s\d{4}";

        foreach (string input in inputs)
        {
            Match match = Regex.Match(input, pattern, RegexOptions.RightToLeft);
            if (match.Success)
                Console.WriteLine($"The date occurs in {match.Value}.");
            else
                Console.WriteLine($"{input} does not match.");
        }
    }
}

// The example displays the following output:
//       The date occurs in May, 1917.
//       June 16, 2003 does not match.

Imports System.Text.RegularExpressions

Module RTL2Example
    Public Sub Main()
        Dim inputs() As String = {"1 May, 1917", "June 16, 2003"}
        Dim pattern As String = "(?<=\d{1,2}\s)\w+,\s\d{4}"

        For Each input As String In inputs
            Dim match As Match = Regex.Match(input, pattern, RegexOptions.RightToLeft)
            If match.Success Then
                Console.WriteLine("The date occurs in {0}.", match.Value)
            Else
                Console.WriteLine("{0} does not match.", input)
            End If
        Next
    End Sub
End Module

' The example displays the following output:
'       The date occurs in May, 1917.
'       June 16, 2003 does not match.

Le modèle d’expression régulière est défini comme indiqué dans le tableau suivant.

Motif	Description
`(?<=\d{1,2}\s)`	Le début de la séquence doit être précédé d'un ou deux chiffres décimaux suivis d'un espace.
`\w+`	Mettre en correspondance un ou plusieurs caractères alphabétiques.
`,`	Mettre en correspondance une virgule.
`\s`	Mettre en correspondance un espace blanc.
`\d{4}`	Mettre en correspondance quatre chiffres décimaux.

Comportement de correspondance ECMAScript

Par défaut, le moteur d’expression régulière utilise un comportement canonique pour appliquer un modèle d’expression régulière à un texte d’entrée. Toutefois, vous pouvez indiquer au moteur d’expression régulière d’utiliser un comportement de correspondance ECMAScript en spécifiant l’option RegexOptions.ECMAScript.

Note

Le comportement conforme à ECMAScript est disponible uniquement en fournissant la valeur RegexOptions.ECMAScript au paramètre options d'un constructeur de classe Regex ou d'une méthode statique de correspondance de modèle. Ce n'est pas disponible en tant qu'option en ligne.

L’option RegexOptions.ECMAScript peut être combinée uniquement avec les options RegexOptions.IgnoreCase, RegexOptions.Multiline et RegexOptions.Compiled. L'utilisation d'une autre option dans une expression régulière aboutit à une ArgumentOutOfRangeException.

Le comportement des expressions régulières ECMAScript et canoniques diffère dans trois domaines : la syntaxe de la classe de caractères, les groupes de capture avec référence circulaire et l’interprétation des séquences d’échappement octales ou des références arrière.

Syntaxe de la classe de caractères. Comme les expressions régulières canoniques prennent en charge Unicode, tandis que ECMAScript ne le fait pas, les classes de caractères dans ECMAScript possèdent une syntaxe plus limitée, et certains éléments du langage des classes de caractères ont une signification différente. Par exemple, ECMAScript ne prend pas en charge les éléments de langage tels que la catégorie Unicode ou les éléments de bloc \p et \P. De même, l'élément \w, qui correspond à un caractère alphabétique, est équivalent à la classe de caractères [a-zA-Z_0-9], dans le cas de l'utilisation d'ECMAScript, et à [\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Pc}\p{Lm}], dans le cas de l'utilisation du comportement canonique. Pour plus d’informations, consultez Classes de caractères.

L’exemple suivant illustre la différence entre les mises en correspondance de modèle canonique et ECMAScript. Il définit une expression régulière, \b(\w+\s*)+, qui met en correspondance les mots suivis d'espaces blancs. L'entrée se compose de deux chaînes ; l'une d'elles utilise le jeu de caractères latin, l'autre le jeu de caractères cyrillique. Comme le montre la sortie, l’appel de méthode Regex.IsMatch(String, String, RegexOptions) qui utilise la correspondance ECMAScript ne parvient pas à mettre en correspondance les mots cyrilliques, contrairement à l’appel de méthode qui utilise la correspondance canonique.

using System;
using System.Text.RegularExpressions;

public class EcmaScriptExample
{
    public static void Main()
    {
        string[] values = { "целый мир", "the whole world" };
        string pattern = @"\b(\w+\s*)+";
        foreach (var value in values)
        {
            Console.Write("Canonical matching: ");
            if (Regex.IsMatch(value, pattern))
                Console.WriteLine($"'{value}' matches the pattern.");
            else
                Console.WriteLine($"{value} does not match the pattern.");

            Console.Write("ECMAScript matching: ");
            if (Regex.IsMatch(value, pattern, RegexOptions.ECMAScript))
                Console.WriteLine($"'{value}' matches the pattern.");
            else
                Console.WriteLine($"{value} does not match the pattern.");
            Console.WriteLine();
        }
    }
}
// The example displays the following output:
//       Canonical matching: 'целый мир' matches the pattern.
//       ECMAScript matching: целый мир does not match the pattern.
//
//       Canonical matching: 'the whole world' matches the pattern.
//       ECMAScript matching: 'the whole world' matches the pattern.

Imports System.Text.RegularExpressions

Module Ecma1Example
    Public Sub Main()
        Dim values() As String = {"целый мир", "the whole world"}
        Dim pattern As String = "\b(\w+\s*)+"
        For Each value In values
            Console.Write("Canonical matching: ")
            If Regex.IsMatch(value, pattern) Then
                Console.WriteLine("'{0}' matches the pattern.", value)
            Else
                Console.WriteLine("{0} does not match the pattern.", value)
            End If

            Console.Write("ECMAScript matching: ")
            If Regex.IsMatch(value, pattern, RegexOptions.ECMAScript) Then
                Console.WriteLine("'{0}' matches the pattern.", value)
            Else
                Console.WriteLine("{0} does not match the pattern.", value)
            End If
            Console.WriteLine()
        Next
    End Sub
End Module
' The example displays the following output:
'       Canonical matching: 'целый мир' matches the pattern.
'       ECMAScript matching: целый мир does not match the pattern.
'       
'       Canonical matching: 'the whole world' matches the pattern.
'       ECMAScript matching: 'the whole world' matches the pattern.

Groupes de capture avec référence circulaire. Une classe de capture d'expression régulière avec une référence arrière à elle-même doit être mise à jour à chaque itération de capture. Comme le montre l'exemple suivant, cette fonctionnalité permet à l'expression régulière ((a+)(\1) ?)+ de mettre en correspondance la chaîne d'entrée « aa aaaa aaaaaa » dans le cas de l'utilisation de la correspondance ECMAScript, mais pas dans le cas de l'utilisation de la correspondance canonique.

using System;
using System.Text.RegularExpressions;

public class EcmaScript2Example
{
    static string pattern;

    public static void Main()
    {
        string input = "aa aaaa aaaaaa ";
        pattern = @"((a+)(\1) ?)+";

        // Match input using canonical matching.
        AnalyzeMatch(Regex.Match(input, pattern));

        // Match input using ECMAScript.
        AnalyzeMatch(Regex.Match(input, pattern, RegexOptions.ECMAScript));
    }

    private static void AnalyzeMatch(Match m)
    {
        if (m.Success)
        {
            Console.WriteLine($"'{pattern}' matches {m.Value} at position {m.Index}.");
            int grpCtr = 0;
            foreach (Group grp in m.Groups)
            {
                Console.WriteLine($"   {grpCtr}: '{grp.Value}'");
                grpCtr++;
                int capCtr = 0;
                foreach (Capture cap in grp.Captures)
                {
                    Console.WriteLine($"      {capCtr}: '{cap.Value}'");
                    capCtr++;
                }
            }
        }
        else
        {
            Console.WriteLine("No match found.");
        }
        Console.WriteLine();
    }
}
// The example displays the following output:
//    No match found.
//
//    '((a+)(\1) ?)+' matches aa aaaa aaaaaa  at position 0.
//       0: 'aa aaaa aaaaaa '
//          0: 'aa aaaa aaaaaa '
//       1: 'aaaaaa '
//          0: 'aa '
//          1: 'aaaa '
//          2: 'aaaaaa '
//       2: 'aa'
//          0: 'aa'
//          1: 'aa'
//          2: 'aa'
//       3: 'aaaa '
//          0: ''
//          1: 'aa '
//          2: 'aaaa '

Imports System.Text.RegularExpressions

Module Ecma2Example
    Dim pattern As String

    Public Sub Main()
        Dim input As String = "aa aaaa aaaaaa "
        pattern = "((a+)(\1) ?)+"

        ' Match input using canonical matching.
        AnalyzeMatch(Regex.Match(input, pattern))

        ' Match input using ECMAScript.
        AnalyzeMatch(Regex.Match(input, pattern, RegexOptions.ECMAScript))
    End Sub

    Private Sub AnalyzeMatch(m As Match)
        If m.Success Then
            Console.WriteLine("'{0}' matches {1} at position {2}.",
                              pattern, m.Value, m.Index)
            Dim grpCtr As Integer = 0
            For Each grp As Group In m.Groups
                Console.WriteLine("   {0}: '{1}'", grpCtr, grp.Value)
                grpCtr += 1
                Dim capCtr As Integer = 0
                For Each cap As Capture In grp.Captures
                    Console.WriteLine("      {0}: '{1}'", capCtr, cap.Value)
                    capCtr += 1
                Next
            Next
        Else
            Console.WriteLine("No match found.")
        End If
        Console.WriteLine()
    End Sub
End Module
' The example displays the following output:
'    No match found.
'    
'    '((a+)(\1) ?)+' matches aa aaaa aaaaaa  at position 0.
'       0: 'aa aaaa aaaaaa '
'          0: 'aa aaaa aaaaaa '
'       1: 'aaaaaa '
'          0: 'aa '
'          1: 'aaaa '
'          2: 'aaaaaa '
'       2: 'aa'
'          0: 'aa'
'          1: 'aa'
'          2: 'aa'
'       3: 'aaaa '
'          0: ''
'          1: 'aa '
'          2: 'aaaa '

L'expression régulière est définie comme indiqué dans le tableau suivant.

Motif	Description
(a+)	Mettre en correspondance la lettre « a » une ou plusieurs fois. Il s'agit du deuxième groupe de capture.
(\1)	Mettre en correspondance la sous-chaîne capturée par le premier groupe de capture. Il s'agit du troisième groupe de capture.
?	Mettre en correspondance zéro ou un espace.
((a+)(\1) ?)+	Mettre en correspondance le modèle d'un ou plusieurs caractères « a » suivis d'une chaîne correspondant au premier groupe de capture, suivie de zéro ou un espace, une ou plusieurs fois. Il s'agit du premier groupe de capture.

Résolution des ambiguïtés entre les séquences d'échappement octales et les références arrière. Le tableau suivant compare la façon dont les expressions régulières canoniques et ECMAScript interprètent les séquences d'échappement octales et les références arrière.

Expression régulière	Comportement canonique	Comportement ECMAScript
`\0` suivi de 0 à 2 chiffres octaux	Interpréter comme un octal. Par exemple, `\044` est toujours interprété comme une valeur octale et signifie « $ ».	Même comportement.
`\` suivi d'un chiffre entre 1 et 9, non suivi de chiffres décimaux.	Interpréter comme une référence arrière. Par exemple, `\9` signifie toujours référence arrière 9, même si un neuvième groupe de capture n'existe pas. Si le groupe de capture n'existe pas, l'analyseur de l'expression régulière lève une ArgumentException.	Si un groupe de capture avec chiffre décimal unique existe, effectuer une référence arrière au niveau de ce chiffre. Sinon, interpréter la valeur en tant que littéral.
`\` suivi d'un chiffre entre 1 et 9, suivi de chiffres décimaux supplémentaires.	Interpréter les chiffres en tant que valeur décimale. Si ce groupe de capture existe, interpréter l'expression en tant que référence arrière. Sinon, interpréter les chiffres octaux de début jusqu'à l'octal 377 ; en d'autres termes, ne prendre en compte que les 8 bits de poids faible de la valeur. Interpréter les autres chiffres comme des littéraux. Par exemple, dans l'expression `\3000`, si le groupe de capture 300 existe, interpréter en tant que référence arrière 300, sinon, interpréter en tant qu'octal 300 suivi de 0.	Interpréter en tant que référence arrière en convertissant autant de chiffres que possible en valeur décimale pouvant faire référence à une capture. Si aucun chiffre ne peut être converti, interpréter en tant qu'octal en utilisant les chiffres octaux de début jusqu'à l'octal 377 ; interpréter les autres chiffres en tant que littéraux.

Comparer en utilisant la culture invariante

Par défaut, quand le moteur d'expression régulière effectue des comparaisons sans respect de la casse, il utilise les conventions de gestion de la casse de la culture actuelle pour déterminer les caractères majuscules et minuscules équivalents.

Toutefois, ce comportement n'est pas souhaitable pour certains types de comparaisons, notamment celles entre les entrées utilisateur et les noms de ressources système, comme les mots de passe, les fichiers ou les URL. L’exemple suivant illustre un scénario de ce type. Le code est destiné à bloquer l’accès à toute ressource dont l’URL commence par FILE://. Le moteur d'expression régulière essaie d'effectuer une mise en correspondance sans respect de la casse avec la chaîne en utilisant l'expression régulière $FILE://. Toutefois, quand la culture système actuelle est tr-TR (Turc-Türkiye), « I » n’est pas l’équivalent en majuscule de « i ». L'appel de la méthode Regex.IsMatch renvoie donc false, et l'accès au fichier est autorisé.

CultureInfo defaultCulture = Thread.CurrentThread.CurrentCulture;
Thread.CurrentThread.CurrentCulture = new CultureInfo("tr-TR");

string input = "file://c:/Documents.MyReport.doc";
string pattern = "FILE://";

Console.WriteLine($"Culture-sensitive matching ({Thread.CurrentThread.CurrentCulture.Name} culture)...");
if (Regex.IsMatch(input, pattern, RegexOptions.IgnoreCase))
    Console.WriteLine("URLs that access files are not allowed.");
else
    Console.WriteLine($"Access to {input} is allowed.");

Thread.CurrentThread.CurrentCulture = defaultCulture;
// The example displays the following output:
//       Culture-sensitive matching (tr-TR culture)...
//       Access to file://c:/Documents.MyReport.doc is allowed.

Dim defaultCulture As CultureInfo = Thread.CurrentThread.CurrentCulture
Thread.CurrentThread.CurrentCulture = New CultureInfo("tr-TR")

Dim input As String = "file://c:/Documents.MyReport.doc"
Dim pattern As String = "$FILE://"

Console.WriteLine("Culture-sensitive matching ({0} culture)...",
                  Thread.CurrentThread.CurrentCulture.Name)
If Regex.IsMatch(input, pattern, RegexOptions.IgnoreCase) Then
    Console.WriteLine("URLs that access files are not allowed.")
Else
    Console.WriteLine("Access to {0} is allowed.", input)
End If

Thread.CurrentThread.CurrentCulture = defaultCulture
' The example displays the following output:
'       Culture-sensitive matching (tr-TR culture)...
'       Access to file://c:/Documents.MyReport.doc is allowed.

Note

Pour plus d’informations sur les comparaisons de chaînes respectant la casse et utilisant la culture dite indifférente, consultez Bonnes pratiques pour l’utilisation de chaînes.

Au lieu d'utiliser les comparaisons sans respect de la casse de la culture actuelle, vous pouvez spécifier l'option RegexOptions.CultureInvariant pour ignorer les différences culturelles propres à la langue et pour utiliser les conventions de la culture dite indifférente.

Note

Pour effectuer une comparaison en utilisant la culture Invariant, vous devez fournir la valeur RegexOptions.CultureInvariant au paramètre options d'un constructeur de classe Regex ou d'une méthode de mise en correspondance de modèle statique. Ce n'est pas disponible en tant qu'option en ligne.

L'exemple suivant est identique à l'exemple précédent, à la différence que la méthode Regex.IsMatch(String, String, RegexOptions) statique est appelée avec des options qui incluent RegexOptions.CultureInvariant. Même si la culture actuelle est définie sur Turc (Türkiye), le moteur d’expression régulière parvient à mettre en correspondance « FILE » et « file » et à bloquer l’accès à la ressource de fichier.

CultureInfo defaultCulture = Thread.CurrentThread.CurrentCulture;
Thread.CurrentThread.CurrentCulture = new CultureInfo("tr-TR");

string input = "file://c:/Documents.MyReport.doc";
string pattern = "FILE://";

Console.WriteLine("Culture-insensitive matching...");
if (Regex.IsMatch(input, pattern,
                  RegexOptions.IgnoreCase | RegexOptions.CultureInvariant))
    Console.WriteLine("URLs that access files are not allowed.");
else
    Console.WriteLine($"Access to {input} is allowed.");

Thread.CurrentThread.CurrentCulture = defaultCulture;
// The example displays the following output:
//       Culture-insensitive matching...
//       URLs that access files are not allowed.

Dim defaultCulture As CultureInfo = Thread.CurrentThread.CurrentCulture
Thread.CurrentThread.CurrentCulture = New CultureInfo("tr-TR")

Dim input As String = "file://c:/Documents.MyReport.doc"
Dim pattern As String = "$FILE://"

Console.WriteLine("Culture-insensitive matching...")
If Regex.IsMatch(input, pattern,
               RegexOptions.IgnoreCase Or RegexOptions.CultureInvariant) Then
    Console.WriteLine("URLs that access files are not allowed.")
Else
    Console.WriteLine("Access to {0} is allowed.", input)
End If
Thread.CurrentThread.CurrentCulture = defaultCulture
' The example displays the following output:
'        Culture-insensitive matching...
'        URLs that access files are not allowed.

Mode NonBacktracking

Par défaut, le moteur regex de .NET utilise backtracking pour essayer de rechercher des correspondances de modèle. Un moteur de retour arrière est un moteur qui tente de correspondre à un modèle, et si cela échoue, retourne et tente de correspondre à un autre modèle, et ainsi de suite. Un moteur de retour sur trace est très rapide pour les cas typiques, mais ralentit à mesure que le nombre d’alternances de modèle augmente, ce qui peut entraîner des retours sur trace catastrophiques. L'option RegexOptions.NonBacktracking, qui a été introduite dans .NET 7, n'utilise pas de retour arrière et évite ce scénario pire. Son objectif est de fournir un bon comportement cohérent, quelle que soit l’entrée recherchée.

Warning

Le moteur d’expression régulière .NET suppose que le modèle est approuvé. Le mode NonBacktracking ne change pas cette hypothèse : il protège contre les entrées coûteuses, pas contre les modèles activement malveillants. Pour plus d’informations, consultez Utiliser des modèles approuvés.

L’option RegexOptions.NonBacktracking ne prend pas en charge tout ce que les autres moteurs intégrés prennent en charge. En particulier, l’option ne peut pas être utilisée conjointement avec RegexOptions.RightToLeft, RegexOptions.ECMAScriptou RegexOptions.AnyNewLine. Elle ne permet pas non plus les constructions suivantes dans le modèle :

Groupes atomiques
Rétro-références
Groupes d'équilibrage
Conditionnels
Assertions
Ancres de démarrage (\G)

RegexOptions.NonBacktracking a également une différence subtile en ce qui concerne l’exécution. Si un groupe de capture se trouve dans une boucle, la plupart des moteurs regex (non-.NET) fournissent uniquement la dernière valeur correspondante pour cette capture. Toutefois, le moteur regex de .NET effectue le suivi de toutes les valeurs capturées à l'intérieur d'une boucle et leur donne accès. L’option RegexOptions.NonBacktracking est comme la plupart des autres implémentations regex et permet seulement de fournir la capture finale.

Pour plus d’informations sur ce retour sur trace, consultez Retour sur trace dans les expressions régulières.

Mode AnyNewLine

Par défaut, le moteur d'expression régulière de .NET traite uniquement \n comme un caractère de nouvelle ligne. Les ancres ^ et $ (en mode RegexOptions.Multiline), \Z, et le caractère générique . utilisent tous \n comme seule limite de ligne. Cela signifie que $ ne correspond pas avant \r\n (terminaisons de ligne de style Windows) et . correspond à \r mais pas à \n (sauf si RegexOptions.Singleline est activé, dans ce cas . correspond à tous les caractères), ce qui entraîne des erreurs courantes lors du traitement de texte avec des terminaisons de ligne mixtes ou non-Unix.

L’option RegexOptions.AnyNewLine, qui a été introduite dans .NET 11, permet à ces constructions de reconnaître toutes les séquences de nouvelles lignes courantes : \r\n (CR+LF), \r (CR), \n (LF), \u0085 (NEL), \u2028 (LS) et \u2029 (PS). Cela est cohérent avec Unicode TR18 RL1.6.

Par exemple, sans AnyNewLine, il est nécessaire d’appliquer des solutions de contournement manuelles, telles que \r?$, pour faire correspondre les lignes d’une chaîne avec des fins de ligne Windows.

// BUG: .+$ captures trailing \r on Windows line endings
var match = Regex.Match("foo\r\nbar", @".+$", RegexOptions.Multiline);
Console.WriteLine(match.Value); // "foo\r" -- not "foo"!

Avec AnyNewLine, les ancres gèrent automatiquement tous les types de nouvelles lignes :

var match = Regex.Match("foo\r\nbar", @".+$",
    RegexOptions.Multiline | RegexOptions.AnyNewLine);
Console.WriteLine(match.Value); // "foo"

Le tableau suivant résume comment AnyNewLine affecte chaque construction :

Construction	Comportement par défaut	Avec `AnyNewLine`
`.` (valeur par défaut)	Correspond à n’importe quel caractère, sauf `\n`	Correspond à n’importe quel caractère, sauf `\r`, `\n`, `\u0085\u2028`,`\u2029`
`$` (Multiligne)	Correspondances avant `\n`	Correspondances avant `\r\n`, , `\r\n`, `\u0085`, , `\u2028\u2029`
`^` (Multiligne)	Correspondances après `\n`	Correspondances après `\r\n`, `\r`, `\n`, `\u0085`, `\u2028`, `\u2029`
`$` (par défaut) / `\Z`	Correspond avant `\n` en fin de chaîne de caractères	Correspond avant toute séquence de nouvelle ligne à la fin de la chaîne

Points de conception clés :

\r\n est traité atomiquement : $ correspond avant la séquence complète \r\n , jamais entre \r et \n.
Singleline est prioritaire : . avec les deux Singleline et AnyNewLine correspond à chaque caractère (y compris les lignes nouvelles), conformément au comportement existant de Singleline.
\A et \z ne sont pas affectés : les ancres de début de chaîne et de fin de chaîne absolue ne changent pas.
Options incompatibles : AnyNewLine ne peuvent pas être combinées avec RegexOptions.NonBacktracking ou RegexOptions.ECMAScript. Toute tentative de ce type lève ArgumentOutOfRangeException.

Voir aussi

Langage des expressions régulières - Aide-mémoire

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-15

Options des expressions régulières

Spécifier les options

Déterminer les options

Options par défaut

Correspondance qui ne respecte pas la casse

Mode multiligne

Mode à ligne simple

Captures explicites uniquement

Expressions régulières compilées

Ignorer l’espace blanc

Mode de recherche de droite à gauche

Exemple

Ordre d’évaluation

Assertions avant et arrière

Comportement de correspondance ECMAScript

Comparer en utilisant la culture invariante

Mode NonBacktracking

Mode AnyNewLine

Voir aussi

Commentaires

Ressources supplémentaires