Кванторы

Статья
11/05/2008

Обновлен: Июль 2008

Квантификаторы определяют количество вхождений предшествующего им элемента (знака, группы или класса знаков), которое должно присутствовать во входных данных, чтобы было зафиксировано совпадение.

Квантификаторы в регулярных выражениях .NET Framework

В следующей таблице перечислены квантификаторы, поддерживаемые регулярными выражениями .NET Framework. Количества n и m являются целочисленными константами. Описание различий между "жадными" и "ленивыми" квантификаторами см. в разделе "Жадные и ленивые квантификаторы" после таблицы.

Квантификатор	Описание
*	Предыдущий элемент повторяется ноль или более раз. Эквивалентен выражению {0,}. * — жадный квантификатор, нежадным эквивалентом которого является квантификатор ?. Например, с помощью регулярного выражения \b919\b можно обнаружить знак 9, стоящий после границы слова. После знака 9 может находиться одно или более вхождений знака 1, после которого, в свою очередь, могут находиться одно или более вхождений знака 9. В следующем примере показано, как использовать это регулярное выражение. Пять из девяти чисел в исходной строке соответствуют заданному шаблону, четыре числа (95, 929, 9129 и 9919) ему не соответствуют. `Dim pattern As String = "\b919\b" Dim input As String = "99 95 919 929 9119 9219 999 9919 91119" For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' '99' found at position 0. ' '919' found at position 6. ' '9119' found at position 14. ' '999' found at position 24. ' '91119' found at position 33.` `string pattern = "\b919*\b"; string input = "99 95 919 929 9119 9219 999 9919 91119"; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // '99' found at position 0. // '919' found at position 6. // '9119' found at position 14. // '999' found at position 24. // '91119' found at position 33.`
+	Предыдущий элемент повторяется один или более раз. Этот параметр аналогичен параметру {1,}. + — жадный квантификатор, нежадным эквивалентом которого является квантификатор +?. Например, с помощью регулярного выражения \ba(n)+\w?\b осуществляется поиск целых слов, которые начинаются с буквы a, за которой следует одна или несколько букв n. В следующем примере показано, как использовать это регулярное выражение. Регулярное выражение соответствует словам an, annual, announcement и antique и не соответствует словам autumn и all. `Dim pattern As String = "\ba(n)+\w?\b" Dim input As String = "Autumn is a great time for an annual announcement to all antique collectors." For Each match As Match In Regex.Matches(input, pattern, RegexOptions.IgnoreCase) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'an' found at position 27. ' 'annual' found at position 30. ' 'announcement' found at position 37. ' 'antique' found at position 57.` `string pattern = @"\ba(n)+\w*?\b"; string input = "Autumn is a great time for an annual announcement to all antique collectors."; foreach (Match match in Regex.Matches(input, pattern, RegexOptions.IgnoreCase)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'an' found at position 27. // 'annual' found at position 30. // 'announcement' found at position 37. // 'antique' found at position 57.`
?	Предыдущий элемент повторяется ноль или один раз. Этот параметр аналогичен параметру {0,1}. ? — жадный квантификатор, нежадным эквивалентом которого является квантификатор ??. Например, с помощью регулярного выражения \ban?\b осуществляется поиск целых слов, которые начинаются с буквы a, за которой следует одна или ни одной букв n. Иными словами, предпринимается попытка найти слова a и an. В следующем примере показано, как использовать это регулярное выражение. `Dim pattern As String = "\ban?\b" Dim input As String = "An amiable animal with a large snount and an animated nose." For Each match As Match In Regex.Matches(input, pattern, RegexOptions.IgnoreCase) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'An' found at position 0. ' 'a' found at position 23. ' 'an' found at position 42.` `string pattern = @"\ban?\b"; string input = "An amiable animal with a large snount and an animated nose."; foreach (Match match in Regex.Matches(input, pattern, RegexOptions.IgnoreCase)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'An' found at position 0. // 'a' found at position 23. // 'an' found at position 42.`
{n}	Предыдущий элемент повторяется ровно n раз. {n} — жадный квантификатор, нежадным эквивалентом которого является квантификатор {n}?. Например, с помощью регулярного выражения \b\d+\,\d{3}\b осуществляется поиск границы слова, за которой следует один или более десятичных знаков, еще три десятичных знака и граница слова. В следующем примере показано, как использовать это регулярное выражение. `Dim pattern As String = "\b\d+\,\d{3}\b" Dim input As String = "Sales totaled 103,524 million in January, " + _ "106,971 million in February, but only " + _ "943 million in March." For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' '103,524' found at position 14. ' '106,971' found at position 45.` `string pattern = @"\b\d+\,\d{3}\b"; string input = "Sales totaled 103,524 million in January, " + "106,971 million in February, but only " + "943 million in March."; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // '103,524' found at position 14. // '106,971' found at position 45.`
{n,}	Предыдущий элемент повторяется по крайней мере n раз. {n,} — жадный квантификатор, нежадным эквивалентом которого является квантификатор {n}?. Например, с помощью регулярного выражения \b\d{2,}\b\D+ осуществляется поиск границы слова, за которой следует по крайней мере два десятичных знака, граница слова и знак, не являющийся числом. В следующем примере показано, как использовать это регулярное выражение. Регулярное выражение не соответствует фразе 7 days, потому что фраза содержит всего один десятичный знак, но соответствует фразам 10 weeks и 300 years. `Dim pattern As String = "\b\d{2,}\b\D+" Dim input As String = "7 days, 10 weeks, 300 years" For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' '10 weeks, ' found at position 8. ' '300 years' found at position 18.` `string pattern = @"\b\d{2,}\b\D+"; string input = "7 days, 10 weeks, 300 years"; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // '10 weeks, ' found at position 8. // '300 years' found at position 18.`
{n,m}	Предыдущий элемент повторяется по крайней мере n раз, но не более m раз. {n,m} — жадный квантификатор, нежадным эквивалентом которого является квантификатор {n,m}?. Например, с помощью регулярного выражения (00\s){2,4} осуществляется поиск от двух до четырех вхождений двух нулей, за которыми следует пробел. В следующем примере показано, как использовать это регулярное выражение. Обратите внимание, что в конце входной строки имеются пять вхождений этого фрагмента при максимуме в четыре вхождения. Однако начало этой части строки (до пробела и пятой пары нулей) соответствует регулярному выражению. `Dim pattern As String = "(00\s){2,4}" Dim input As String = "0x00 FF 00 00 18 17 FF 00 00 00 21 00 00 00 00 00" For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' '00 00 ' found at position 8. ' '00 00 00 ' found at position 23. ' '00 00 00 00 ' found at position 35.` `string pattern = @"(00\s){2,4}"; string input = "0x00 FF 00 00 18 17 FF 00 00 00 21 00 00 00 00 00"; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // '00 00 ' found at position 8. // '00 00 00 ' found at position 23. // '00 00 00 00 ' found at position 35.`
*?	Предыдущий элемент повторяется ноль или более раз, но как можно меньшее число раз. Это ленивый квантификатор, дополняющий жадный квантификатор . Например, с помощью регулярного выражения \b\w?oo\w?\b осуществляется поиск всех слов, содержащих строку oo. В следующем примере показано, как использовать это регулярное выражение. `Dim pattern As String = "\b\w?oo\w?\b" Dim input As String = "woof root root rob oof woo woe" For Each match As Match In Regex.Matches(input, pattern, RegexOptions.IgnoreCase) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'woof' found at position 0. ' 'root' found at position 5. ' 'root' found at position 10. ' 'oof' found at position 19. ' 'woo' found at position 23.` `string pattern = @"\b\w?oo\w*?\b"; string input = "woof root root rob oof woo woe"; foreach (Match match in Regex.Matches(input, pattern, RegexOptions.IgnoreCase)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'woof' found at position 0. // 'root' found at position 5. // 'root' found at position 10. // 'oof' found at position 19. // 'woo' found at position 23.`
+?	Предыдущий элемент повторяется один или более раз, но как можно меньшее число раз. Это ленивый квантификатор, дополняющий жадный квантификатор +. Например, с помощью регулярного выражения \b\w+?\b осуществляется поиск одного или нескольких знаков, разделенных границами слов. В следующем примере показано, как использовать это регулярное выражение. `Dim pattern As String = "\b\w+?\b" Dim input As String = "Aa Bb Cc Dd Ee Ff" For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'Aa' found at position 0. ' 'Bb' found at position 3. ' 'Cc' found at position 6. ' 'Dd' found at position 9. ' 'Ee' found at position 12. ' 'Ff' found at position 15.` `string pattern = @"\b\w+?\b"; string input = "Aa Bb Cc Dd Ee Ff"; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'Aa' found at position 0. // 'Bb' found at position 3. // 'Cc' found at position 6. // 'Dd' found at position 9. // 'Ee' found at position 12. // 'Ff' found at position 15.`
??	Предыдущий элемент повторяется ноль или один раз, но как можно меньшее число раз. Это ленивый квантификатор, дополняющий жадный квантификатор ?. Например, с помощью регулярного выражения ^(\s)(System.)??Console.Write(Line)??\(?? осуществляется поиск строки Console.Write или Console.WriteLine. Строка может включать System. перед Console, а также открывающую скобку в конце. Искомый текст должен находиться в начале строки, хотя перед ним может стоять пробел. В следующем примере показано, как использовать это регулярное выражение. Dim pattern As String = "^(\s)(System.)??Console.Write(Line)??\(??" Dim input As String = "System.Console.WriteLine(""Hello!"")" + vbCrLf + _ "Console.Write(""Hello!"")" + vbCrLf + _ "Console.WriteLine(""Hello!"")" + vbCrLf + _ "Console.ReadLine()" + vbCrLf + _ " Console.WriteLine" For Each match As Match In Regex.Matches(input, pattern, _ RegexOptions.IgnorePatternWhitespace Or RegexOptions.IgnoreCase Or RegexOptions.MultiLine) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'System.Console.Write' found at position 0. ' 'Console.Write' found at position 36. ' 'Console.Write' found at position 61. ' ' Console.Write' found at position 110. string pattern = @"^(\s)*(System.)??Console.Write(Line)??\(??"; string input = "System.Console.WriteLine(\"Hello!\")\n" + "Console.Write(\"Hello!\")\n" + "Console.WriteLine(\"Hello!\")\n" + "Console.ReadLine()\n" + " Console.WriteLine"; foreach (Match match in Regex.Matches(input, pattern, RegexOptions.IgnorePatternWhitespace \| RegexOptions.IgnoreCase \| RegexOptions.Multiline)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'System.Console.Write' found at position 0. // 'Console.Write' found at position 36. // 'Console.Write' found at position 61. // ' Console.Write' found at position 110.
{n}?	Предыдущий элемент повторяется ровно n раз. Это ленивый квантификатор, дополняющий жадный квантификатор {n}+. Например, с помощью регулярного выражения \b(\w{3,}?\.){2}?\w{3,}?\b осуществляется поиск ровно двух наборов знаков с точкой в конце на границе слова. После этих наборов и точки должен располагаться еще один набор знаков и граница слова. Такое регулярное выражение позволяет выявлять адреса веб-узлов. В следующем примере показано, как использовать это регулярное выражение. Обратите внимание, что оно соответствует строкам www.microsoft.com и mdsn.microsoft.com, но не соответствует строкам mywebsite и mycompany.com. `Dim pattern As String = "\b(\w{3,}?\.){2}?\w{3,}?\b" Dim input As String = "www.microsoft.com msdn.microsoft.com mywebsite mycompany.com" For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'www.microsoft.com' found at position 0. ' 'msdn.microsoft.com' found at position 18.` `string pattern = @"\b(\w{3,}?\.){2}?\w{3,}?\b"; string input = "www.microsoft.com msdn.microsoft.com mywebsite mycompany.com"; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'www.microsoft.com' found at position 0. // 'msdn.microsoft.com' found at position 18.`
{n,}?	Предыдущий элемент повторяется по крайней мере n раз, но как можно меньшее число раз. Это ленивый квантификатор, дополняющий жадный квантификатор {n,}. В качестве демонстрации его использования см. пример для квантификатора {n}?. В регулярном выражении из этого примера квантификатор {n,} используется для поиска строки, состоящей по крайней мере из трех знаков, после которых стоит точка.
{n,m}?	Предыдущий элемент повторяется не меньше n и не больше m раз, но как можно меньшее число раз. Это ленивый квантификатор, дополняющий жадный квантификатор {n,m}. Например, с помощью регулярного выражения \b[A-Z](\w?\s?){1,10}[.!?] осуществляется поиск предложений, содержащих от одного до десяти слов. Соответствующие этому регулярному выражению фрагменты начинаются с границы слова, за которой следует прописная буква и от одного до десяти слов с необязательным пробелом. Фрагмент должен заканчиваться точкой, восклицательным или вопросительным знаком. В следующем примере показано, как использовать это регулярное выражение. Ему соответствуют все приложения исходной строки, кроме одного предложения, длина которого составляет 18 слов. Dim pattern As String = "\b[A-Z](\w?\s?){1,10}[.!?]" Dim input As String = "Hi. I am writing a short note. Its purpose is " + _ "to test a regular expression that attempts to find " + _ "sentences with ten or fewer words. Most sentences " + _ "in this note are short." For Each match As Match In Regex.Matches(input, pattern) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index) Next ' The example displays the following output: ' 'Hi.' found at position 0. ' 'I am writing a short note.' found at position 4. ' 'Most sentences in this note are short.' found at position 132. string pattern = @"\b[A-Z](\w?\s?){1,10}[.!?]"; string input = "Hi. I am writing a short note. Its purpose is " + "to test a regular expression that attempts to find " + "sentences with ten or fewer words. Most sentences " + "in this note are short."; foreach (Match match in Regex.Matches(input, pattern)) Console.WriteLine("'{0}' found at position {1}.", match.Value, match.Index); // The example displays the following output: // 'Hi.' found at position 0. // 'I am writing a short note.' found at position 4. // 'Most sentences in this note are short.' found at position 132.

Жадные и ленивые квантификаторы

У некоторых квантификаторов есть две версии.

Жадная версия.

При использовании жадных квантификаторов предпринимается попытка найти максимально возможное число элементов, к которым относятся эти квантификаторы.
Нежадная (ленивая) версия.

При использовании нежадных квантификаторов предпринимается попытка найти минимально возможное число элементов, к которым относятся эти квантификаторы.

Чтобы понять различие, представьте себе очень простое регулярное выражение, позволяющее находить последние четыре цифры в числовой строке, например в номере кредитной карты. Версия этого выражения с жадным квантификатором * будет иметь вид \b.*([0-9]{4})\b. Однако если исходная строка содержит два числа, то с помощью такого регулярного выражения будут найдены только последние четыре знака второго числа, как показано в следующем примере.

Dim greedyPattern As String = "\b.*([0-9]{4})\b"
Dim input1 As String = "1112223333 3992991999"
For Each match As Match In Regex.Matches(input1, greedypattern)
   Console.WriteLine("Account ending in ******{0}.", match.Groups(1).Value)
Next
' The example displays the following output:
'       Account ending in ******1999.

string greedyPattern = @"\b.*([0-9]{4})\b";
string input1 = "1112223333 3992991999";
foreach (Match match in Regex.Matches(input1, greedyPattern))
   Console.WriteLine("Account ending in ******{0}.", match.Groups[1].Value);

// The example displays the following output:
//       Account ending in ******1999.

Это не то, что нам нужно. Регулярное выражение не совпадает с первым числом, поскольку при использовании квантификатора * предпринимается попытка найти максимально возможное число совпадений с предыдущим элементом во всей строке, и поэтому совпадение находится только в конце строки.

Однако аналогичное регулярное выражение с ленивым квантификатором *? позволяет решить поставленную задачу, как показано в следующем примере.

Dim lazyPattern As String = "\b.*?([0-9]{4})\b"
Dim input2 As String = "1112223333 3992991999"
For Each match As Match In Regex.Matches(input2, lazypattern)
   Console.WriteLine("Account ending in ******{0}.", match.Groups(1).Value)
Next     
' The example displays the following output:
'       Account ending in ******3333.
'       Account ending in ******1999.

string lazyPattern = @"\b.*?([0-9]{4})\b";
string input2 = "1112223333 3992991999";
foreach (Match match in Regex.Matches(input2, lazyPattern))
   Console.WriteLine("Account ending in ******{0}.", match.Groups[1].Value);

// The example displays the following output:
//       Account ending in ******3333.
//       Account ending in ******1999.

В большинстве случаев регулярные выражения с жадными и ленивыми квантификаторами возвращают одни и те же результаты. Результаты обычно различаются, если в регулярных выражениях используется метазнак точка ( . ), который соответствует любому знаку.

См. также

Другие ресурсы

Элементы языка регулярных выражений

Журнал изменений

Дата	Журнал изменений	Причина
Июль 2008	Проведена значительная переработка.	Исправление ошибки содержимого.

Поделиться через