Поделиться через


Быстрый парсинг

Быстрый анализ обеспечивает быстрый и простой набор подпрограмм для анализа данных. Эти подпрограммы не зависят от языковой настройки и поддерживают только подмножество форматов даты, времени и целых чисел.

Требования и ограничения

Реализуя быстрый анализ, пакет лишает возможности интерпретации даты, времени и числовых данных в форматах, характерных для языкового стандарта, а также многие часто используемые базовые и расширенные форматы ISO 8601, однако пакет повышает свою производительность. Например, быстрый синтаксический анализ поддерживает только наиболее часто используемые представления формата даты, такие как ГГГГММДД и ГГГГ-ММ-ДД, не выполняет синтаксический анализ, специфичный для языкового стандарта, не распознает специальные символы в валютных данных и не может преобразовывать шестнадцатеричное или научное представление целых чисел.

Быстрый анализ доступен только при использовании источника плоского файла или преобразования данных. Повышение производительности может быть значительным, и вы должны рассмотреть возможность быстрого анализа в этих компонентах потока данных, если это возможно.

Если поток данных в пакете требует разбора с учетом региональных особенностей, рекомендуется использовать стандартный разбор вместо быстрого разбора. Например, быстрый анализ не распознает данные, чувствительные к языковому стандарту, которые включают десятичные символы, такие как запятая, форматы дат, отличные от формата год-месяц-дата, и символы валют.

Усеченные представления, подразумевающие одну или несколько частей дат, таких как столетие, год или месяц, не распознаются быстрым анализом. Например, быстрый анализ не распознает формат "-YMM", который указывает год и месяц в подразумеваемом веке, а также "-ММ", который указывает месяц в подразумеваемом году. Однако некоторые представления, имеющие меньшую точность, распознаются. Например, быстрый синтаксический анализ распознает формат hhmm;, указывающий только час и минуту, и "ГГГГ", который указывает только год.

Быстрый разбор указан на уровне столбца. В источнике плоских файлов и трансформации преобразования данных можно указать быструю проверку синтаксиса на выходных столбцах. Входные и выходные данные могут содержать как столбцы, чувствительные к языковому стандарту, так и нечувствительные.

Дополнительные сведения о форматах данных, поддерживаемых быстрым анализом, см. в разделе "Числовые форматы данных " и "Форматы даты и времени".

Настройка быстрого синтаксического анализа