Поделиться через


Функции преобразования в потоках данных с отображением

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны как в конвейерах Фабрики данных Azure, так и в конвейерах Azure Synapse Analytics. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, ознакомьтесь с вводной статьей "Преобразование данных с помощью потоков данных сопоставления".

В этой статье содержатся сведения о выражениях и функциях, поддерживаемых фабрикой данных Azure и Azure Synapse Analytics в сопоставлении потоков данных.

Список функций преобразования

Функции преобразования используются для преобразования данных и проверки типов данных.

Функция преобразования Задача
ascii Возвращает числовое значение входного символа. Если входная строка имеет несколько символов, возвращается числовое значение первого символа.
char Возвращает символ ASCII, представленный входным номером. Если число больше 256, результат эквивалентен символу (число % 256).
расшифровывать Декодирует закодированные входные данные в строку на основе определенного набора символов. Можно использовать второй (необязательный) аргумент, чтобы указать, какой набор символов следует использовать: US-ASCII, , ISO-8859-1UTF-8 (по умолчанию), UTF-16BEUTF-16LE, или UTF-16.
кодировать Кодирует входные строковые данные в двоичный файл на основе charset. Можно использовать второй (необязательный) аргумент, чтобы указать, какой набор символов следует использовать: US-ASCII, , ISO-8859-1UTF-8 (по умолчанию), UTF-16BEUTF-16LE, или UTF-16.
isBitSet Проверяет, задана ли битовая позиция в этом битовом наборе.
setBitSet Задает битовые позиции в этом битовом наборе.
isBoolean Проверяет, является ли строковое значение логическим значением в соответствии с правилами toBoolean().
isByte Проверяет, является ли строковое значение байтовым значением, заданным необязательным форматом в соответствии с правилами toByte().
isDate Проверяет, является ли строка входной даты датой с помощью необязательного формата входной даты. Доступные форматы приведены в описании класса Java SimpleDateFormat. Если формат входной даты опущен, формат по умолчанию равен yyyy-[M]M-[d]d. Допустимые форматы.[ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ]
isShort Проверяет, является ли строковое значение коротким, заданным необязательным форматом в соответствии с правилами toShort().
isInteger Проверяет, является ли строковое значение целым значением, заданным необязательным форматом в соответствии с правилами toInteger().
isLong Проверяет, является ли строковое значение длинным значением, заданным необязательным форматом в соответствии с правилами toLong().
isNan Проверяет, не является ли значение числом.
isFloat Проверяет, является ли строковое значение значением с плавающей запятой, заданным необязательным форматом в соответствии с правилами toFloat().
isDouble Проверяет, является ли строковое значение двойным значением, заданным необязательным форматом в соответствии с правилами toDouble().
isDecimal Проверяет, является ли строковое значение десятичным значением, заданным необязательным форматом в соответствии с правилами toDecimal().
isTimestamp Проверяет, является ли строка входной даты меткой времени с помощью необязательного формата метки времени. Доступные форматы приведены в описании класса Java SimpleDateFormat. Если метка времени опущена, используется шаблон yyyy-[M]M-[d]d hh:mm:ss[.f...] по умолчанию. Вы можете передать необязательный часовой пояс в виде GMT, PSTUTCи America/Cayman. Timestamp поддерживает точность до миллисекунды со значением до 999. Доступные форматы приведены в описании класса Java SimpleDateFormat.
toBase64 Кодирует определенную строку в base64.
toBinary Преобразует любую числовую/дату/ метку времени/строку в двоичное представление.
toBoolean Преобразует значение (t, true, y, yes, 1) в true, и (f, false, n, no, 0) в false, а любое другое значение в NULL.
toByte Преобразовывает любое числовое или строковое значение в байтовое значение. Для преобразования можно использовать необязательный десятичный формат Java.
toDate Преобразует входную строку даты в дату с помощью необязательного формата входной даты. Доступные форматы приведены в описании класса Java SimpleDateFormat. Если формат входной даты опущен, формат по умолчанию равен yyyy-[M]M-[d]d. Допустимые форматы.[ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ]
toDecimal Преобразует любое числовое значение или строку в десятичное значение. Если точность и масштаб не указаны, по умолчанию используется (10,2). Для преобразования можно использовать необязательный десятичный формат Java. Используйте опциональный формат в виде языкового стандарта BCP47, такого как en-US, de или zh-CN.
toDouble Преобразует любое числовое значение или строку в двойное значение. Для преобразования можно использовать необязательный десятичный формат Java. Используйте опциональный формат в виде языкового стандарта BCP47, такого как en-US, de или zh-CN.
toFloat Преобразует любое числовое или строковое значение в плавающее. Для преобразования можно использовать необязательный десятичный формат Java. Усекает любое значение double.
toInteger Преобразует любое числовое или строковое значение в целое. Для преобразования можно использовать необязательный десятичный формат Java. Усекает любое значение long, float, double.
toLong Преобразует любое числовое или строковое значение в длинное. Для преобразования можно использовать необязательный десятичный формат Java. Усекает любое значение float, double.
toShort Преобразует любое числовое или строковое значение в короткое. Для преобразования можно использовать необязательный десятичный формат Java. Усекает любое значение integer, long, float, double.
toString Преобразует примитивный тип данных в строку. Можно указать формат чисел и дат. Если не указано, системное значение по умолчанию выбирается. Десятичный формат Java используется для чисел. Ознакомьтесь с классом Java SimpleDateFormat для всех возможных форматов дат. Формат по умолчанию — yyyy-MM-dd.
toTimestamp Преобразует строку в метку времени с опциональным форматом метки времени. Если метка времени опущена, используется шаблон yyyy-[M]M-[d]d hh:mm:ss[.f...] по умолчанию. Вы можете передать необязательный часовой пояс в виде GMT, PSTUTCи America/Cayman. Timestamp поддерживает точность до миллисекунды со значением до 999. Ознакомьтесь с классом Java SimpleDateFormat для доступных форматов.
toUTC Преобразует метку времени в формате UTC. Вы можете передать необязательный часовой пояс в виде GMT, PSTUTCи America/Cayman. По умолчанию используется текущий часовой пояс. Ознакомьтесь с классом Java SimpleDateFormat для доступных форматов.