Бөлісу құралы:


Функции преобразования в потоке данных для сопоставления

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения о функциях и выражениях, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.

Список функций преобразования

Функции преобразования используются для преобразования данных и проверки типов данных.

Функция преобразования Задача
ascii Возвращает числовое значение входного символа. Если входная строка имеет несколько символов, возвращается числовое значение первого символа.
char Возвращает символ ascii, представленный входным номером. Если число больше 256, результат эквивалентен char(число % 256)
расшифровывать Декодирует закодированные входные данные в строку на основе заданного набора символов. Второй (необязательный) аргумент можно использовать для указания используемого набора символов : US-ASCII, ISO-8859-1, UTF-8 (по умолчанию), UTF-16BE, UTF-16LE, UTF-16LE, UTF-16.
кодировать Кодирует входные строковые данные в двоичный файл на основе charset. Второй (необязательный) аргумент можно использовать для указания используемого набора символов : US-ASCII, ISO-8859-1, UTF-8 (по умолчанию), UTF-16BE, UTF-16LE, UTF-16LE, UTF-16.
isBitSet Проверяет, задана ли битовая позиция в этом битовом наборе
setBitSet Задает битовые позиции в этом битовом наборе
isBoolean Проверяет, является ли строковое значение логическим значением в соответствии с правилами toBoolean().
isByte Проверяет, является ли строковое значение байтовым значением, заданным с использованием необязательного формата в соответствии с правилами toByte().
isDate Проверяет, является ли входная строка даты датой, используя необязательный формат входной даты. Доступные форматы приведены в описании SimpleDateFormat в Java. Если формат входной даты не указан, формат по умолчанию — yyyy-[M]M-[d]d. Допустимые форматы: [ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ]
isShort Проверяет, является ли строковое значение коротким, заданным с использованием необязательного формата в соответствии с правилами toShort()
isInteger Проверяет, является ли строковое значение целым числом, заданным с использованием необязательного формата в соответствии с правилами toInteger().
isLong Проверяет, является ли строковое значение числом long, заданным с использованием необязательного формата в соответствии с правилами toLong().
isNan Проверяет, не является ли значение числом.
isFloat Проверяет, является ли строковое значение числом с плавающей точкой, заданным с использованием необязательного формата в соответствии с правилами toFloat().
isDouble Проверяет, является ли строковое значение значением double, заданным с использованием необязательного формата в соответствии с правилами toDouble().
isDecimal Проверяет, является ли строковое значение десятичным значением, заданным с использованием необязательного формата в соответствии с правилами toDecimal()
isTimestamp Проверяет, является ли входная строка даты меткой времени с использованием необязательного формата входной метки времени. Доступные форматы приведены в описании SimpleDateFormat в Java. Если метка времени опущена, используется формат по умолчанию: yyyy-[M]M-[d]d hh:mm:ss[.f...]. Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". Метка времени поддерживает точность до миллисекунд и значение до 999. Доступные форматы приведены в описании SimpleDateFormat в Java.
toBase64 Кодирует указанную строку в формат Base64.
toBinary Преобразовывает все числовые значения, дату, метку времени, строку в двоичное представление.
toBoolean Преобразовывает значение ('t ", "true", "y" "yes","1") в значение true, ("f", "false", "n", "no","0") в false и значение NULL для любых других значений.
toByte Преобразовывает любое числовое или строковое значение в байтовое значение. Для преобразования может использоваться дополнительный десятичный формат Java.
toDate Преобразует строку даты ввода в дату, используя необязательный формат даты ввода. Доступные форматы приведены в описании класса Java SimpleDateFormat. Если формат даты ввода не указан, формат по умолчанию — гггг-[М]М-[д]д. Допустимые форматы: [ гггг, гггг-[М]М, гггг-[М]М-[д]д, гггг-[М]М-[д]д* ].
toDecimal Преобразует любое числовое значение или строку в десятичное значение. Если точность и масштаб не указаны, по умолчанию используется значение (10,2). Для преобразования может использоваться дополнительный десятичный формат Java. Необязательный формат языкового стандарта в формате языка BCP47, например en-US, zh-CN.
toDouble Преобразует любое числовое значение или строку в двойное значение. Для преобразования может использоваться дополнительный десятичный формат Java. Необязательный формат языкового стандарта в формате языка BCP47, например en-US, zh-CN.
toFloat Преобразует любое числовое или строковое значение в плавающее. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение double.
toInteger Преобразует любое числовое или строковое значение в целое. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение long, float, double.
toLong Преобразует любое числовое или строковое значение в длинное. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение float, double.
toShort Преобразует любое числовое или строковое значение в короткое. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение integer, long, float, double.
toString Преобразует примитивный тип данных в строку. Для чисел и даты можно указать формат. Если формат не задан, выбирается значение по умолчанию. Для чисел используется десятичный формат Java, Все возможные форматы даты приведены в описании SimpleDateFormat в Java; формат по умолчанию — гггг-ММ-дд.
toTimestamp Преобразует строку в метку времени на основе указанного формата метки времени (необязательно). Если метка времени опущена, используется формат по умолчанию: гггг-[М]М-[д]д чч:мм:сс[доля секунды]. Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". Метка времени поддерживает точность до миллисекунд и значение до 999. Доступные форматы приведены в описании класса Java SimpleDateFormat. https://docs.oracle.com/javase/8/docs/api/java/text/SimpleDateFormat.html.
toUTC Преобразует метку времени в формат UTC. Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". По умолчанию используется текущий часовой пояс. Доступные форматы приведены в описании класса Java SimpleDateFormat. https://docs.oracle.com/javase/8/docs/api/java/text/SimpleDateFormat.html.