你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

映射数据流中的转换函数

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖了从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

数据流在 Azure 数据工厂管道和 Azure Synapse Analytics 管道中都可用。 本文适用于映射数据流。 如果你不熟悉转换,请参阅介绍性文章: 使用映射数据流转换数据

本文详细介绍了 Azure 数据工厂和 Azure Synapse Analytics 在映射数据流中支持的表达式和函数。

转换函数列表

转换函数用于转换数据和数据类型测试

转换函数 任务
ascii 返回输入字符的数值。 如果输入字符串有多个字符,则返回第一个字符的数值。
char 返回由输入编号表示的 ASCII 字符。 如果数字大于 256,则结果等效于 char(数字 % 256)。
decode 根据特定的字符集将编码的输入数据解码为字符串。 可以使用第二个(可选)参数来指定要使用的字符集:US-ASCII、、 ISO-8859-1UTF-8(默认值)、UTF-16BEUTF-16LEUTF-16
encode 根据字符集将输入字符串数据编码为二进制。 可以使用第二个(可选)参数来指定要使用的字符集:US-ASCII、、 ISO-8859-1UTF-8(默认值)、UTF-16BEUTF-16LEUTF-16
isBitSet 检查是否在此位集中设置了位的位置。
setBitSet 在此位集中设置位的位置。
isBoolean 根据以下规则 toBoolean()检查字符串值是否为布尔值。
isByte 根据以下规则检查字符串值是否为给定可选格式的 toByte()字节值。
isDate 使用可选的输入日期格式检查输入日期字符串是否为日期。 请参阅 Java 的 SimpleDateFormat 类,了解可用格式。 如果省略输入日期格式,则默认格式为 yyyy-[M]M-[d]d。 接受的格式为 [ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ]
isShort 根据 toShort() 规则检查给定可选格式的字符串值是否过短。
isInteger 根据以下规则检查字符串值是否为给定可选格式的 toInteger()整数值。
isLong 根据 toLong() 规则检查给定可选格式的字符串值是否过长。
isNan 检查值是否不是数字。
isFloat 根据以下规则检查字符串值是否为给定可选格式的 toFloat()浮点值。
isDouble 根据 toDouble() 规则检查给定可选格式的字符串值是否为双精度值。
isDecimal 根据 规则 toDecimal()检查字符串值是否为给定可选格式的十进制值。
isTimestamp 使用可选的输入时间戳格式检查输入日期字符串是否为时间戳。 请参阅 Java 的 SimpleDateFormat 类,了解可用格式。 如果省略时间戳,则使用默认模式 yyyy-[M]M-[d]d hh:mm:ss[.f...] 。 可以通过GMTPSTUTCAmerica/Cayman的形式传递可选时区。 Timestamp 支持最多毫秒的准确性,值为 999。 请参阅 Java 的 SimpleDateFormat 类,了解可用格式。
toBase64 在 base64 中对特定字符串进行编码。
toBinary 将任何数值/日期/时间戳/字符串转换为二进制表示形式。
toBoolean 将值(ttrueyyes1)转换为true,将(ffalsenno0)转换为false,并将任何其他值转换为NULL
toByte 将任何数字或字符串转换为字节值。 可以使用可选的 Java 小数格式进行转换。
toDate 使用可选的输入日期格式将输入日期字符串转换为日期。 请参阅 Java 的 SimpleDateFormat 类,了解可用格式。 如果省略输入日期格式,则默认格式为 yyyy-[M]M-[d]d。 接受的格式为 [ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ]
toDecimal 将任何数字或字符串转换为小数值。 如果未指定精度和小数位数,则默认为 (10,2)。 可以使用可选的 Java 小数格式进行转换。 使用 BCP47 语言(如 en-US、de 或 zh-CN)形式的可选区域设置格式。
toDouble 将任何数字或字符串转换为双精度值。 可以使用可选的 Java 小数格式进行转换。 使用 BCP47 语言(如 en-US、de 或 zh-CN)形式的可选区域设置格式。
toFloat 将任何数字或字符串转换为浮点值。 可以使用可选的 Java 小数格式进行转换。 截断任何双精度数。
toInteger 将任何数字或字符串转换为整数值。 可以使用可选的 Java 小数格式进行转换。 截断任何长整型数、浮点数、双精度数。
toLong 将任何数字或字符串转换为长值。 可以使用可选的 Java 小数格式进行转换。 截断任何浮点数、双精度数。
toShort 将任何数字或字符串转换为短值。 可以使用可选的 Java 小数格式进行转换。 截断任何整数、长整型数、浮点数、双精度数。
toString 将基元数据类型转换为字符串。 可以指定数字和日期的格式。 如果未指定,则选择系统默认值。 Java 十进制格式用于数字。 有关所有可能的日期格式,请参阅 Java 的 SimpleDateFormat 类。 默认格式为 yyyy-MM-dd.
toTimestamp 根据可选的时间戳格式将字符串转换为时间戳。 如果省略时间戳,则使用默认模式 yyyy-[M]M-[d]d hh:mm:ss[.f...] 。 你可以采用GMTPSTUTCAmerica/Cayman的形式传递可选时区。 Timestamp 支持最多毫秒的准确性,值为 999。 有关SimpleDateFormat,请参阅 Java 的类。
toUTC 将时间戳转换为 UTC。 可以通过GMTPSTUTCAmerica/Cayman的形式传递可选时区。 默认为当前时区。 有关SimpleDateFormat,请参阅 Java 的类。