从 Azure 存储获取数据
本文介绍如何将数据从 Azure 存储(ADLS Gen2 容器、Blob 容器或单个 Blob)获取到新的表或现有表。
在 KQL 数据库的下方功能区中,选择“获取数据”。
在“获取数据”窗口中,选中了“源”选项卡。
从可用列表中选择数据源。 在此示例中,你将从 Azure 存储引入数据。
选择目标表。 如果要将数据引入新表中,请选择 + 新表 并输入表名称。
备注
表名最多可包含 1024 个字符,包括空格、字母数字、连字符和下划线。 不支持特殊字符。
若要添加数据源,请将存储连接字符串粘贴到 URI 字段中,然后选择 +。 下表列出了支持的身份验证方法和从 Azure 存储引入数据所需的权限。
备注
- 最多可以添加 10 个单个 Blob,也可以从单个容器引入最多 5000 个 Blob。 不能同时引入两者。
- 每个 Blob 最多可以解压缩 1 GB。
如果粘贴了 Blob 容器或 Azure Data Lake Storage Gen2 的连接字符串,则可以添加以下可选筛选器:
设置 |
字段说明 |
文件筛选器(可选) |
|
文件夹路径 |
筛选数据以引入具有特定文件夹路径的文件。 |
文件扩展名 |
筛选数据以仅引入具有特定文件扩展名的文件。 |
选择“下一步”
此时会打开“检查”选项卡,其中包含数据的预览。
要完成引入过程,请选择“完成”。
可选:
- 选择 命令查看器 以查看和复制从输入生成的自动命令。
- 使用“架构定义文件”下拉列表更改从中推断架构的文件。
- 通过从下拉列表中选择所需格式来更改自动推断的数据格式。 有关详细信息,请参阅由 Real-Time Intelligence 支持的数据格式。
- 编辑列。
- 浏览基于数据类型的高级选项。
备注
- 对于表格格式(CSV、TSV、PSV),不能映射列两次。 若要映射到现有列,请先删除新列。
- 无法更改现有列类型。 如果尝试映射到其他格式的列,结果可能出现空列。
可以在表中所做的更改取决于以下参数:
- 表类型为“新”或“现有”
- 映射类型为“新”或“现有”
表类型 |
映射类型 |
可用调整 |
新建表 |
新映射 |
重命名列、更改数据类型、更改数据源、映射转换、添加列、删除列 |
现有表 |
新映射 |
添加列(然后可以更改数据类型、重命名和更新) |
现有表 |
现有映射 |
没有 |
某些数据格式映射(Parquet、JSON 和 Avro)支持简单的引入时间转换。 若要应用映射转换,请在 编辑列 窗口中创建或更新列。
可以对字符串或日期时间类型的列执行映射转换,源的数据类型为 int 或 long。 支持的映射转换为:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
表格(CSV、TSV、PSV):
JSON:
如果数据引入成功完成,则“数据准备”窗口中的所有三个步骤都会带有绿色的对勾标记。 可以选择要查询的卡,下拉引入的数据,也可以查看引入摘要的仪表板。
- 若要管理数据库,请参阅 管理数据
- 若要创建、存储和导出查询,请参阅 KQL 查询集中的 查询数据