导入图像

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

将图像从 Azure BLOB 存储数据集

类别: OpenCV 库模块

注意

适用于:机器学习 Studio (经典) 应用

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用 机器学习 Studio (经典 ) 中的"导入图像"模块从 Azure Blob 存储获取多个图像,并基于这些映像创建图像数据集。

使用此模块将图像从 Blob 存储加载到工作区时,每个图像将转换为红色、绿色和蓝色通道的一系列数值以及图像文件名。 此类图像的数据集由表中的多行组成,每个行都有一组不同的 RGB 值和相应的图像文件名。 有关如何准备映像和连接到 Blob 存储的说明,请参阅 如何导入映像

转换所有图像后,可以将此数据集传递到评分模型模块,并连接预先训练的图像分类模型以预测图像类型。

可以导入任何类型的用于机器学习的图像;但是,存在一些限制,包括可以处理的图像的类型和大小,请参阅技术 说明 部分。

如何使用导入图像

此示例假定你已将多个映像上传到 Azure Blob 存储中的帐户。 映像位于仅为该目的指定的容器中。 一般来说,每个图像必须相当小,并且具有相同的维度和颜色通道。 有关适用于映像的要求的详细列表,请参阅技术 说明 部分。

  1. 将" 导入图像" 模块添加到工作室中的试验 (经典) 。

  2. 添加" 预先训练的级联图像分类" 和" 评分模型" 模块。

  3. "导入图像 "模块中,配置映像的位置,并提供身份验证方法(专用或公共):

    • 如果映像集位于已配置为通过 SAS (共享访问签名进行公共访问) ,请键入包含映像的容器的 URL。

    • 如果映像存储在 Azure 存储中的专用帐户中,请选择"帐户",然后键入在管理门户中显示的帐户名称。 然后,粘贴主帐户密钥或辅助帐户密钥。

    • 对于 "容器的路径",请仅键入容器名称,而不要键入其他路径元素。

  4. 连接将图像导入评分模型模块的输出。

  5. 运行试验。

结果

输出数据集的每一行都包含来自一个图像的数据。 行按图像名称的字母顺序排序,列按以下顺序包含以下信息:

  • 第一列包含图像名称。
  • 所有其他列包含依次来自红色、绿色和蓝色颜色通道的平化数据。
  • 透明度通道将被忽略。

根据图像的颜色深度和图像格式,单个图像可能有数千列。 因此,若要查看试验结果,建议添加"选择数据集中的列 " 模块,并仅选择以下列:

  • 映像名称
  • 评分标签
  • 评分概率

技术说明

本部分包含实现详细信息、提示和常见问题解答

支持的图像格式

导入 图像 模块通过读取内容的前几个字节(而不是文件扩展名)确定图像的类型。 根据该信息,它确定映像是否是受支持的图像格式之一。

  • Windows位图文件:.bmp、.dib
  • JPEG 文件:.jpeg、.jpg、.jpe
  • JPEG 2000 文件:.jp2
  • 可移植网络图形:.png
  • 可移植图像格式:.pbm、.pgm、.ppm
  • Sun Raster:.sr、.ras
  • TIFF 文件:.tiff、.tif

图像要求

以下要求适用于导入图像模块 处理 的图像:

  • 所有图像都必须具有相同的形状。
  • 所有图像必须具有相同的颜色通道。 例如,不能将灰度图像与 RBG 图像混合使用。
  • 每个图像限制为 65536 个像素。 但是,图像数量不受限制。
  • 如果将 Blob 容器指定为源,则容器不得包含其他类型的数据。 在运行模块之前,请确保容器仅包含映像。

其他限制

  • 如果打算使用预 训练 级联图像分类模块,请注意,它目前仅支持识别正面视图中的人脸;其他图像分类器尚不可用。

  • 不能将图像数据集用于以下模块:训练、交叉验证模型

模块参数

名称 范围 类型 默认 说明
请指定身份验证类型 列表 AuthenticationType 帐户 公共或共享访问签名 (SAS) URI 或用户凭据
URI 任意 字符串 具有 SAS 或公共访问权限的统一资源标识符
帐户名称 任意 字符串 Azure 存储帐户的名称
帐户密钥 任意 SecureString 与 Azure 存储帐户关联的密钥
容器、目录或 Blob 的路径 任意 字符串 Blob 或表名称的路径

输出

名称 类型 说明
结果数据集 数据表 包含已下载图像的数据集

例外

异常 描述
错误 0003 如果一个或多个输入为 null 或为空,则会发生异常。
错误 0029 传递无效的 URI 时,会发生异常。
错误 0009 如果错误地指定了 Azure 存储帐户名称或容器名称,则会发生异常。
错误 0015 如果数据库连接失败,则会发生异常。
错误 0030 不能下载文件时,会发生异常。
错误 0049 不能分析文件时,会发生异常。
错误 0048 不能打开文件时,会发生异常。

有关特定于工作室和经典 (模块) 的列表,请参阅机器学习代码

有关 API 异常的列表,请参阅机器学习 REST API代码

另请参阅

预先训练的级联图像分类
A-Z 模块列表