你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft Foundry 中Azure销售的模型的数据、隐私和安全性

重要

仅为方便起见,提供非英语翻译。 查看此文档的版本,以获取权威版本。

本文提供有关您向 Microsoft Foundry 中由 Azure 销售的 Foundry Models 提供的数据如何被处理、使用和存储的详细信息。 “由 Azure 销售的模型”是指在 Foundry 中被指定并部署为此类模型的 AI 模型,包括 Azure OpenAI 模型在内。 Azure 销售的模型会存储和处理数据,以提供服务并监控是否存在违反适用产品条款的使用行为。 另请参阅Microsoft产品和服务数据保护附录,该附录控制由Azure销售的模型处理数据。 Foundry 是一项Azure服务;学习更多有关适用的Azure合规性产品/服务。

重要

您的提示(输入)和完成(输出)、嵌入以及训练数据:

  • 对其他客户不可用。
  • 不适用于 OpenAI 或其他由 Azure 销售的模型提供商。
  • Azure销售的模型提供商不使用它们来改进其模型或服务。
  • 未经你的许可或指示,不会用于训练任何生成式 AI 基础模型。
  • 未经你的明确许可或指示,客户数据、提示和补全不会用于改进 Microsoft 或第三方产品或服务。

由 Azure 销售的您的微调模型仅限您使用。

Foundry 是一项Azure服务;Microsoft托管Microsoft Azure环境中由Azure销售的模型,Azure销售的模型不会与由Azure销售的模型提供商运营的任何服务进行交互,例如 OpenAI(例如 ChatGPT 或 OpenAI API)。

Foundry 如何处理哪些数据来提供由Azure销售的模型?

Foundry 处理以下类型的数据,以提供Azure销售的模型:

  • 提示和生成的内容。 提示由用户提交时,内容由服务通过补全、聊天补全、图像和嵌入操作生成。
  • 已上传的数据。 可以使用文件 API 或矢量存储上传自己的数据以用于某些服务功能(例如 微调助手 API批处理)。
  • 有状态实体的数据。 使用由 Azure 和代理销售的模型的某些可选功能(如 Responses APIAssistants API 的线程功能和存储完成时,服务会根据配置功能的方式创建数据存储来保留消息历史记录和其他内容。
  • 随提示或通过提示包含的增强数据。 使用与有状态实体关联的数据时,服务将从配置的数据存储中检索相关数据,并增加提示以生成与数据相关的代系。 还可以使用从提示本身中包含的源检索到的数据(例如 URL)来增强提示。
  • 训练和验证数据。 你可以提供自己的训练数据,其中包含提示-补全对,用于微调模型

Foundry 如何处理数据以提供Azure销售的模型?

下图演示了数据的处理方式。 此图涵盖多种处理类型:

  1. Foundry 如何通过使用由 Azure 销售的模型进行推理来处理您的提示以生成内容(包括当使用 Azure OpenAI 基于您的数据、助手或批处理将来自指定数据源的额外数据添加到提示中时)。
  2. 助手功能如何存储与消息、线程和运行相关的数据。
  3. 响应 API 功能如何存储数据以持久保存消息历史记录。
  4. Batch 功能如何处理上传的数据。
  5. Foundry 如何使用上传的数据创建微调的(自定义)模型。
  6. Foundry 和 Microsoft 人员如何针对有害内容以及建议以违反行为准则或其他适用产品条款的方式使用服务的模式,分析提示和补全(文本和图像)。

服务的数据流关系图。

如上图所示,托管客户可以申请修改滥用监控。

通过推理生成补全内容、图像或嵌入内容

部署在你的 Foundry 资源中的由 Azure 销售的模型(基础模型或微调模型)会处理你输入的提示词,并生成文本、图像或嵌入响应。 根据配置的阈值,实时评估有害内容类型的提示和完成情况,内容生成会根据配置的阈值进行筛选。 在 Guardrails(以前的内容筛选器)概述中了解详细信息。

提示和响应在客户指定的 地理位置 内处理(除非你使用的是全局部署类型或 DataZone 部署类型),但出于操作目的(包括性能和容量管理)可以在地理位置中的区域之间进行处理。 有关使用全局部署类型或 DataZone 部署类型时处理位置的信息,请参阅下文。

模型是无状态的:模型中不存储任何提示或完成。 此外,提示和补全不会用于训练、重新训练或改进基础模型。

了解“全局”和“数据区域”部署类型的处理位置

除了标准部署之外,Foundry 还提供通过 Azure 部署选项销售的模型,这些选项标记为“Global”和“DataZone”。 对于标记为“全局”的任何部署类型,可以在部署由Azure销售的相关模型的任何地理位置处理提示和响应(详细了解模型的区域可用性)。 对于标记为“DataZone”的任何部署类型,可以在指定数据区域中的任何地理位置(由Microsoft定义)中处理提示和响应。 如果您在位于美国的 Foundry 资源中创建 DataZone 部署,那么提示和响应可以在美国的任何位置进行处理。 如果在位于欧盟成员国的 Foundry 资源中创建 DataZone 部署,则可以在该或任何其他欧盟成员国中处理提示和响应。 对于全局和 DataZone 部署类型,静态存储的任何数据(如上传的数据)以及为全局部署和 DataZone 部署创建的滥用监视数据存储都存储在客户指定的地理位置中。 仅当客户在Azure销售的模型中使用全局部署类型或 DataZone 部署类型时,处理位置才会受到影响;Azure数据处理和合规性承诺仍然适用。

将提示进行增强,以使生成结果以你的数据为基础

借助 Azure OpenAI 的“基于你的数据”功能,可以连接数据源,使生成的结果以你的数据为基础。 数据仍存储在指定的数据源和位置中;Azure OpenAI 不会创建重复的数据存储。 收到用户提示时,服务将从连接的数据源中检索相关数据,并增强提示。 模型处理此扩充提示,并返回生成的内容,如上所述。 详细了解 如何安全地使用“On Your Data”功能

通过 Azure 功能销售的模型的数据存储

由 Azure 提供的某些模型会在该服务中存储数据。 这些数据由客户使用文件 API 或矢量存储上传,或者结合某些有状态实体(如响应 API、助手 API 的线程功能和存储补全)自动存储。 为此类功能存储的数据:

  • 静态存储在客户 Azure 租户中的 Foundry 资源内,并与该资源位于同一地理区域内;
  • 默认情况下,始终使用Microsoft的 AES-256 加密进行静态加密,并可以选择使用客户管理的密钥(某些预览功能可能不支持客户管理的密钥)。 Microsoft托管密钥始终用于确保所有存储数据的基线加密。
  • 客户可以随时删除。

注意

预览版中的模型或功能可能不支持上述所有条件。

存储的数据可用于以下服务功能/特点:

  • 创建一个微调的自定义模型。 详细了解 微调的工作原理。 微调模型专供其数据用于创建微调模型的客户使用,在静态时加密(未部署用于推理时),并且可随时由客户删除。 未经许可或说明,为微调上传的训练数据不用于训练任何生成式 AI 基础模型。
  • 批处理。 详细了解 批处理的工作原理。 批处理属于全局部署类型;静态存储的数据会保留在指定的 Azure 地理区域内,直到有可用的处理能力;处理可能会在 Azure 提供相关模型的任何地理区域中进行(详细了解模型的区域可用性)。
  • 响应 API。 详细了解 响应 API 的工作原理。 此 API 存储消息历史记录以及与消息历史记录相关的其他内容。 这是多轮次对话和工作流所必需的。
  • 助手 API (预览版)。 详细了解 助手 API 的工作原理。 助手的某些功能,例如线程、存储消息历史记录和其他内容。
  • 存储的完成项(预览版)。 存储的完成结果会通过聊天完成 API 存储来自客户部署的 Azure OpenAI 模型(如 GPT-4o)的输入-输出对,并在 Foundry 门户中显示这些对。 这允许客户使用其生产数据生成数据集,然后可用于评估或微调模型(如适用的产品条款所允许)。

防止滥用

为了降低滥用或有害使用的风险,Azure销售的模型包括滥用监视功能。 若要了解有关滥用监视的详细信息,请参阅 滥用监视

微调后的模型的安全评估使用 Azure 的风险和安全指标 来评估微调后的模型是否会产生潜在有害的响应。 服务仅记录生成的评估(可部署或不可部署)。

Azure 销售的模型滥用监控系统旨在检测并缓解重复内容和/或行为,这些情况表明服务的使用方式可能违反行为准则或其他适用的产品条款。 如此处所述,系统采用算法和启发式方法来检测潜在滥用的指标。 检测到这些指标后,可以选择客户提示和完成情况的示例进行评审。 评审由自动化方式进行,包括默认情况下由 LLM 等 AI 模型进行,并根据需要由人工审阅者进行其他评审。 滥用监视中提供了有关自动评审和人工评审的详细信息。

为了自动评审,客户的提示和完成不会由系统存储,也不会用于训练 AI 模型或其他系统。 用于存储提示和生成结果以供人工审查的滥用监控数据存储库,按客户资源进行逻辑隔离(每个请求都包含客户 Foundry 资源的资源 ID)。 在 Azure 销售的模型可用的每个地理区域中,均设有独立的数据存储;客户的提示词和生成内容存储在部署客户 Foundry 资源的 Azure 地理区域内,且位于“Azure 销售的模型”服务边界内。 只有当数据已经被滥用监视系统标记,或者提示语和补全是潜在滥用模式的一部分时,评估潜在滥用的人工审查员才能访问提示语和补全数据。 人工审查者是经过授权的 Microsoft 员工,他们使用请求 ID、安全访问工作站 (SAW) 和团队经理授予的实时 (JIT) 请求审批,通过逐点查询来访问数据。 对于部署在欧洲经济区、由 Azure 销售的模型,经授权的 Microsoft 员工位于欧洲经济区。

如果客户已批准进行修改的滥用监视(在 滥用监视中了解详细信息),则不会执行上述数据存储和人工评审过程。 然而,仍然可以进行自动审查,利用包括 AI 模型在内的算法,在提供了提示语或生成了补全时(视具体情况而定)对其进行审查。 如果此类自动审核检测到客户订阅中包含可能表明存在严重或反复滥用行为的内容,则客户的访问权限可能会受到限制,具体规定见《Microsoft AI 服务负责任使用产品条款》。 客户可能会被要求同意进行带人工审查的滥用监视,以减少将来访问受到限制的风险(例如,检测到滥用时对帐户或订阅进行限流和/或暂停)。

注意

Azure预览版功能(包括预览版中Azure销售的模型)可能会采用不同的隐私做法,包括滥用监视。 预览版可能受补充条款的约束:Microsoft Azure预览版的补充使用条款

防止有害内容生成

Azure销售的模型包括一个旨在检测和防止有害内容的输出的系统。 若要了解有关 Guardrails(以前的内容筛选器)的详细信息,请参阅 Guardrails

护栏在服务处理提示来生成内容时同步出现,如上文和此文所述。 没有提示或生成的内容存储在内容分类器模型中,在未经许可或说明的情况下,不会使用提示和输出来训练任何生成式 AI 基础模型。

客户如何验证用于滥用监测的数据存储是否关闭?

客户有两种方法,一旦批准关闭滥用监视,即可验证滥用监视的数据存储是否已在其批准的Azure订阅中关闭:

  • 使用 Azure 门户,或
  • Azure CLI(或任何管理 API)。

注意

仅当禁用用于滥用监视的数据存储时,“ContentLogging”属性的“false”值才会显示。 否则,此属性将不会显示在Azure门户或Azure CLI的输出中。

先决条件

  1. 登录Azure
  2. 选择托管 Foundry 资源的Azure订阅。
  3. 导航到 Foundry 资源的 “概述 ”页。
  1. 转到“资源概述”页

  2. 单击右上角的 JSON 视图 链接,如下图所示。

    Azure portal 中的日志状态 json 视图。

当滥用监视日志记录关闭时,功能列表中将出现一个名为“ContentLogging”的值,并将其设置为 FALSE。

{ 
    "name":"ContentLogging",
    "value":"false"
}

若要详细了解Microsoft的隐私和安全承诺,请参阅 Microsoft 信任中心

更改日志

日期 变化
2025 年 10 月 3 日 将文档内容扩展至 Azure 销售的模型;将护栏(以前称为内容筛选器)与滥用监控部分拆分开来;补充了有关滥用监控以及严重或反复发生的滥用行为的说明。
2024 年 12 月 17 日 添加了与新存储补全功能相关的数据处理和存储信息;添加了说明文字,澄清预览版中的 Azure OpenAI 功能可能不支持所有数据存储条件;移除了批处理的“预览”标记。
2024 年 11 月 18 日 补充了关于新“数据区域”部署类型的数据处理位置的信息;补充了关于新增 AI 对提示和补全内容进行审查的信息,这是防止滥用和生成有害内容措施的一部分
2024 年 9 月 4 日 添加了有关新功能数据处理的信息(并相应地修改了现有文本),包括助手 API(预览版)、Batch(预览版)和全局部署;修订了与数据处理位置相关的语言,根据Azure数据驻留原则;添加了有关数据处理的信息,以便对微调模型的安全评估;阐明了与使用提示和完成相关的承诺;次要修订以提高清晰度
2023 年 6 月 23 日 添加了有关新的 Azure“基于你的数据”功能的数据处理的信息;删除了有关滥用监视的信息,这些信息现在可以在 Azure OpenAI 服务滥用监视中查看。 添加了摘要说明。 更新和简化了内容,并更新了图示,以提高清晰度。 添加了更改日志

另请参阅