你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
数据生命周期管理
数据生命周期管理是使用某些策略来有效管理系统中存在的数据的做法。 这些策略应包括可驱动数据管理过程的总体存储和数据策略。 由于业务目标和驱动因素决定数据生命周期管理策略,因此它们通常与整体 IT 治理和管理以及服务级别协议 (SLA) 的框架关联。
一旦知道你的数据类型及其使用方式,你就知道了它最有可能的演变和“命运”。 你需要了解数据的演变方式、确定数据增长方式、监视其使用情况随时间的变化、决定其应存在多长时间,并遵守应用于该数据的所有规则和法规。
数据生命周期管理使用流程、策略和软件的组合来解决这些需求,以便团队可以对数据生命周期的每个阶段使用适当的技术。
数据的生命周期
数据产品可能有不同的生命周期。 在典型的生命周期模式中,新引入的数据经常被使用和访问。 随着时间的推移,其访问率通常会下降,较旧的数据会出现使用率急剧下降的情况。
不过,数据生命周期可能与这种典型模式不同。 某些数据在初次引入后可能保持未使用状态,或在存储后就很少被访问。 某些数据产品可能在创建后几天或几个月过期,而另一些数据产品在其整个生存期内都被频繁使用和修改。
大多数地方都规定了数据(如个人数据和会计数据)必须存储的时长。 特定的国家/地区可能会要求将进出发票、现金簿余额、银行凭证和工资单等数据的主要文件保留五年。 还可能要求将辅助文档保留三到五年,其中包括信件、协议、备注等。
管理数据生命周期
可通过两种方法在云规模分析中进行数据生命周期管理。
- 可以使用每个包含持久化数据的 Azure 服务的内置数据生命周期功能,例如 Azure Data Lake。 此方法适用于将数据移到冷层和存档层,但无法确保数据在指定时间过后被删除。
重要
区域冗余存储帐户当前不支持存档层。 有关详细信息,请参阅数据冗余。
- 可以在加入过程中集成数据生命周期,使应用程序业务所有者有机会定义其数据生命周期策略。 此过程涉及一个自定义应用程序,用于将关键指标捕获到每个数据产品的元数据标准中。 此方法的一部分涉及将数据从热层移到冷层再移到存档层,并确保在指定时间过后删除数据。