你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

1000 基因组

千人基因组计划在 2008 年到 2015 年间开展,目的是建立人类变异和基因型数据的最大公共目录。 最终数据集包含 2,504 个人的数据,他们来自 26 个种群和 8400 万可识别变体。 有关详细信息,请参阅千人基因组计划网站和以下发布内容:

试点分析:基于大规模人群测序的人类基因组变异图谱 Nature 467, 1061-1073(2010 年 10 月 28 日)

第一阶段分析:基于 1,092 个人类基因组的遗传变异综合图谱 Nature 491, 56-65(2012 年 11 月 1 日)

第 3 阶段分析:人类遗传变异的全球参考 Nature 526, 68-74(2015 年 10 月 1 日)和 2,504 个人类基因组的结构变异综合图谱 Nature 526, 75-81

有关相关数据格式的详细信息,请访问此资源

[新]:该数据集也以 Parquet 格式提供。

注意

Microsoft 按“原样”提供 Azure 开放数据集。 Microsoft 对数据集的使用不提供任何担保(明示或暗示)、保证或条件。 在当地法律允许的范围内,Microsoft 对使用数据集而导致的任何损害或损失不承担任何责任,包括直接、必然、特殊、间接、偶发或惩罚性损害或损失。

此数据集是根据 Microsoft 接收源数据的原始条款提供的。 数据集可能包含来自 Microsoft 的数据。

数据源

此数据集是 FTP 资源的镜像。

数据卷和更新频率

此数据集包含大约 815 TB 的数据。 它接收每日更新。

使用条款

在最终发布之后,千人基因组计划中的数据将公开提供,任何人都可以根据数据集源提供的条款使用这些数据。 使用数据时,应根据千人基因组计划常见问题解答资源中提供的详细信息注明出处。

联系人

此资源处向下滚动以获取联系人信息。

后续步骤

查看开放数据集目录中的其余数据集。