基因體學資料湖

「基因體學資料湖」提供多種公開資料集,可供您免費存取,並整合到您的基因體分析工作流程及應用程式。 本資料集包含基因體序列、變異資訊,以及 BAM、FASTA、VCF、CSV 檔案格式的主體/樣本中繼資料。

Genomics Data Lake 裝載於美國西部 2 與美國中西部 Azure 區域。 建議您在美國西部 2 和美國中西部配置計算資源,以確保同質性。

注意

使用資料集須遵守資料集擁有者設立的條款及條件。 有關適用的條款及條件,請參閱各資料集的詳細資料頁面。

資料集

資料集 描述
Illumina Platinum Genomes Illumina Platinum Genomes
人類參考基因體 人類參考基因體
ClinVar 註釋 ClinVar 註釋
SnpEff SnpEff:Genomic variant annotations and functional effect prediction toolbox (SnpEff:基因變異註解和實用的影響預測工具箱)
gnomAD gnomAD:基因組彙總資料庫
千人基因組 千人基因組
OpenCravat OpenCravat:開啟變異工具組的自訂排名分析
編碼 ENCODE:DNA 元素的百科全書
GATK 資源搭售方案 GATK 資源搭售方案
TCGA 開放式資料 TCGA 開放式資料
Pan UK-Biobank 移動流覽 UK-Biobank

後續步驟

檢視開放資料集目錄中的其餘資料集。