Genomics データ レイク

Genomics データ レイクは、無料でアクセスでき、お使いのゲノミクス解析のワークフローやアプリケーションに統合できるさまざまな公開データセットを提供しています。 データセットには、ゲノム配列、変異情報、被験者/サンプルのメタデータが BAM、FASTA、VCF、CSV ファイル形式で含まれています。

Genomics Data Lake は米国西部 2 および米国中西部 Azure リージョンでホストされています。 アフィニティのため、米国西部 2 と米国中西部にコンピューティング リソースを割り当てることをお勧めします。

注意

データセットの使用は、データセットの所有者により設定された使用条件に基づきます。 適用される使用条件については、各データセットの詳細ページをご覧ください。

データセット

データセット 説明
Illumina Platinum Genomes Illumina Platinum Genomes
Human Reference Genomes Human Reference Genomes
ClinVar Annotations ClinVar Annotations
SnpEff SnpEff: ゲノム バリアントのアノテーションと機能効果予測のツールボックス
gnomAD gnomAD: ゲノム集計データベース
1000 ゲノム 1000 ゲノム
OpenCravat OpenCravat: 変異のオープン カスタム ランク付け分析ツールキット
ENCODE ENCODE: DNA 要素の百科事典
GATK Resource Bundle GATK リソース バンドル
TCGA Open Data TCGA Open Data
Pan UK-Biobank Pan UK-Biobank

次のステップ

Open Datasets カタログの残りのデータセットを表示します。