Data Lake Microsoft Genomics
Data Lake Genomics menyediakan berbagai himpunan data publik yang dapat Anda akses secara gratis dan terintegrasi ke dalam alur kerja dan aplikasi analisis genomika Anda. Himpunan data ini mencakup urutan genom, info varian, dan metadata subjek/sampel dalam format file BAM, FASTA, VCF, CSV.
Data Lake Microsoft Genomics di-hosting di wilayah Azure US Barat 2 dan Barat Sentral AS. Sebaiknya alokasikan sumber daya komputasi di US Barat 2 atau Barat Sentral AS untuk afinitas.
Catatan
Penggunaan himpunan data tunduk pada syarat dan ketentuan yang ditetapkan oleh pemilik himpunan data. Lihat halaman detail untuk setiap himpunan data untuk syarat dan ketentuan yang berlaku.
Himpunan data
Himpunan data | Deskripsi |
---|---|
Genom Illumina Platinum | Illumina Platinum Genomes |
Genom Referensi Manusia | Human Reference Genomes |
Anotasi ClinVar | Anotasi ClinVar |
SnpEff | SnpEff: Anotasi dan fungsi varian genomik memengaruhi kotak alat prediksi |
gnomAD | gnomAD: Database Agregasi Genome |
1000 Genom | 1000 Genomes |
OpenCravat | OpenCravat: Analisis Peringkat Kustom Terbuka dari Kotak Alat Varian |
MENGKODEKAN | ENCODE: Ensiklopedia Elemen DNA |
Bundel Sumber Daya GATK | Bundel Sumber Daya GATK |
Data Terbuka TCGA | Data Terbuka TCGA |
Pan UK-Biobank | Pan UK-Biobank |
Database ImmuneCODE | Database ImmuneCODE |
Buka himpunan data Target | Buka himpunan data Target |
Langkah berikutnya
Lihat himpunan data lainnya di katalog Open Datasets.