Bagikan melalui


Data Lake Microsoft Genomics

Data Lake Genomics menyediakan berbagai himpunan data publik yang dapat Anda akses secara gratis dan terintegrasi ke dalam alur kerja dan aplikasi analisis genomika Anda. Himpunan data ini mencakup urutan genom, info varian, dan metadata subjek/sampel dalam format file BAM, FASTA, VCF, CSV.

Data Lake Microsoft Genomics di-hosting di wilayah Azure US Barat 2 dan Barat Sentral AS. Sebaiknya alokasikan sumber daya komputasi di US Barat 2 atau Barat Sentral AS untuk afinitas.

Catatan

Penggunaan himpunan data tunduk pada syarat dan ketentuan yang ditetapkan oleh pemilik himpunan data. Lihat halaman detail untuk setiap himpunan data untuk syarat dan ketentuan yang berlaku.

Himpunan data

Himpunan data Deskripsi
Genom Illumina Platinum Illumina Platinum Genomes
Genom Referensi Manusia Human Reference Genomes
Anotasi ClinVar Anotasi ClinVar
SnpEff SnpEff: Anotasi dan fungsi varian genomik memengaruhi kotak alat prediksi
gnomAD gnomAD: Database Agregasi Genome
1000 Genom 1000 Genomes
OpenCravat OpenCravat: Analisis Peringkat Kustom Terbuka dari Kotak Alat Varian
MENGKODEKAN ENCODE: Ensiklopedia Elemen DNA
Bundel Sumber Daya GATK Bundel Sumber Daya GATK
Data Terbuka TCGA Data Terbuka TCGA
Pan UK-Biobank Pan UK-Biobank
Database ImmuneCODE Database ImmuneCODE
Buka himpunan data Target Buka himpunan data Target

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.