1000 Genom

1000 Genom Projesi 2008 ile 2015 yılları arasında çalıştırılarak insan varyasyonu ve genotip verilerinin en büyük genel kataloğunu oluşturdu. Son veri kümesi, 26 popülasyondan ve tanımlanan 84 milyon varyanttan 2.504 bireyin verisini içerir. Daha fazla bilgi için 1000 Genom Projesi web sitesine ve aşağıdaki yayınlara bakın:

Pilot Analizi: Popülasyon ölçeğinde sıralama doğa 467, 1061-1073 (28 Ekim 2010) insan genom varyasyonu haritası

1. Aşama Analizi: 1.092 insan genomundan genetik varyasyonun tümleşik haritası Nature 491, 56-65 (01 Kasım 2012)

3. Aşama Analizi: İnsan genetik varyasyonu için küresel bir başvuru Nature 526, 68-74 (01 Ekim 2015) ve 2.504 insan genomunda yapısal varyasyonun tümleşik haritası Nature 526, 75-81 (01 Ekim 2015)

Veri biçimlerine ilişkin ayrıntılar için bkz. http://www.internationalgenome.org/formats

[YENİ] veri kümesi parquet biçiminde de kullanılabilir

Dekont

Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Data source

Bu veri kümesi, ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/

Veri birimleri ve güncelleştirme sıklığı

Bu veri kümesi yaklaşık 815 TB veri içerir ve günlük olarak güncelleştirilir.

Depolama konumu

Bu veri kümesi Batı ABD 2 ve Orta Batı ABD Azure bölgelerinde depolanır. Benzeşim için Batı ABD 2 veya Orta Batı ABD'de işlem kaynakları ayrılması önerilir.

Veri Erişimi

Batı ABD 2: 'https://dataset1000genomes.blob.core.windows.net/dataset'

Orta Batı ABD: 'https://dataset1000genomes-secondary.blob.core.windows.net/dataset'

SAS Belirteci: sv=2019-10-10&si=prod&sr=c&sig=9nzcxaQn0NprMPlSh4RhFQHcXedLQIcFgbERiooHEqM%3D

Veri Erişimi: Parquet biçiminde seçilmiş 1000 genom veri kümesi

Doğu ABD: https://curated1000genomes.blob.core.windows.net/dataset

SAS Belirteci: sv=2018-03-28&si=prod&sr=c&sig=BgIomQanB355O4FhxqBL9xUgKzwpcVlRZdBewO5%2FM4E%3D

Kullanım Koşulları

Son yayınların ardından, 1000 Genomes Projesi'nden alınan veriler, veri kümesi kaynağı (http://www.internationalgenome.org/data) tarafından sağlanan koşullar altında kullanılmak üzere herkese ambargo olmadan genel kullanıma sunulur. Bu veriler kullanıldığında, 1000 Genomes Project için SSS bölümde belirtilen ayrıntılara göre referans belirtilmelidir.

İlgili kişi

https://www.internationalgenome.org/contact

Sonraki adımlar

Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.