Aracılığıyla paylaş


TCGA Açık Veri

Not

Önemli Güncelleştirme Mayıs 2025: Sayın Topluluk, Şu anda Azure üzerinden kullanılabilen Genomiks açık veri kümeleriyle ilgili olarak yakında yapılacak bir değişiklik hakkında sizi bilgilendirmek istiyoruz. Dikkatle değerlendirdikten sonra, odaklanmamızı topluluğumuza daha iyi hizmet edecek ve uzun vadeli hedeflerimizle uyumlu olacak yeni girişimlere kaydırmaya karar verdik. Bu nedenle, Azure'daki Genomiks açık veri kümelerine erişim önümüzdeki aylarda kullanım dışı bırakılacaktır. Bu veri kümelerinin araştırma, geliştirme ve öğrenme açısından değerli olduğunu anlıyoruz ve topluluğumuzun zaman içindeki katkılarını ve katılımını derinden takdir ediyoruz. Anlayışınız ve desteğiniz için teşekkür ederiz.

Bir yer işareti kanser genomiks programı olan Kanser Genom Atlası (TCGA), moleküler olarak 20.000'den fazla birincil kanser ile karakterizedir ve 33 kanser türüne yayılan normal örneklerle eşleştirilmiştir[1]. TCGA kanser verileri iki katmanda genel kullanıma sunulur: açık veya kontrollü erişim.

  • Açık erişim [Azure'da kullanılabilir]: Bu veri kümesi, ayrı ayrı tanımlanabilir bilgiler içermeyen, girintisizleştirilmiş klinik ve biospecimen verileri veya özetlenmiş verileri içerir. Dahil edilen veri türleri Gen ifadesi, metilasyon beta değerleri ve protein nicelemedir. DNA düzeyi veri türü gen düzeyi kopya numarasını ve maskelenmiş kopya numarası segmentini içerir.
  • Denetimli erişim: Bu veri kümesi tek tek düzey dizi verileridir ve erişim için dbGap üzerinden onay gerektirir.

Not

Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Veri kaynağı

Bu veri kümesi, TCGA Açık Verileri'nin bir yansımasıdır

Veri birimleri ve güncelleştirme sıklığı

Bu veri kümesi yaklaşık 387 GB içerir

Depolama konumu

Bu veri kümesi Doğu ABD 2 Azure bölgelerinde depolanır. Benzeşim için Doğu ABD 2’deki işlem kaynaklarının ayrılması önerilir.

Veri erişimi

Doğu ABD 2: 'https://datasettcga.blob.core.windows.net/dataset'

Kullanım Koşulları 

Veriler kısıtlamasız olarak sunulmuştur. Daha fazla bilgi ve alıntı ayrıntıları için TCGA Programı sayfasına bakın

İlgili kişi

TCGA verileri ve programıyla ilgili sorular için: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Sonraki adımlar

Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.