Freigeben über


TCGA Open Data

Hinweis

Wichtiges Update Mai 2025: Liebe Community, wir möchten Sie über eine bevorstehende Änderung bezüglich der offenen Datasets von Genomics informieren, die derzeit über Azure verfügbar sind. Nach sorgfältiger Überlegung haben wir beschlossen, unseren Fokus auf neue Initiativen zu setzen, um unserer Gemeinschaft besser zu dienen und mit unseren langfristigen Zielen übereinzustimmen. Der Zugriff auf die offenen Genomics-Datasets in Azure wird in den kommenden Monaten eingestellt. Wir verstehen, dass diese Datasets für Forschung, Entwicklung und Lernen wertvoll waren, und wir schätzen die Beiträge und das Engagement unserer Community im Laufe der Zeit sehr. Vielen Dank für Ihr Verständnis und Ihre Unterstützung.

The Cancer Genome Atlas (TCGA), ein wegweisendes Krebsgenomprogramm, hat über 20 000 primäre Krebs- und dazu passende Normalproben aus 33 Krebsarten molekular charakterisiert[1]. Die TCGA-Krebsdaten, die öffentlich zur Verfügung gestellt werden, sind zweistufig: offener oder kontrollierter Zugriff.

  • Offener Zugriff [in Azure verfügbar]: Dieses Dataset enthält von Identitätsmerkmalen bereinigte klinische Daten und Daten von Bioproben oder zusammengefasste Daten, die keine Personen identifizierende Informationen enthalten. Die enthaltenen Datentypen sind Genexpression, Methylierungsbetawerte und Proteinquantifizierung. Der Datentyp auf DNA-Ebene umfasst die Kopiernummer auf Genebene und das maskierte Kopiernummersegment.
  • Kontrollierter Zugriff: Dieses Dataset enthält die Sequenzdaten auf individueller Ebene und erfordert die Genehmigung über dbGap für den Zugriff.

Hinweis

Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.

Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.

Datenquellen-

Dieses Dataset ist ein Spiegel von TCGA Open Data

Datenvolumes und Aktualisierungshäufigkeit

Dieses Dataset enthält ungefähr 387 GB

Speicherort

Dieses Dataset wird in den Azure-Regionen „USA, Osten 2“ gespeichert. Aus Gründen der Affinität wird die Zuweisung von Computeressourcen in der Region „USA, Osten 2“ empfohlen.

Datenzugriff

USA, Osten 2: „https://datasettcga.blob.core.windows.net/dataset“

Nutzungsbedingungen

Die Daten stehen uneingeschränkt zur Verfügung. Weitere Informationen und Details zu Zitaten finden Sie auf der TCGA-Programmseite

Kontakt

Bei Fragen zu TCGA-Daten und -Programmen: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Nächste Schritte

Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.