TCGA Open Data

De Cancer Genome Atlas (TCGA), een landmark cancer genomics programma, moleculair gekenmerkt meer dan 20.000 primaire kanker en matched normale monsters die betrekking hebben op 33 kankertypen[1]. De TCGA-kankergegevens die openbaar beschikbaar worden gesteld, zijn twee lagen: open of gecontroleerde toegang.

  • Open access [beschikbaar in Azure]: deze gegevensset bevat geïndentificeerde klinische en biospecimengegevens of samengevatte gegevens die geen afzonderlijk identificeerbare informatie bevatten. De opgenomen gegevenstypen zijn genexpressie, methylatie beta-waarden en eiwit kwantificatie. Het gegevenstype op DNA-niveau omvat het kopieernummer op genniveau en het gemaskeerde segment van het kopieernummer.
  • Gecontroleerde toegang: Deze gegevensset is de gegevensreeksgegevens op individueel niveau en vereist goedkeuring via dbGap voor toegang.

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevensbron

Deze gegevensset is een spiegel van TCGA Open Data

Gegevensvolumes en updatefrequentie

Deze gegevensset bevat ongeveer 387 GB

Opslaglocatie

Deze gegevensset wordt opgeslagen in de Azure-regio's VS - oost 2. Het wordt aanbevolen om rekenresources in US - oost 2 toe te wijzen voor affiniteit.

Toegang tot gegevens

VS - oost 2: 'https://datasettcga.blob.core.windows.net/dataset'

SAS-token: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&&a spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Gebruiksrechtovereenkomst 

De gegevens zijn zonder beperkingen beschikbaar. Zie de tcga-programmapagina voor meer informatie en bronvermeldingen

Contactpersoon

Voor vragen over TCGA-gegevens en programma's: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.