Share via


TCGA Open Data

Il Cancer Genome Atlas (TCGA), un programma di genomica del cancro di riferimento, caratterizzato molecolarmente oltre 20.000 cancro primario e campioni normali che si estendono su 33 tipi di cancro[1]. I dati sul cancro TCGA resi disponibili pubblicamente sono due livelli: accesso aperto o controllato.

  • Accesso aperto [disponibile in Azure]: questo set di dati contiene dati clinici e biospecimen deidentificati o dati riepilogati che non contengono informazioni identificabili singolarmente. I tipi di dati inclusi sono espressione genica, valori beta di metilazione e quantificazione delle proteine. Il tipo di dati a livello di DNA include il numero di copia a livello di gene e il segmento del numero di copia mascherato.
  • Accesso controllato: questo set di dati è i dati della sequenza a livello singolo e richiede l'approvazione tramite dbGap per l'accesso.

Nota

Microsoft fornisce set di dati aperti di Azure su base "così come è". Microsoft non fornisce garanzie, garanzie o condizioni esplicite o implicite in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft dichiara tutte le responsabilità per eventuali danni o perdite, tra cui diretto, consequenziale, speciale, indiretto, accidentale o irreversibile, risultante dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Origine dati

Questo set di dati è un mirroring di TCGA Open Data

Volumi di dati e frequenza di aggiornamento

Questo set di dati contiene circa 387 GB

Posizione di archiviazione

Questo set di dati viene archiviato nelle aree di Azure Stati Uniti orientali 2. L'allocazione delle risorse di calcolo nell'area Stati Uniti orientali 2 è consigliata per motivi di affinità.

Accesso ai dati

Stati Uniti orientali 2: 'https://datasettcga.blob.core.windows.net/dataset'

Token di firma di accesso condiviso: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr =https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Condizioni per l'utilizzo 

I dati sono disponibili senza restrizioni. Per altre informazioni e dettagli sulla citazione, vedere la pagina del programma TCGA

Contatto

Per domande relative ai dati e al programma TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo Open Datasets.