Condividi tramite


Dati aperti TCGA

Nota

Aggiornamento importante di maggio 2025: Cara community, microsoft vuole informare l'utente di una modifica imminente relativa ai set di dati aperti di Genomica attualmente disponibili tramite Azure. Dopo un'attenta considerazione, abbiamo deciso di spostare il nostro focus su nuove iniziative che serviranno meglio la nostra comunità e si allineano ai nostri obiettivi a lungo termine. Di conseguenza, l'accesso ai set di dati aperti di Genomica in Azure verrà deprecato nei prossimi mesi. Questi set di dati sono utili per la ricerca, lo sviluppo e l'apprendimento e apprezziamo profondamente i contributi e l'impegno della nostra community nel corso del tempo. Grazie per la comprensione e il supporto.

Il Cancer Genome Atlas (TCGA), un programma di riferimento per la genomica del cancro, ha identificato molecolarmente oltre 20.000 campioni primari di cancro e campioni normali appaiati che coprono 33 tipi di cancro[1]. I dati sul cancro TCGA vengono resi disponibili pubblicamente in due livelli: accesso aperto o controllato.

  • Accesso aperto [disponibile su Azure]: questo set di dati contiene dati clinici e biospecifici deindentificati o dati riassunti che non contengono informazioni identificabili singolarmente. I tipi di dati inclusi sono espressione genica, valori beta di metilazione e quantificazione delle proteine. Il tipo di dati a livello di DNA include il numero di copie a livello di gene e il segmento del numero di copie mascherato.
  • Accesso controllato: questo set di dati è costituito da dati di sequenza a livello individuale e richiede l'approvazione di dbGap per l'accesso.

Nota

Microsoft fornisce i set di dati aperti di Azure così come sono e non fornisce né garanzie, esplicite o implicite, né specifica alcuna condizione in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft declina tutte le responsabilità per eventuali danni o perdite, incluse dirette, consequenziali, speciali, indirette, accidentali o irreversibili, risultanti dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Origine dati

Questo set di dati è un mirroring di TCGA Open Data

Volumi di dati e frequenza di aggiornamento

Questo set di dati contiene circa 387 GB

Posizione di archiviazione

Questo set di dati viene archiviato nelle aree di Azure Stati Uniti orientali 2. L'allocazione delle risorse di calcolo nell'area Stati Uniti orientali 2 è consigliata per motivi di affinità.

Accesso ai dati

Stati Uniti orientali 2: 'https://datasettcga.blob.core.windows.net/dataset'

Condizioni per l'utilizzo 

I dati sono disponibili senza restrizioni. Per altre informazioni e dettagli sulla citazione, vedere la pagina del programma TCGA

Contatto

Per domande relative ai dati e al programma TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.