Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Nota
Aggiornamento importante di maggio 2025: Cara community, microsoft vuole informare l'utente di una modifica imminente relativa ai set di dati aperti di Genomica attualmente disponibili tramite Azure. Dopo un'attenta considerazione, abbiamo deciso di spostare il nostro focus su nuove iniziative che serviranno meglio la nostra comunità e si allineano ai nostri obiettivi a lungo termine. Di conseguenza, l'accesso ai set di dati aperti di Genomica in Azure verrà deprecato nei prossimi mesi. Questi set di dati sono utili per la ricerca, lo sviluppo e l'apprendimento e apprezziamo profondamente i contributi e l'impegno della nostra community nel corso del tempo. Grazie per la comprensione e il supporto.
Il Cancer Genome Atlas (TCGA), un programma di riferimento per la genomica del cancro, ha identificato molecolarmente oltre 20.000 campioni primari di cancro e campioni normali appaiati che coprono 33 tipi di cancro[1]. I dati sul cancro TCGA vengono resi disponibili pubblicamente in due livelli: accesso aperto o controllato.
- Accesso aperto [disponibile su Azure]: questo set di dati contiene dati clinici e biospecifici deindentificati o dati riassunti che non contengono informazioni identificabili singolarmente. I tipi di dati inclusi sono espressione genica, valori beta di metilazione e quantificazione delle proteine. Il tipo di dati a livello di DNA include il numero di copie a livello di gene e il segmento del numero di copie mascherato.
- Accesso controllato: questo set di dati è costituito da dati di sequenza a livello individuale e richiede l'approvazione di dbGap per l'accesso.
Nota
Microsoft fornisce i set di dati aperti di Azure così come sono e non fornisce né garanzie, esplicite o implicite, né specifica alcuna condizione in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft declina tutte le responsabilità per eventuali danni o perdite, incluse dirette, consequenziali, speciali, indirette, accidentali o irreversibili, risultanti dall'uso dei set di dati.
Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.
Origine dati
Questo set di dati è un mirroring di TCGA Open Data
Volumi di dati e frequenza di aggiornamento
Questo set di dati contiene circa 387 GB
Posizione di archiviazione
Questo set di dati viene archiviato nelle aree di Azure Stati Uniti orientali 2. L'allocazione delle risorse di calcolo nell'area Stati Uniti orientali 2 è consigliata per motivi di affinità.
Accesso ai dati
Stati Uniti orientali 2: 'https://datasettcga.blob.core.windows.net/dataset'
Condizioni per l'utilizzo
I dati sono disponibili senza restrizioni. Per altre informazioni e dettagli sulla citazione, vedere la pagina del programma TCGA
Contatto
Per domande relative ai dati e al programma TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Passaggi successivi
Visualizzare il resto dei set di dati nel catalogo dei set di dati aperti.