Share via


ENCODE: Enciclopedia degli elementi del DNA

L'Enciclopedia degli elementi del DNA (ENCODE) Consortium è una collaborazione internazionale continuativa di gruppi di ricerca finanziati dal National Human Genome Research Institute (NHGRI). L'obiettivo di ENCODE è quello di creare un elenco completo di elementi funzionali nel genoma umano, inclusi elementi che agiscono a livello di proteine e RNA, e elementi normativi che controllano le cellule e le circostanze in cui un gene è attivo.

Gli investigatori ENCODE usano vari metodi e analisi per identificare gli elementi funzionali. L'individuazione e l'annotazione di elementi genetici vengono eseguite principalmente tramite il sequenziamento di una vasta gamma di origini di RNA, genomica comparativa, metodi bioinformatici integrativi e selezione umana. Gli elementi normativi vengono in genere esaminati tramite analisi dell'ipersensibilità del DNA, analisi della metilazione del DNA e immunprecipitazione (IP) di proteine che interagiscono con DNA e RNA, ovvero istoni modificati, fattori di trascrizione, regolatori di crotina e proteine che si legano all'RNA, seguite dalla sequenziazione.

Nota

Microsoft fornisce set di dati aperti di Azure su base "così come è". Microsoft non fornisce garanzie, garanzie o condizioni esplicite o implicite in relazione all'uso dei set di dati. Nella misura consentita dalla legge locale, Microsoft dichiara tutte le responsabilità per eventuali danni o perdite, tra cui diretto, consequenziale, speciale, indiretto, accidentale o irreversibile, risultante dall'uso dei set di dati.

Questo set di dati viene fornito in conformità con le condizioni originali in base alle quali Microsoft ha ricevuto i dati di origine. Il set di dati potrebbe includere dati provenienti da Microsoft.

Origine dati

Questo set di dati è un mirror dell'archivio dati in https://www.encodeproject.org/

Volumi di dati e frequenza di aggiornamento

Questo set di dati include circa 756 TB di dati e viene aggiornato ogni giorno.

Posizione di archiviazione

Questo set di dati è archiviato nelle aree di Azure Stati Uniti occidentali 2 e Stati Uniti centro-occidentali. È consigliabile individuare le risorse di calcolo negli Stati Uniti occidentali 2 o negli Stati Uniti centro-occidentali per l'affinità.

Accesso ai dati

Stati Uniti occidentali 2: 'https://datasetencode.blob.core.windows.net/dataset'

Stati Uniti centro-occidentali: 'https://datasetencode-secondary.blob.core.windows.net/dataset'

Token di firma di accesso condiviso: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Condizioni per l'utilizzo

Gli utenti di dati esterni possono scaricare, analizzare e pubblicare liberamente i risultati in base a qualsiasi dato ENCODE senza restrizioni, indipendentemente dal tipo o dalle dimensioni, e non include alcun periodo di tolleranza per i produttori di dati ENCODE, come singoli membri o come parte del Consorzio. I ricercatori che usano dati ENCODE non pubblicati sono invitati a contattare i produttori di dati per discutere delle possibili pubblicazioni. Il consorzio continuerà a pubblicare i risultati delle proprie attività di analisi in pubblicazioni indipendenti.

ENCODE richiede che i ricercatori che usano i set di dati di ENCODE, pubblicati o non pubblicati, in pubblicazioni e presentazioni menzionino ENCODE Consortium in tutti i modi seguenti indicati in https://www.encodeproject.org/help/citing-encode/.

Contatto

In caso di domande, dubbi o commenti, inviare un messaggio di posta elettronica all'help desk all'indirizzo encode-help@lists.stanford.edu.

Passaggi successivi

Visualizzare il resto dei set di dati nel catalogo Open Datasets.