ENCODE: Encyclopedie van DNA-elementen

Het Encyclopedie van DNA Elements (ENCODE) Consortium is een doorlopende internationale samenwerking van onderzoeksgroepen die worden gefinancierd door het National Human Genome Research Institute (NHGRI). Het doel van ENCODE is het bouwen van een uitgebreide onderdelenlijst met functionele elementen in het menselijk genoom, met inbegrip van elementen die op eiwit- en RNA-niveaus handelen, en regelgevingselementen die cellen en omstandigheden beheersen waarin een gen actief is.

ENCODE onderzoekers gebruiken verschillende tests en methoden om functionele elementen te identificeren. De detectie en annotatie van gen-elementen wordt voornamelijk gerealiseerd door sequencing van een verscheidenheid aan RNA-bronnen, vergelijkende genomica, integratieve methoden uit de bio-informatica en menselijk beheer. Regulerende elementen worden doorgaans onderzocht via DNA-overgevoeligheidsanalyses, assays van DNA-methylatie en immunoprecipitatie (IP) van eiwitten die communiceren met DNA en RNA, dat wil zeggen, gewijzigde histonen, transcriptiefactoren, chromatineregelgevers en RNA-binding eiwitten, gevolgd door sequentiëren.

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevensbron

Deze gegevensset is een weerspiegeling van het gegevensarchief op https://www.encodeproject.org/

Gegevensvolumes en updatefrequentie

Deze gegevensset bevat ongeveer 756 TB aan gegevens en wordt dagelijks bijgewerkt.

Opslaglocatie

Deze gegevensset is opgeslagen in de Azure-regio's US - west 2 en VS - west-centraal. We raden u aan rekenresources te zoeken in VS - west 2 of VS - west-centraal voor affiniteit.

Data Access

VS - west 2: 'https://datasetencode.blob.core.windows.net/dataset'

VS - west-centraal: 'https://datasetencode-secondary.blob.core.windows.net/dataset'

SAS-token: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Gebruiksrechtovereenkomst

Externe gegevensgebruikers kunnen resultaten vrij downloaden, analyseren en publiceren op basis van ENCODE-gegevens zonder beperkingen, ongeacht het type of de grootte, en bevatten geen respijtperiode voor producenten van ENCODE-gegevens, hetzij als afzonderlijke leden of als onderdeel van het Consortium. Onderzoekers die niet-gepubliceerde ENCODE-gegevens gebruiken, worden aangemoedigd contact op te leggen met de gegevensproducenten om mogelijke publicaties te bespreken. Het Consortium zal de resultaten van zijn eigen analyse-inspanningen in onafhankelijke publicaties blijven publiceren.

ENCODE verzoekt onderzoekers die gebruikmaken van ENCODE-gegevenssets (gepubliceerd of ongepubliceerd) in publicaties en presentaties het ENCODE Consortium te noemen op elk van de manieren die worden vermeld in https://www.encodeproject.org/help/citing-encode/.

Contactpersoon

Als u vragen, zorgen of opmerkingen hebt, stuur dan een e-mail naar onze helpdesk bij encode-help@lists.stanford.edu.

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.