KÓDOLÁS: DNS-elemek enciklopédiája

A DNS-elemek enciklopédiája (ENCODE) konzorcium a National Human Genome Research Institute (NHGRI) által finanszírozott kutatócsoportok folyamatos nemzetközi együttműködése. Az ENCODE célja az emberi genom funkcionális elemeinek átfogó részeinek összeállítása, beleértve a fehérje- és RNS-szinten működő elemeket, valamint azokat a szabályozási elemeket, amelyek a gén aktív sejtjeit és körülményeit szabályozzák.

Az ENCODE-vizsgálók különböző teszteket és módszereket alkalmaznak a funkcionális elemek azonosításához. A génelemek felderítését és annotációját elsősorban azzal érik el, hogy szekvenálással megvizsgálnak számos különféle RNS-forrást, és összehasonlító genomikát, integratív bioinformatikai módszereket és emberi válogatást használnak. A szabályozási elemeket általában a DNS-túlérzékenységi tesztek, a DNS-metiláció és a DNS-hez és az RNS-hez kölcsönhatásba lépő fehérjék immunprecipitációja (IP) vizsgálatával vizsgálják, azaz módosított hisztonok, transzkripciós tényezők, kromatin-szabályozók és RNS-kötésű fehérjék, majd szekvenálás.

Feljegyzés

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adatforrás

Ez az adathalmaz a https://www.encodeproject.org/ tartalmának tükrözése

Adatkötetek és frissítés gyakorisága

Ez az adatkészlet körülbelül 756 TB adatot tartalmaz, és naponta frissül.

Tárolási hely

Az adatkészlet tárolási helye az USA 2. nyugati régiója és az USA nyugati középső régiója. Az affinitás érdekében javasoljuk, hogy az USA 2. nyugati régiójában vagy az USA nyugati középső régiójában keresse meg a számítási erőforrásokat.

Adathozzáférés

USA 2. nyugati régiója: "https://datasetencode.blob.core.windows.net/dataset"

USA nyugati középső régiója: "https://datasetencode-secondary.blob.core.windows.net/dataset"

SAS Token: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Használati feltételek

A külső adatfelhasználók bármilyen ENCODE-adat alapján, típustól és mérettől függetlenül szabadon tölthetnek le, elemezhetnek és tehetnek közzé eredményeket, és nem tartalmaznak türelmi időt az ENCODE-adatkészítők számára, akár egyéni tagokként, akár a Konzorcium részeként. A nem közzétett ENCODE-adatokat használó kutatókat arra ösztönzik, hogy kapcsolatba lépjenek az adattermelőkkel a lehetséges publikációk megvitatása érdekében. A konzorcium továbbra is közzéteszi a saját elemzéseinek eredményeit független publikációkban.

Az ENCODE azt kéri, hogy ha az ENCODE-adathalmazokat (akár publikálva, akár nem publikálva) használják kiadványokban és prezentációkban, akkor hivatkozzanak az ENCODE konzorciumra minden alábbi módon, https://www.encodeproject.org/help/citing-encode/ dátum szerint.

Kapcsolat

Ha bármilyen kérdése, aggálya vagy megjegyzése van, küldjön e-mailt ügyfélszolgálatunknak.encode-help@lists.stanford.edu

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.