ENCODE: Encyklopedia elementów DNA

Konsorcjum Encyklopedii Elementów DNA (ENCODE) to trwająca międzynarodowa współpraca grup badawczych finansowanych przez National Human Genome Research Institute (NHGRI). Celem ENCODE jest utworzenie kompleksowej listy części elementów funkcjonalnych w ludzkim genomie, w tym elementów, które działają na poziomie białka i RNA, oraz elementów regulacyjnych, które kontrolują komórki i okoliczności, w których gen jest aktywny.

Badacze ENCODE stosują różne testy i metody identyfikowania elementów funkcjonalnych. Odkrywanie i opisywanie elementów genów jest realizowane przede wszystkim przez sekwencjonowanie szerokiego zakresu źródeł RNA, genomikę porównawczą, metody bioinformatyki integracyjnej i nadzór przez człowieka. Elementy regulacyjne są zwykle badane za pomocą badań nadwrażliwości DNA, testów metylacji DNA i immunoprecipitation (IP) białek, które wchodzą w interakcje z DNA i RNA, czyli zmodyfikowanych histonów, czynników transkrypcji, regulatorów chromatyny i białek wiązania RNA, a następnie sekwencjonowania.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Źródło danych

Ten zestaw danych jest odzwierciedleniem magazynu danych w witrynie https://www.encodeproject.org/

Woluminy danych i częstotliwość aktualizacji

Ten zestaw danych zawiera około 756 TB danych i jest aktualizowany codziennie.

Lokalizacja usługi Storage

Ten zestaw danych jest przechowywany w regionach świadczenia platformy Azure: Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 lub Zachodnio-środkowe stany USA w celu koligacji.

Dostęp do danych

Zachodnie stany USA 2: "https://datasetencode.blob.core.windows.net/dataset"

Zachodnio-środkowe stany USA: "https://datasetencode-secondary.blob.core.windows.net/dataset"

Token sygnatury dostępu współdzielonego: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Warunki użytkowania

Użytkownicy danych zewnętrznych mogą swobodnie pobierać, analizować i publikować wyniki na podstawie dowolnych danych ENCODE bez ograniczeń, niezależnie od typu lub rozmiaru, i nie zawiera okresu prolongaty dla producentów danych ENCODE, jako pojedynczych członków lub w ramach konsorcjum. Naukowcy korzystający z nieopublikowanych danych ENCODE są zachęcani do kontaktowania się z producentami danych w celu omówienia możliwych publikacji. Konsorcjum będzie kontynuować publikowanie wyników własnych analiz w niezależnych publikacjach.

Konsorcjum ENCODE wymaga, aby badacze korzystający z zestawów danych ENCODE (opublikowanych lub nie) podawali nazwę konsorcjum ENCODE w prezentacjach i publikacjach na wszystkie ze sposobów opisanych na stronie https://www.encodeproject.org/help/citing-encode/.

Kontakt biznesowy

Jeśli masz jakiekolwiek pytania, wątpliwości lub komentarze, wyślij wiadomość e-mail do działu pomocy technicznej pod adresem encode-help@lists.stanford.edu.

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).