КОДИРОВАНИЕ: Энциклопедия элементов ДНК

Консорциум Энциклопедия элементов ДНК (ENCODE) — это постоянный международный совместный проект исследовательских групп, финансируемый Национальным институтом исследования генома человека (National Human Genome Research Institute, NHGRI). Целью ENCODE является создание исчерпывающего списка частей функциональных элементов генома человека, включая элементы, которые действуют на уровне белков и РНК, а также регуляторные элементы, контролирующие клетки и условия, в которых активен тот или иной ген.

Для идентификации функциональных элементов исследователи ENCODE используют различные методы и виды анализа. Обнаружение и аннотирование элементов генома выполняется в первую очередь с помощью секвенирования разнообразных источников РНК, сравнительной геномики, интегративных биоинформатических методов и контроля со стороны человека. Регуляторные элементы обычно исследуются с помощью анализа гиперчувствительности к ДНКазе I, метилирования ДНК и иммунопреципитации (IP) белков, которые взаимодействуют с ДНК и РНК, то есть модифицированных гистонов, факторов транскрипции, регуляторов хроматина и РНК-связывающих белков, с последующим секвенированием.

Примечание.

Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.

Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.

Источник данных

Этот набор данных является зеркальным по отношению к хранилищу данных по адресу https://www.encodeproject.org/

Объемы данных и частота обновления

Этот набор данных включает примерно 756 ТБ данных и обновляется ежедневно.

Расположение хранилища

Этот набор данных хранится в регионах Azure "Западная часть США 2" и "Центрально-западная часть США". Для обеспечения приближенности мы рекомендуем выделять вычислительные ресурсы в регионе "Западная часть США 2" или "Центрально-западная часть США".

Доступ к данным

Западная часть США 2: https://datasetencode.blob.core.windows.net/dataset

Центрально-западная часть США: https://datasetencode-secondary.blob.core.windows.net/dataset

Маркер SAS: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Условия использования

Пользователи внешних данных могут свободно скачивать, анализировать и публиковать результаты на основе любых данных ENCODE без ограничений, независимо от типа или размера и не включая льготный период для поставщиков данных ENCODE, как отдельных членов или как часть консорциума. Исследователям, использующим неопубликованные данные ENCODE, рекомендуется связаться с поставщиками данных для обсуждения возможных публикаций. Консорциум продолжит публиковать результаты собственных аналитических исследований в независимых изданиях.

ENCODE просит исследователей, которые используют наборы данных ENCODE (опубликованные или неопубликованные) в публикациях и презентациях, ссылаться на консорциум ENCODE всеми способами, указанными на странице https://www.encodeproject.org/help/citing-encode/.

Контакт

Если у вас возникнут вопросы, проблемы или вы захотите оставить комментарии, отправьте сообщение электронной почты в нашу службу технической поддержки по адресу encode-help@lists.stanford.edu.

Следующие шаги

Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.