Поделиться через


Открытые данные TCGA

Примечание.

Важное обновление за май 2025 г. Дорогое сообщество, мы хотели бы сообщить вам о предстоящих изменениях в отношении открытых наборов данных Genomics, доступных в настоящее время через Azure. После тщательного рассмотрения мы решили переключить наше внимание на новые инициативы, которые будут лучше служить нашему сообществу и соответствовать нашим долгосрочным целям. Таким образом, доступ к открытым наборам данных Genomics в Azure будет не рекомендуется в ближайшие месяцы. Мы понимаем, что эти наборы данных были ценными для исследований, разработки и обучения, и мы глубоко ценим вклад и участие со стороны нашего сообщества со временем. Благодарим вас за понимание и поддержку.

Атлас генома рака (TCGA), ориентировая программа рака геномики, молекулярно характеризуется более чем 20000 первичным раком и соответствует нормальным образцам, охватывающим 33 типа рака[1]. Данные рака TCGA становятся общедоступными на двух уровнях: открытый или контролируемый доступ.

  • Открытый доступ [доступен в Azure]: этот набор данных содержит неопознанные клинические и biospecimen данные или суммированные данные, которые не содержат отдельных сведений. Типы данных включают выражение Гена, бета-значения метилирования и квантификации белка. Тип данных уровня ДНК включает номер копирования на уровне гена и сегмент числа маскированного копирования.
  • Контролируемый доступ: этот набор данных является данными последовательности отдельных уровней и требует утверждения через dbGap для доступа.

Примечание.

Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.

Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.

Источник данных

Этот набор данных является зеркалом открытых данных TCGA

Объемы данных и частота обновления

Этот набор данных содержит примерно 387 ГБ

Место хранения

Этот набор данных хранится в регионах Azure "Восточная часть США 2". Для обеспечения приближенности рекомендуется выделять вычислительные ресурсы в регионе "Восточная часть США 2".

Доступ к данным

Восточная часть США 2: 'https://datasettcga.blob.core.windows.net/dataset'

Условия использования 

Доступ к данным предоставляется без ограничений. Дополнительные сведения и сведения о ссылке см. на странице программы TCGA

Контакт

Вопросы о данных и программах TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Следующие шаги

Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.