ENCODE: DNA 要素の百科事典

Encyclopedia of DNA Elements (ENCODE) コンソーシアムは、米国国立ヒトゲノム研究所 (NHGRI) から資金提供を受け、国際的な共同研究を行っている研究グループです。 ENCODE の目的は、タンパク質や RNA レベルで作用する要素や、遺伝子が活性化する細胞や状況を制御する調整要素など、ヒトゲノムの機能的要素の包括的なパーツ リストを構築することです。

ENCODE の研究者は、さまざまなアッセイや手法を用いて機能的要素を特定しています。 遺伝子要素の発見とアノテーションは主に、多様な RNA ソースのシーケンシング、比較ゲノミクス、統合的バイオ インフォマティクス手法、人間によるキュレーションによって達成されます。 一般的には、DNA 過敏症アッセイ、DNA メチル化アッセイ、DNA および RNA と相互作用するタンパク質 (すなわち、ヒストン修飾、転写因子、クロマチン制御因子、RNA 結合タンパク質など) の免疫沈降法 (IP)、およびシーケンシングを使用して、調整要素を調べます。

注意

Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。

このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。

データ ソース

このデータセットは https://www.encodeproject.org/ のデータ ストアのミラーです。

データ量と更新の頻度

このデータセットには約 756 TB のデータが含まれており、毎日更新されます。

保存先

このデータセットは米国西部 2 および米国中西部 Azure リージョンに保存されています。 アフィニティのため、米国西部 2 または米国中西部にコンピューティング リソースを割り当てることをお勧めします。

データ アクセス

米国西部 2: 'https://datasetencode.blob.core.windows.net/dataset '

米国中西部: 'https://datasetencode-secondary.blob.core.windows.net/dataset '

SAS Token: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

使用条件

外部データ ユーザーは、型やサイズに関係なく、制限なしに任意の ENCODE データに基づいて結果を自由にダウンロード、分析、および公開できます。また、ENCODE データ作成者の猶予期間は、個々のメンバーまたはコンソーシアムの一員のいずれとしても含まれません。 未公開の ENCODE データを使用している研究者は、データ作成者に連絡して公開の可能性について話し合うことをお勧めします。 コンソーシアムでは、独自の分析作業の結果を独立した出版物として発表していきます。

ENCODE により、出版物やプレゼンテーションで ENCODE データセット (公開、未公開を問わず) を使用する研究者が、 https://www.encodeproject.org/help/citing-encode/ で報告されている以下のすべての方法で ENCODE コンソーシアムを引用することが要求されています。

Contact

ご質問、懸念事項、ご意見がございましたら、電子メール (encode-help@lists.stanford.edu) にてヘルプ デスクにお問い合わせください。

次の手順

Open Datasets カタログの残りのデータセットを表示します。