ENCODE: DNA 要素の百科事典

[アーティクル]
2024/12/12

Encyclopedia of DNA Elements (ENCODE) コンソーシアムは、米国国立ヒトゲノム研究所 (NHGRI) から資金提供を受け、国際的な共同研究を行っている研究グループです。 ENCODE の目的は、タンパク質や RNA レベルで作用する要素や、遺伝子が活性化する細胞や状況を制御する調整要素など、ヒトゲノムの機能的要素の包括的なパーツリストを構築することです。

ENCODE の研究者は、さまざまなアッセイや手法を用いて機能的要素を特定しています。遺伝子要素の発見とアノテーションは主に、多様な RNA ソースのシーケンシング、比較ゲノミクス、統合的バイオインフォマティクス手法、人間によるキュレーションによって達成されます。一般的には、DNA 過敏症アッセイ、DNA メチル化アッセイ、DNA および RNA と相互作用するタンパク質 (すなわち、ヒストン修飾、転写因子、クロマチン制御因子、RNA 結合タンパク質など) の免疫沈降法 (IP)、およびシーケンシングを使用して、調整要素を調べます。

注意

Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。

このデータセットは、Microsoft がソースデータを受け取った元の条件に基づいて提供されます。データセットには、Microsoft が提供するデータが含まれている場合があります。

データソース

このデータセットは https://www.encodeproject.org/ のデータストアのミラーです。

データ量と更新の頻度

このデータセットには約 756 TB のデータが含まれており、毎日更新されます。

保存先

このデータセットは米国西部 2 および米国中西部 Azure リージョンに保存されています。アフィニティのため、米国西部 2 または米国中西部にコンピューティングリソースを割り当てることをお勧めします。

データアクセス

米国西部 2: 'https://datasetencode.blob.core.windows.net/dataset '

米国中西部: 'https://datasetencode-secondary.blob.core.windows.net/dataset '

使用条件

外部データユーザーは、型やサイズに関係なく、制限なしに任意の ENCODE データに基づいて結果を自由にダウンロード、分析、および公開できます。また、ENCODE データ作成者の猶予期間は、個々のメンバーまたはコンソーシアムの一員のいずれとしても含まれません。未公開の ENCODE データを使用している研究者は、データ作成者に連絡して公開の可能性について話し合うことをお勧めします。コンソーシアムでは、独自の分析作業の結果を独立した出版物として発表していきます。

ENCODE により、出版物やプレゼンテーションで ENCODE データセット (公開、未公開を問わず) を使用する研究者が、 https://www.encodeproject.org/help/citing-encode/ で報告されている以下のすべての方法で ENCODE コンソーシアムを引用することが要求されています。

Contact

ご質問、懸念事項、ご意見がございましたら、電子メール (encode-help@lists.stanford.edu) にてヘルプデスクにお問い合わせください。

次の手順

Open Datasets カタログの残りのデータセットを表示します。

次の方法で共有

ENCODE: DNA 要素の百科事典

データソース

データ量と更新の頻度

保存先

データアクセス

使用条件

Contact

次の手順

フィードバック

その他のリソース

次の方法で共有

ENCODE: DNA 要素の百科事典

データ ソース

データ量と更新の頻度

保存先

データ アクセス

使用条件

Contact

次の手順

フィードバック

その他のリソース

データソース

データアクセス