ClinVar Annotations
Note
重要な更新 2024 年 9 月 19 日: すべての URL が変更されています。 すべての Genomics Data Lake コンテナーへのパブリック アクセスを有効にしています。 既存の "署名された URL" (Shared Access Signature) は、2024-11-04T00:00:00Z で廃止されます。 これより後も、クエリ文字列のない URL は引き続き機能しますが、"署名された URL" は機能しなくなり、403 HTTP 状態コードが返されます。 この日付以降は、適宜、クエリ文字列を含まないパブリック URL にアクセスするように計画してください ('?' と末尾の文字を削除する)。
ClinVar リソースは、人間のバリエーションと表現型の関係に関する証拠を含むレポートの自由にアクセス可能なパブリック アーカイブです。 それを使うと、人間のバリエーションと観察された健康状態の間の主張された関係、およびその解釈の歴史に簡単にアクセスしてやり取りできます。 研究者がゲノミクス ワークフローやアプリケーションに組み込むことができる幅広い臨床解釈へのアクセスを提供します。
データについて詳しくは、データ ディクショナリに関する資料と FAQ リソースをご覧ください。
Note
Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。
このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。
データ ソース
このデータセットは、国立医学図書館の ClinVar に関する FTP リソースのコピーです。
データの更新頻度
このデータセットは毎日更新されます。
[データ アクセス]
使用条件
データは制限なく使用できます。 詳細および引用の詳細については、「Accessing and using data in ClinVar」を参照してください。
Contact
このデータセットに関する質問またはフィードバックについては、clinvar@ncbi.nlm.nih.gov にお問い合わせください。
データ アクセス
Azure Notebooks
Azure Open Dataset から ClinVar データを取得する
複数の公開ゲノミクス データ リソースが、Azure Open Dataset としてこちらのリソースにアップロードされました。
'ClinVar Data Set' からのデータの呼び出し
import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os
REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR
with mount:
print(os.listdir(path))
import pandas as pd
# create mount context
mount.start()
# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')
# read README file
metadata = pd.read_table(metadata_filename)
metadata
特定のファイルをダウンロードする
import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess
blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')
次の手順
Open Datasets カタログの残りのデータセットを表示します。