ClinVar Annotations

[アーティクル]
10/21/2024

Note

重要な更新 2024 年 9 月 19 日: すべての URL が変更されています。すべての Genomics Data Lake コンテナーへのパブリックアクセスを有効にしています。既存の "署名された URL" (Shared Access Signature) は、2024-11-04T00:00:00Z で廃止されます。これより後も、クエリ文字列のない URL は引き続き機能しますが、"署名された URL" は機能しなくなり、403 HTTP 状態コードが返されます。この日付以降は、適宜、クエリ文字列を含まないパブリック URL にアクセスするように計画してください ('?' と末尾の文字を削除する)。

ClinVar リソースは、人間のバリエーションと表現型の関係に関する証拠を含むレポートの自由にアクセス可能なパブリックアーカイブです。それを使うと、人間のバリエーションと観察された健康状態の間の主張された関係、およびその解釈の歴史に簡単にアクセスしてやり取りできます。研究者がゲノミクスワークフローやアプリケーションに組み込むことができる幅広い臨床解釈へのアクセスを提供します。

データについて詳しくは、データディクショナリに関する資料と FAQ リソースをご覧ください。

Note

Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。

このデータセットは、Microsoft がソースデータを受け取った元の条件に基づいて提供されます。データセットには、Microsoft が提供するデータが含まれている場合があります。

データソース

このデータセットは、国立医学図書館の ClinVar に関する FTP リソースのコピーです。

データの更新頻度

このデータセットは毎日更新されます。

[データアクセス]

FTP リソース

FTP の概要

使用条件

データは制限なく使用できます。詳細および引用の詳細については、「Accessing and using data in ClinVar」を参照してください。

Contact

このデータセットに関する質問またはフィードバックについては、clinvar@ncbi.nlm.nih.gov にお問い合わせください。

データアクセス

Azure Notebooks

azure-storage

Azure Open Dataset から ClinVar データを取得する

複数の公開ゲノミクスデータリソースが、Azure Open Dataset としてこちらのリソースにアップロードされました。

'ClinVar Data Set' からのデータの呼び出し

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)

from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()

import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))

import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

特定のファイルをダウンロードする

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

次の手順

Open Datasets カタログの残りのデータセットを表示します。

次の方法で共有

ClinVar Annotations

データソース

データの更新頻度

[データアクセス]

使用条件

Contact

データアクセス

Azure Notebooks

Azure Open Dataset から ClinVar データを取得する

'ClinVar Data Set' からのデータの呼び出し

特定のファイルをダウンロードする

次の手順

フィードバック

その他のリソース

次の方法で共有

ClinVar Annotations

データ ソース

データの更新頻度

[データ アクセス]

使用条件

Contact

データ アクセス

Azure Notebooks

Azure Open Dataset から ClinVar データを取得する

'ClinVar Data Set' からのデータの呼び出し

特定のファイルをダウンロードする

次の手順

フィードバック

その他のリソース

データソース

[データアクセス]

データアクセス