ClinVar Ek Açıklamaları

ClinVar, insan değişkenlikleri ve fenotipleri arasındaki ilişkilerden çıkarılan raporlara, bunların destekleyici kanıtlarıyla birlikte ücretsiz olarak erişilebilen ortak bir arşivdir. İnsan değişkenliği ve gözlemlenen sağlık durumu arasında olduğu iddia edilen ilişkilere ve bu yorumların geçmişine erişimi ve bunlar hakkında iletişimi kolaylaştırır. Genomik iş akışları ve uygulamalar ile bütünleştirilebilecek daha geniş bir klinik yorum kümesine erişim sağlar.

Veriler hakkında daha fazla bilgi için bkz . Veri Sözlüğü ve SSS.

Dekont

Microsoft, Azure Open Datasets'i "olduğu gibi" sağlar. Microsoft, veri kümelerini kullanımınızla ilgili olarak açık veya zımni hiçbir garanti veya koşul sağlamaz. Yerel yasalarınız kapsamında izin verilen ölçüde, Microsoft veri kümelerini kullanımınızdan kaynaklanan doğrudan, sonuçsal, özel, dolaylı, arızi veya cezai dahil olmak üzere tüm zarar veya kayıplar için tüm sorumluluğu kabul etmez.

Bu veri kümesi Microsoft’un kaynak verileri aldığı orijinal hükümler kapsamında sağlanır. Veri kümesi Microsoft’tan alınan verileri içerebilir.

Data source

Bu veri kümesi, ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/xml/

Veri birimleri ve güncelleştirme sıklığı

Bu veri kümesi yaklaşık 56 GB veri içerir ve günlük olarak güncelleştirilir.

Depolama konumu

Bu veri kümesi Batı ABD 2 ve Orta Batı ABD Azure bölgelerinde depolanır. Benzeşim için Batı ABD 2 veya Orta Batı ABD'de işlem kaynakları ayrılması önerilir.

Veri Erişimi

Batı ABD 2: 'https://datasetclinvar.blob.core.windows.net/dataset'

Orta Batı ABD: 'https://datasetclinvar-secondary.blob.core.windows.net/dataset'

SAS Belirteci: sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D

Kullanım Koşulları

Veriler kısıtlamasız olarak sunulmuştur. Daha fazla bilgi ve alıntı ayrıntıları için bkz . ClinVar'da verilere erişme ve verileri kullanma.

İlgili kişi

Bu veri kümesiyle ilgili sorularınız veya geri bildirimlerinizi almak için adresine başvurun clinvar@ncbi.nlm.nih.gov.

Veri erişimi

Azure Notebooks

Azure Açık Veri Kümesinden ClinVar verilerini alma

Burada azure açık veri kümesi olarak birçok genel genomiks verisi karşıya yüklenmiştir. Bu açık veri kümesine bağlı bir blob hizmeti oluştururuz. Veri kümesi için ClinVar Azure Açık Veri Kümesi'nden veri çağırma yordamının örneklerini aşağıda bulabilirsiniz:

Kullanıcılar bu not defteriyle şu yolu arayabilir ve indirebilir: 'https://datasetclinvar.blob.core.windows.net/dataset/ClinVarFullRelease_00-latest.xml.gz.md5'

Dekont

Kullanıcıların Azure ML SDK'sı ile verileri görüntülemek için Azure CLI aracılığıyla Azure Hesaplarında oturum açmaları gerekir. Öte yandan, verileri indirmek için herhangi bir işlem yapmalarına gerek yoktur.

Azure CLI'yı yükleme hakkında daha fazla bilgi için bkz . Azure CLI'yi yükleme

'ClinVar Veri Kümesi'nden verileri çağırma

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)
from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()
import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))
import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Belirli bir dosyayı indirme

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Sonraki adımlar

Açık Veri Kümeleri kataloğundaki diğer veri kümelerini görüntüleyin.