Adnotacje ClinVar

Uwaga

Ważna aktualizacja z maja 2025 r.: Szanowna społeczność, chcielibyśmy poinformować Cię o nadchodzącej zmianie dotyczącej otwartych zestawów danych Genomics, które są obecnie dostępne za pośrednictwem platformy Azure. Po starannym rozważeniu postanowiliśmy skupić się na nowych inicjatywach, które będą lepiej służyć naszej społeczności i dostosować się do naszych długoterminowych celów. W związku z tym dostęp do otwartych zestawów danych Usługi Genomics na platformie Azure zostanie wycofany w najbliższych miesiącach. Rozumiemy, że te zestawy danych były cenne dla badań, rozwoju i uczenia się, a my głęboko doceniamy wkład i zaangażowanie naszej społeczności w czasie. Dziękujemy za zrozumienie i wsparcie.

Zasób ClinVar jest bezpłatnie dostępnym publicznym archiwum raportów - z dowodami pomocniczymi - o relacjach między odmianami ludzkimi i fenotypami. Ułatwia ona dostęp do i komunikację na temat oświadczeń relacji między zmiennością ludzką a obserwowanym stanem zdrowia oraz historią tej interpretacji. Zapewnia ona dostęp do szerszego zestawu interpretacji klinicznych, które naukowcy mogą uwzględnić w przepływach pracy i aplikacjach genomiki.

Odwiedź zasób Słownik danych i często zadawane pytania, aby uzyskać więcej informacji na temat danych.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Źródło danych

Ten zestaw danych jest duplikatem zasobu National Library of Medicine ClinVar FTP. Zasób FTP

Omówienie protokołu FTP

Częstotliwość aktualizacji danych

Ten zestaw danych otrzymuje codzienne aktualizacje.

Lokalizacja usługi Storage

Ten zestaw danych jest przechowywany w regionach świadczenia platformy Azure: Zachodnie stany USA 2 i Zachodnio-środkowe stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Zachodnie stany USA 2 lub Zachodnio-środkowe stany USA w celu koligacji.

Dostęp do danych

Zachodnie stany USA 2:"https://datasetclinvar.blob.core.windows.net/dataset""

Zachodnie środkowe stany USA: "https://datasetclinvar-secondary.blob.core.windows.net/dataset"

Warunki użytkowania

Dane są dostępne bez ograniczeń. Więcej informacji i szczegółów cytatu znajduje się w temacie Uzyskiwanie dostępu do danych i używanie ich w języku ClinVar.

Kontakt biznesowy

Aby uzyskać odpowiedzi na pytania lub opinie dotyczące tego zestawu danych, skontaktuj się z .clinvar@ncbi.nlm.nih.gov

Azure Notebooks

azure-storage

Pobieranie danych ClinVar z zestawu danych Azure Open Dataset

Kilka publicznych zasobów danych genomics zostało przekazanych jako zestaw danych Azure Open w tym zasobie.

Wywoływanie danych z zestawu danych "ClinVar"

import azureml.core
print("Azure ML SDK Version: ", azureml.core.VERSION)

from azureml.core import  Dataset
reference_dataset = Dataset.File.from_files('https://datasetclinvar.blob.core.windows.net/dataset')
mount = reference_dataset.mount()

import os

REF_DIR = '/dataset'
path = mount.mount_point + REF_DIR

with mount:
    print(os.listdir(path))

import pandas as pd

# create mount context
mount.start()

# specify path to README file
REF_DIR = '/dataset'
metadata_filename = '{}/{}/{}'.format(mount.mount_point, REF_DIR, '_README')

# read README file
metadata = pd.read_table(metadata_filename)
metadata

Pobieranie określonego pliku

import os
import uuid
import sys
from azure.storage.blob import BlockBlobService, PublicAccess

blob_service_client = BlockBlobService(account_name='datasetclinvar', sas_token='sv=2019-02-02&se=2050-01-01T08%3A00%3A00Z&si=prod&sr=c&sig=qFPPwPba1RmBvaffkzkLuzabYU5dZstSTgMwxuLNME8%3D')     
blob_service_client.get_blob_to_path('dataset', 'ClinVarFullRelease_00-latest.xml.gz.md5', './ClinVarFullRelease_00-latest.xml.gz.md5')

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).

Opinia

Czy ta strona była pomocna?

Last updated on 2025-05-09