Otwarte dane TCGA

Cancer Genome Atlas (TCGA), przełomowy program genomiki raka, molekularnie scharakteryzował ponad 20.000 podstawowych nowotworów i dopasowane normalne próbki obejmujące 33 typy nowotworów[1]. Dane dotyczące raka TCGA udostępniane publicznie są dwie warstwy: otwarty lub kontrolowany dostęp.

  • Otwarty dostęp [dostępny na platformie Azure]: ten zestaw danych zawiera zdeindentyfikowane dane kliniczne i biospecimen lub podsumowane dane, które nie zawierają żadnych indywidualnie możliwych do zidentyfikowania informacji. Uwzględnione typy danych to wyrażenia genów, wartości beta metylacji i kwantyfikacji białka. Typ danych na poziomie DNA obejmuje numer kopii na poziomie genu i zamaskowany segment numerów kopii.
  • Kontrolowany dostęp: ten zestaw danych to dane sekwencji poszczególnych poziomów i wymaga zatwierdzenia za pośrednictwem dbGap w celu uzyskania dostępu.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Źródło danych

Ten zestaw danych jest dublowaniem danych open data TCGA

Woluminy danych i częstotliwość aktualizacji

Ten zestaw danych zawiera około 387 GB

Lokalizacja usługi Storage

Ten zestaw danych jest przechowywany w regionach świadczenia usługi Azure Wschodnie stany USA 2. Zalecamy przydzielanie zasobów obliczeniowych w regionie Wschodnie stany USA 2 z uwagi na koligację.

Dostęp do danych

Wschodnie stany USA 2: "https://datasettcga.blob.core.windows.net/dataset"

Token sygnatury dostępu współdzielonego: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Warunki użytkowania 

Dane są dostępne bez ograniczeń. Aby uzyskać więcej informacji i szczegółów cytatu, zobacz stronę programu TCGA

Kontakt biznesowy

W przypadku pytań dotyczących danych i programu TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).