TCGA – Adatok megnyitása

A Cancer Genome Atlas (TCGA) egy mérföldkőnek számító rákos genomikai program, amely molekulárisan több mint 20 000 elsődleges rákot jellemez, és megfelelt a 33 ráktípusra kiterjedő normál mintáknak[1]. A nyilvánosan elérhetővé tett TCGA-adatok két szintből állnak: nyílt vagy szabályozott hozzáférés.

  • Nyílt hozzáférés [elérhető az Azure-ban]: Ez az adatkészlet dedentifikált klinikai és biopecimen adatokat vagy olyan összesített adatokat tartalmaz, amelyek nem tartalmaznak egyedileg azonosítható adatokat. A benne foglalt adattípusok a génkifejezés, a metilációs bétaértékek és a fehérje-kvantálás. A DNS-szintű adattípus tartalmazza a génszintű másolási számot és a maszkolt másolási szám szegmenst.
  • Szabályozott hozzáférés: Ez az adatkészlet az egyes szintű szekvenciák adatai, és a dbGap-on keresztüli jóváhagyást igényel a hozzáféréshez.

Feljegyzés

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adatforrás

Ez az adatkészlet tükre a TCGA nyílt adatainak

Adatkötetek és frissítés gyakorisága

Ez az adatkészlet körülbelül 387 GB-ot tartalmaz

Tárolási hely

Ez az adatkészlet az USA 2. keleti régiójában van tárolva. Az affinitás érdekében az USA 2. keleti régióján belüli számítási erőforrások lefoglalását javasoljuk.

Az adatok elérése

USA 2. keleti régiója: "https://datasettcga.blob.core.windows.net/dataset"

SAS-jogkivonat: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Használati feltételek

Az adatok korlátozások nélkül felhasználhatók. További információ és idézet részletei: TCGA Program oldal

Kapcsolat

TCGA-adatokkal és programokkal kapcsolatos kérdések: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.