TCGA – Adatok megnyitása
A Cancer Genome Atlas (TCGA) egy mérföldkőnek számító rákos genomikai program, amely molekulárisan több mint 20 000 elsődleges rákot jellemez, és megfelelt a 33 ráktípusra kiterjedő normál mintáknak[1]. A nyilvánosan elérhetővé tett TCGA-adatok két szintből állnak: nyílt vagy szabályozott hozzáférés.
- Nyílt hozzáférés [elérhető az Azure-ban]: Ez az adatkészlet dedentifikált klinikai és biopecimen adatokat vagy olyan összesített adatokat tartalmaz, amelyek nem tartalmaznak egyedileg azonosítható adatokat. A benne foglalt adattípusok a génkifejezés, a metilációs bétaértékek és a fehérje-kvantálás. A DNS-szintű adattípus tartalmazza a génszintű másolási számot és a maszkolt másolási szám szegmenst.
- Szabályozott hozzáférés: Ez az adatkészlet az egyes szintű szekvenciák adatai, és a dbGap-on keresztüli jóváhagyást igényel a hozzáféréshez.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adatforrás
Ez az adatkészlet tükre a TCGA nyílt adatainak
Adatkötetek és frissítés gyakorisága
Ez az adatkészlet körülbelül 387 GB-ot tartalmaz
Tárolási hely
Ez az adatkészlet az USA 2. keleti régiójában van tárolva. Az affinitás érdekében az USA 2. keleti régióján belüli számítási erőforrások lefoglalását javasoljuk.
Az adatok elérése
USA 2. keleti régiója: "https://datasettcga.blob.core.windows.net/dataset"
SAS-jogkivonat: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D
Használati feltételek
Az adatok korlátozások nélkül felhasználhatók. További információ és idézet részletei: TCGA Program oldal
Kapcsolat
TCGA-adatokkal és programokkal kapcsolatos kérdések: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.