Episode

Estimasi Log Kemungkinan Penurunan Gradien Stochastic dalam Model Bahaya Proporsional Cox dengan Aplikasi untuk Data Atlas Genom Kanker

dengan Marcin KosiƄski

useR!2017: Stochastic Gradient Descent Log-Likeliho...

Dalam dekade terakhir, volume data telah tumbuh lebih cepat kemudian kecepatan prosesor. Dalam situasi ini, metode learnig komputer statistik telah menjadi lebih terbatas oleh waktu komputasi daripada volume himpunan data. Solusi kompromi dalam kasus data skala besar dikaitkan dengan kompleksitas komputasi metode pengoptimalan, yang harus dibuat dengan cara yang tidak sepele. Salah satu solusi tersebut adalah algoritma pengoptimalan yang berdasar pada penurunan gradien stochastic (Bottou (2010), Bottou (2012), Widrow (1960)), yang menunjukkan efisiensi tinggi selama operasi pada data skala besar.
Dalam presentasi saya, saya akan menjelaskan algoritma penurunan gradien stochastic yang diterapkan dalam proses estimasi kemungkinan log dari kalkulasi koefisien dari model bahaya proporsional Cox. Algoritma ini dapat berhasil digunakan dalam waktu untuk analisis peristiwa, di mana jumlah variabel penjelasan secara signifikan melebihi jumlah pengamatan. Metode estimasi koefisien yang disiapkan dengan penggunaan penurunan gradien stochastic dapat diterapkan dalam analisis kelangsungan hidup dari ares seperti: biologi molekuler, penyaringan bioinformatis ekspresi gen atau menganalisis berdasarkan mikroarray DNA, yang banyak digunakan dalam diagnostik klinis, perawatan dan penelitian.
Alur kerja estimasi yang dibuat adalah pendekatan baru (pada saat saya menulis tesis master saya), tidak dikenal dalam literatur. Ini tahan terhadap masalah collinearity variabel dan bekerja dengan baik dalam situasi peningkatan koefisien berkelanjutan untuk data streaming.