Epizoda
Odhad pravděpodobnosti stochastického gradientního sestupu v modelu proporcionálních rizik cox s aplikacemi na data Cancer Genome Atlas
with Marcin Kosiński
useR!2017: Stochastic Gradient Sestup log-Likeliho...
V posledním desetiletí se objem dat zvýšil rychleji než rychlost procesorů. V této situaci se statistické metody strojového učení staly omezenějšími výpočetními časy než objem datových sad. Řešení ohrožení zabezpečení v případě velkých objemů dat jsou spojena s výpočetní složitostí metod optimalizace, které musí být provedeny jiným než triviálním způsobem. Jedním z takových řešení jsou algoritmy optimalizace, které jsou založeny na stochastickém gradientním sestupu (Bottou (2010), Bottou (2012), Widrow (1960)), které vykazují vysokou efektivitu při operacích s daty velkého rozsahu.
V prezentaci popíšem algoritmus stochastického gradientního sestupu, který byl použit v procesu odhadu pravděpodobnosti odhadu koeficientů modelu proporcionálních rizik Cox. Tento algoritmus lze úspěšně použít v čase k analýze událostí, ve kterém počet vysvětlujících proměnných výrazně překračuje počet pozorování. Připravená metoda odhadu koeficientů s použitím stochastického gradientního slušného je možné použít při přežití analýzy, jako jsou: molekulární biologie, bioinformatické screeningy genových výrazů nebo analýzy na základě DNA mikroarrays, které jsou široce používány v klinické diagnostice, léčbě a výzkumu.
Vytvořený pracovní postup odhadu byl nový přístup (v době, kdy jsem napsal svou hlavní práci), není známý v literaturě. Je odolný vůči problému s kolinearitou proměnných a funguje dobře v situacích zlepšení souvislých koeficientů pro streamovaná data.
useR!2017: Stochastic Gradient Sestup log-Likeliho...
V posledním desetiletí se objem dat zvýšil rychleji než rychlost procesorů. V této situaci se statistické metody strojového učení staly omezenějšími výpočetními časy než objem datových sad. Řešení ohrožení zabezpečení v případě velkých objemů dat jsou spojena s výpočetní složitostí metod optimalizace, které musí být provedeny jiným než triviálním způsobem. Jedním z takových řešení jsou algoritmy optimalizace, které jsou založeny na stochastickém gradientním sestupu (Bottou (2010), Bottou (2012), Widrow (1960)), které vykazují vysokou efektivitu při operacích s daty velkého rozsahu.
V prezentaci popíšem algoritmus stochastického gradientního sestupu, který byl použit v procesu odhadu pravděpodobnosti odhadu koeficientů modelu proporcionálních rizik Cox. Tento algoritmus lze úspěšně použít v čase k analýze událostí, ve kterém počet vysvětlujících proměnných výrazně překračuje počet pozorování. Připravená metoda odhadu koeficientů s použitím stochastického gradientního slušného je možné použít při přežití analýzy, jako jsou: molekulární biologie, bioinformatické screeningy genových výrazů nebo analýzy na základě DNA mikroarrays, které jsou široce používány v klinické diagnostice, léčbě a výzkumu.
Vytvořený pracovní postup odhadu byl nový přístup (v době, kdy jsem napsal svou hlavní práci), není známý v literaturě. Je odolný vůči problému s kolinearitou proměnných a funguje dobře v situacích zlepšení souvislých koeficientů pro streamovaná data.
Chcete se podělit o svůj názor? Tady můžete odeslat problém.