Episodio
Análisis global de la maximización de expectativas para mezclas de dos gaussianos
con Ji Xu
La maximización de expectativas (EM) se encuentra entre los algoritmos más populares para calcular los parámetros de los modelos estadísticos. Sin embargo, EM, que es un algoritmo iterativo basado en el principio de probabilidad máxima, generalmente solo se garantiza encontrar puntos estacionarios del objetivo de probabilidad, y estos puntos pueden estar lejos de cualquier maximizador. En este artículo se aborda esta desconexión entre los principios estadísticos detrás de EM y sus propiedades algorítmicas. En concreto, proporciona un análisis global de EM para modelos específicos en los que las observaciones componen una muestra i.i.d. de una mezcla de dos gaussianos. Esto se logra mediante (i) estudiando la secuencia de parámetros de la ejecución idealizada de EM en el límite de muestra infinito y caracterizando completamente los puntos de límite de la secuencia en términos de los parámetros iniciales; y luego (ii) en función de este análisis de convergencia, estableciendo la coherencia estadística (o falta de ella) para la secuencia real de parámetros producidos por EM.
La maximización de expectativas (EM) se encuentra entre los algoritmos más populares para calcular los parámetros de los modelos estadísticos. Sin embargo, EM, que es un algoritmo iterativo basado en el principio de probabilidad máxima, generalmente solo se garantiza encontrar puntos estacionarios del objetivo de probabilidad, y estos puntos pueden estar lejos de cualquier maximizador. En este artículo se aborda esta desconexión entre los principios estadísticos detrás de EM y sus propiedades algorítmicas. En concreto, proporciona un análisis global de EM para modelos específicos en los que las observaciones componen una muestra i.i.d. de una mezcla de dos gaussianos. Esto se logra mediante (i) estudiando la secuencia de parámetros de la ejecución idealizada de EM en el límite de muestra infinito y caracterizando completamente los puntos de límite de la secuencia en términos de los parámetros iniciales; y luego (ii) en función de este análisis de convergencia, estableciendo la coherencia estadística (o falta de ella) para la secuencia real de parámetros producidos por EM.
¿Quiere hacer algún comentario? Comunique un problema aquí.