Episódio
Análise global da maximização da expectativa para misturas de dois gaussianos
por Ji Xu
A Maximização de Expectativas (EM) está entre os algoritmos mais populares para estimar parâmetros de modelos estatísticos. No entanto, o EM, que é um algoritmo iterativo baseado no princípio da máxima verossimilhança, geralmente só tem a garantia de encontrar pontos estacionários do objetivo de verossimilhança, e esses pontos podem estar longe de qualquer maximizador. Este artigo aborda essa desconexão entre os princípios estatísticos por trás do EM e suas propriedades algorítmicas. Especificamente, ele fornece uma análise global de EM para modelos específicos nos quais as observações compreendem uma amostra i.i.d. de uma mistura de dois gaussianos. Isso é conseguido (i) estudando a sequência de parâmetros da execução idealizada de EM no limite de amostra infinita e caracterizando totalmente os pontos limite da sequência em termos dos parâmetros iniciais; e então (ii) com base nessa análise de convergência, estabelecendo consistência estatística (ou falta dela) para a sequência real de parâmetros produzidos pelo ME.
A Maximização de Expectativas (EM) está entre os algoritmos mais populares para estimar parâmetros de modelos estatísticos. No entanto, o EM, que é um algoritmo iterativo baseado no princípio da máxima verossimilhança, geralmente só tem a garantia de encontrar pontos estacionários do objetivo de verossimilhança, e esses pontos podem estar longe de qualquer maximizador. Este artigo aborda essa desconexão entre os princípios estatísticos por trás do EM e suas propriedades algorítmicas. Especificamente, ele fornece uma análise global de EM para modelos específicos nos quais as observações compreendem uma amostra i.i.d. de uma mistura de dois gaussianos. Isso é conseguido (i) estudando a sequência de parâmetros da execução idealizada de EM no limite de amostra infinita e caracterizando totalmente os pontos limite da sequência em termos dos parâmetros iniciais; e então (ii) com base nessa análise de convergência, estabelecendo consistência estatística (ou falta dela) para a sequência real de parâmetros produzidos pelo ME.
Tem comentários? Envie um problema aqui.