Episodio
Estimación de los parámetros de una cadena de Markov en tiempo continuo de datos discretos con ctmcd
con Marius Pfeuffer
useR!2017: Estimación de los parámetros de un Continuou...
Palabras clave: Insertar problema, matriz del generador, cadena markov en tiempo continuo, cadena de Markov en tiempo discreto
Páginas web: https://CRAN.R-project.org/package=ctmcd
La estimación de los parámetros de una cadena de Markov en tiempo continuo a partir de datos en tiempo discreto es un problema estadístico importante que se produce en una amplia gama de aplicaciones: por ejemplo, con el análisis de datos de secuencia genética, para la inferencia causal en la telemetría, para describir la dinámica de los sistemas cuánticos abiertos en la física, o en el modelado de riesgo de crédito basado en clasificación para nombrar solo algunos.
Los parámetros de una cadena de Markov en tiempo continuo se denominan matriz del generador (también: matriz de velocidad de transición o matriz de intensidad) y el problema de estimar matrices de generador de datos en tiempo discreto también se conoce como el problema de inserción de cadenas de Markov. Para tratar con esta ubicación de datos que falta, se han desarrollado diversos enfoques de estimación. Estos componen los ajustes de las soluciones candidatas basadas en logaritmo de matriz de los datos discretos agregados, véase (Israel, Rosental y Wei 2001) o (Kreinin y Sidelnikova 2001). Además, la inferencia de probabilidad se puede llevar a cabo mediante una instancia del algoritmo de maximización de expectativas (EM) y la inferencia bayesiana mediante un procedimiento de muestreo de Gibbs basado en la distribución gamma conjugada antes (Bladt y Sørensen 2005).
El paquete de R ctmcd (Pfeuffer 2016) es la primera implementación disponible públicamente de los enfoques enumerados anteriormente. Además de las estimaciones puntuales de matrices generadoras, el paquete también contiene métodos para derivar intervalos de confianza y credibilidad. Las funcionalidades del paquete se ilustran mediante los datos de transición de calificación de crédito discretos de Standard & Poor's. Por otra parte, se analizan los problemas descentralizados de los enfoques descritos, es decir, la derivación de las expectativas condicionales del algoritmo E-Step en el algoritmo EM y el muestreo de trayectorias de cadena markov continuas condicionadas por puntos de conexión para el muestreador de Gibbs.
Hace referencia a Bladt, M., y M. Sørensen. 2005. "Inferencia estadística para procesos de salto de Markov observados discretamente". Diario de la Real Sociedad Estadística B.
Israel, R. B., J. S. Rosental, y J. Z. Wei. 2001. "Buscar generadores para cadenas de Markov a través de matrices de transición empírica, con aplicaciones a calificaciones de crédito". Finanzas matemáticas.
Kreinin, A., y M. Sidelnikova. 2001. "Algoritmos de regularización para matrices de transición". Algo Research Quarterly.
Pfeuffer, M. 2016. "ctmcd: un paquete de R para estimar los parámetros de una cadena de Markov en tiempo continuo de datos discretos". En Revisión (diario de R).
useR!2017: Estimación de los parámetros de un Continuou...
Palabras clave: Insertar problema, matriz del generador, cadena markov en tiempo continuo, cadena de Markov en tiempo discreto
Páginas web: https://CRAN.R-project.org/package=ctmcd
La estimación de los parámetros de una cadena de Markov en tiempo continuo a partir de datos en tiempo discreto es un problema estadístico importante que se produce en una amplia gama de aplicaciones: por ejemplo, con el análisis de datos de secuencia genética, para la inferencia causal en la telemetría, para describir la dinámica de los sistemas cuánticos abiertos en la física, o en el modelado de riesgo de crédito basado en clasificación para nombrar solo algunos.
Los parámetros de una cadena de Markov en tiempo continuo se denominan matriz del generador (también: matriz de velocidad de transición o matriz de intensidad) y el problema de estimar matrices de generador de datos en tiempo discreto también se conoce como el problema de inserción de cadenas de Markov. Para tratar con esta ubicación de datos que falta, se han desarrollado diversos enfoques de estimación. Estos componen los ajustes de las soluciones candidatas basadas en logaritmo de matriz de los datos discretos agregados, véase (Israel, Rosental y Wei 2001) o (Kreinin y Sidelnikova 2001). Además, la inferencia de probabilidad se puede llevar a cabo mediante una instancia del algoritmo de maximización de expectativas (EM) y la inferencia bayesiana mediante un procedimiento de muestreo de Gibbs basado en la distribución gamma conjugada antes (Bladt y Sørensen 2005).
El paquete de R ctmcd (Pfeuffer 2016) es la primera implementación disponible públicamente de los enfoques enumerados anteriormente. Además de las estimaciones puntuales de matrices generadoras, el paquete también contiene métodos para derivar intervalos de confianza y credibilidad. Las funcionalidades del paquete se ilustran mediante los datos de transición de calificación de crédito discretos de Standard & Poor's. Por otra parte, se analizan los problemas descentralizados de los enfoques descritos, es decir, la derivación de las expectativas condicionales del algoritmo E-Step en el algoritmo EM y el muestreo de trayectorias de cadena markov continuas condicionadas por puntos de conexión para el muestreador de Gibbs.
Hace referencia a Bladt, M., y M. Sørensen. 2005. "Inferencia estadística para procesos de salto de Markov observados discretamente". Diario de la Real Sociedad Estadística B.
Israel, R. B., J. S. Rosental, y J. Z. Wei. 2001. "Buscar generadores para cadenas de Markov a través de matrices de transición empírica, con aplicaciones a calificaciones de crédito". Finanzas matemáticas.
Kreinin, A., y M. Sidelnikova. 2001. "Algoritmos de regularización para matrices de transición". Algo Research Quarterly.
Pfeuffer, M. 2016. "ctmcd: un paquete de R para estimar los parámetros de una cadena de Markov en tiempo continuo de datos discretos". En Revisión (diario de R).
¿Quiere hacer algún comentario? Comunique un problema aquí.