Episodio

Desarrollo colaborativo en R: Un caso práctico con el paquete dispersobn

con Bryon Aragam

¡usuario! Conferencia internacional de R User 2017

useR!2017: Desarrollo colaborativo en R: A Case S...

Con la enorme popularidad de R en las estadísticas y las comunidades de ciencia de datos junto con el movimiento reciente hacia el desarrollo abierto y la investigación reproducible con CRAN y GitHub, R se ha convertido en el go-to de facto para el software estadístico de vanguardia. Con este movimiento, un problema al que se enfrentan muchos grupos es la forma en que los programadores individuales pueden trabajar en bases de código relacionadas de una manera abierta y colaborativa, a la vez que se destacan las buenas prácticas de software y la investigación reproducible. El paquete dispersobn, publicado recientemente en CRAN, es un ejemplo de este dilema: sparsebn es una familia de paquetes para aprender modelos gráficos, con diferentes algoritmos adaptados para diferentes tipos de datos. Aunque cada algoritmo comparte muchas similitudes, diferentes investigadores y programadores estaban a cargo de implementar algoritmos diferentes. En lugar de liberar paquetes dispares y no relacionados, nuestro grupo desarrolló una familia compartida de paquetes con el fin de simplificar la adición de nuevos algoritmos para minimizar la sobrecarga de programación (el temido trabajo de "data munging" y "fontanería"). En esta charla, usaré sparsebn como caso práctico en investigación y desarrollo colaborativo, que ilustra tanto el proceso de desarrollo como los frutos de nuestro trabajo: un paquete rápido y moderno para aprender modelos gráficos que aprovechan las tendencias más avanzadas en estadísticas y aprendizaje automático de alta dimensión.

useR!2017: Desarrollo colaborativo en R: A Case S...