剧集

R 中的协作开发:使用稀疏包的案例研究

替换为 Bryon Aragam

useR!2017:R 中的协作开发:案例 S...

随着 R 在统计数据和数据科学界的大规模普及,以及最近与 CRAN 和 GitHub 进行开放开发和可重现性研究的运动,R 已成为前沿统计软件的事实上。 通过这种移动,许多组面临的问题在于,各个程序员如何以开放、协作的方式处理相关代码库,同时强调良好的软件实践和可重现的研究。 最近在 CRAN 上发布的稀疏包是这种困境的一个例子:稀疏包是一系列用于学习图形模型的包,为不同类型的数据定制不同的算法。 尽管每个算法都有许多相似之处,但不同的研究人员和程序员负责实现不同的算法。 我们的团队没有发布不同的不相关的包,而是开发了一系列共享的包,以简化新算法的添加,以尽量减少编程开销(可怕的“数据混入”和“管道”工作)。 在此演讲中,我将使用稀疏作为协作研究和开发的案例研究,说明开发过程和劳动成果:一个快速、现代的学习图形模型包,利用高维统计信息和机器学习的前沿趋势。