Episode
Mengarsipkan studi yang dapat direproduksi secara otomatis dengan Docker
dengan Daniel Nüst
useR!2017: Pengarsipan stu yang dapat direproduksi secara otomatis...
Kata Kunci: Docker, Penelitian yang Dapat Direproduksi, Ilmu Terbuka
Halaman web: https://github.com/o2r-project/containerit/
Reproduksi komputasi sangat penting di era di mana data lahir secara digital dan dianalisa secara algoritma. Namun sebagian besar studi hanya menerbitkan hasilnya, seringkali dengan angka sebagai output penting yang ditafsirkan. Tapi dari mana asal angka-angka ini? Artikel scholarly harus memberikan tidak hanya deskripsi pekerjaan tetapi disertai dengan data dan perangkat lunak. R menawarkan alat yang sangat baik untuk membuat karya yang dapat direproduksi , yaitu Sweave dan RMarkdown. Beberapa pendekatan untuk menangkap lingkungan ruang kerja di R telah dibuat, bekerja seputar pilihan CRAN yang disederhanakan untuk tidak memberikan penerapan versi paket eksplisit dan dependensinya. Mereka mempertahankan kumpulan paket secara lokal (packrat, pkgsnap, switchr/GRANBase) atau jarak jauh (titik pemeriksaan timemachine/MRAN), atau menginstal versi tertentu dari CRAN atau sumber (requireGitHub, devtools). Alat penginstal untuk versi lama R diarsipkan di CRAN. Pengguna dapat membuat ulang lingkungan tertentu secara manual, tetapi ini adalah tugas yang rumit.
Kami memperkenalkan kemungkinan baru untuk mempertahankan lingkungan runtime termasuk, paket dan R, dengan menambahkan lapisan abstraksi dalam bentuk kontainer, yang dapat menjalankan skrip atau menjalankan sesi interaktif. Paket containeRit secara otomatis membuat kontainer tersebut berdasarkan Docker. Docker adalah solusi untuk mengemas aplikasi dan dependensinya, tetapi terbukti berguna dalam konteks penelitian yang dapat direproduksi (Boettiger 2015). Paket membuat manifes kontainer, Dockerfile, yang biasanya ditulis dengan tangan, dari sessionInfo(), skrip R , atau dokumen RMarkdown. Dockerfiles menggunakan gambar komunitas Rocker sebagai gambar dasar. Docker dapat membangun gambar yang dapat dieksekusi dari Dockerfile. Gambar dapat dieksekusi di mana saja runtime Docker ada. containeRit menggunakan pelabuhan untuk membangun gambar dan menjalankan kontainer, dan sysreqs untuk menginstal dependensi sistem paket R. Sebelum rilis CRAN yang direncanakan, kami ingin berbagi pekerjaan, diskusikan tantangan terbuka seperti menangani pustaka yang ditautkan (lihat diskusi tentang pustaka geospasial di Rocker), dan sambut umpan balik komunitas.
containeRit dikembangkan dalam proyek yang didanai DFG Opening Reproducible Research untuk mendukung pembuatan Executable Research Compendia (ERC) (Nüst et al. 2017).
Referensi Boettiger, Carl. 2015. "Pengantar Docker untuk Penelitian yang Dapat Direproduksi, dengan Contoh dari Lingkungan R." ACM SIGOPS Operating Systems Review 49 (Januari): 71–79. doi:10.1145/2723872.2723882.
Nüst, Daniel, Markus Konkol, Edzer Pebesma, Christian Kray, Marc Schutzeichel, Holger Przibytzin, dan Jörg Lorenz. 2017. "Membuka Proses Publikasi dengan Executable Research Compendia." Majalah D-Lib 23 (Januari). doi:10.1045/january2017-nuest.
useR!2017: Pengarsipan stu yang dapat direproduksi secara otomatis...
Kata Kunci: Docker, Penelitian yang Dapat Direproduksi, Ilmu Terbuka
Halaman web: https://github.com/o2r-project/containerit/
Reproduksi komputasi sangat penting di era di mana data lahir secara digital dan dianalisa secara algoritma. Namun sebagian besar studi hanya menerbitkan hasilnya, seringkali dengan angka sebagai output penting yang ditafsirkan. Tapi dari mana asal angka-angka ini? Artikel scholarly harus memberikan tidak hanya deskripsi pekerjaan tetapi disertai dengan data dan perangkat lunak. R menawarkan alat yang sangat baik untuk membuat karya yang dapat direproduksi , yaitu Sweave dan RMarkdown. Beberapa pendekatan untuk menangkap lingkungan ruang kerja di R telah dibuat, bekerja seputar pilihan CRAN yang disederhanakan untuk tidak memberikan penerapan versi paket eksplisit dan dependensinya. Mereka mempertahankan kumpulan paket secara lokal (packrat, pkgsnap, switchr/GRANBase) atau jarak jauh (titik pemeriksaan timemachine/MRAN), atau menginstal versi tertentu dari CRAN atau sumber (requireGitHub, devtools). Alat penginstal untuk versi lama R diarsipkan di CRAN. Pengguna dapat membuat ulang lingkungan tertentu secara manual, tetapi ini adalah tugas yang rumit.
Kami memperkenalkan kemungkinan baru untuk mempertahankan lingkungan runtime termasuk, paket dan R, dengan menambahkan lapisan abstraksi dalam bentuk kontainer, yang dapat menjalankan skrip atau menjalankan sesi interaktif. Paket containeRit secara otomatis membuat kontainer tersebut berdasarkan Docker. Docker adalah solusi untuk mengemas aplikasi dan dependensinya, tetapi terbukti berguna dalam konteks penelitian yang dapat direproduksi (Boettiger 2015). Paket membuat manifes kontainer, Dockerfile, yang biasanya ditulis dengan tangan, dari sessionInfo(), skrip R , atau dokumen RMarkdown. Dockerfiles menggunakan gambar komunitas Rocker sebagai gambar dasar. Docker dapat membangun gambar yang dapat dieksekusi dari Dockerfile. Gambar dapat dieksekusi di mana saja runtime Docker ada. containeRit menggunakan pelabuhan untuk membangun gambar dan menjalankan kontainer, dan sysreqs untuk menginstal dependensi sistem paket R. Sebelum rilis CRAN yang direncanakan, kami ingin berbagi pekerjaan, diskusikan tantangan terbuka seperti menangani pustaka yang ditautkan (lihat diskusi tentang pustaka geospasial di Rocker), dan sambut umpan balik komunitas.
containeRit dikembangkan dalam proyek yang didanai DFG Opening Reproducible Research untuk mendukung pembuatan Executable Research Compendia (ERC) (Nüst et al. 2017).
Referensi Boettiger, Carl. 2015. "Pengantar Docker untuk Penelitian yang Dapat Direproduksi, dengan Contoh dari Lingkungan R." ACM SIGOPS Operating Systems Review 49 (Januari): 71–79. doi:10.1145/2723872.2723882.
Nüst, Daniel, Markus Konkol, Edzer Pebesma, Christian Kray, Marc Schutzeichel, Holger Przibytzin, dan Jörg Lorenz. 2017. "Membuka Proses Publikasi dengan Executable Research Compendia." Majalah D-Lib 23 (Januari). doi:10.1045/january2017-nuest.
Memiliki umpan balik? Kirimkan masalah di sini.