Bagikan melalui


Peran dan tugas dalam Proses Ilmu Data Tim

Team Data Science Process (TDSP) adalah kerangka kerja yang dikembangkan oleh Microsoft yang menyediakan metodologi terstruktur untuk membangun solusi analitik prediktif dan aplikasi cerdas secara efisien. Artikel ini menguraikan peran personel utama dan tugas terkait untuk standarisasi tim sains data pada proses ini.

Lingkungan yang kompatibel dengan Git disarankan untuk melengkapi artefak MLflow yang disimpan di Azure Pembelajaran Mesin. Azure Pembelajaran Mesin terintegrasi dengan repositori Git, sehingga Anda dapat menggunakan banyak layanan yang kompatibel dengan Git, seperti GitHub, GitLab, Bitbucket, Azure DevOps, atau layanan lain yang kompatibel dengan Git.

Struktur grup dan tim sains data

Fungsi ilmu data di perusahaan sering diatur dalam hierarki berikut:

  • Grup ilmu data
  • Tim ilmu data dalam grup

Dalam struktur seperti itu, ada pemimpin kelompok dan pemimpin tim. Biasanya, tim ilmu data melakukan proyek ilmu data. Tim sains data memiliki prospek proyek untuk manajemen proyek dan tugas tata kelola, dan ilmuwan dan insinyur data individu untuk melakukan sains data dan bagian rekayasa data dari proyek. Prospek grup, tim, atau proyek melakukan penyiapan dan tata kelola proyek awal.

Definisi dan tugas untuk empat peran TDSP

Dengan asumsi bahwa unit sains data terdiri dari tim dalam kelompok, ada empat peran berbeda untuk personel TDSP:

  • Manajer grup: Mengelola seluruh unit ilmu data di perusahaan. Unit ilmu data mungkin memiliki beberapa tim, yang masing-masing bekerja pada beberapa proyek ilmu data di area bisnis yang berbeda. Manajer grup mungkin mendelegasikan tugas mereka ke pengganti, tetapi tugas yang terkait dengan peran tidak berubah.

  • Pemimpin tim: Mengelola tim di unit ilmu data perusahaan. Tim terdiri dari ilmuwan data. Untuk unit ilmu data kecil, manajer grup dan pemimpin tim mungkin orang yang sama.

  • Prospek proyek: Mengelola aktivitas harian masing-masing ilmuwan data pada proyek ilmu data tertentu.

  • Kontributor individu proyek: Ilmuwan data, analis bisnis, insinyur data, arsitek, dan lainnya yang menjalankan proyek ilmu data.

Catatan

Bergantung pada struktur dan ukuran perusahaan, satu orang mungkin memiliki lebih dari satu peran, atau lebih dari satu orang mungkin mengisi peran.

Tugas untuk empat peran

Diagram berikut menunjukkan tugas tingkat atas untuk setiap peran TDSP. Gambaran umum ini dan kerangka tugas terperinci berikut untuk setiap peran TDSP dapat membantu Anda memilih tutorial yang Anda butuhkan berdasarkan tanggung jawab Anda.

Diagram yang memperlihatkan gambaran umum peran dan tugas.

Tugas manajer grup

Manajer grup atau administrator sistem TDSP yang ditunjuk menyelesaikan tugas berikut untuk mengadopsi TDSP:

  • Membuat organisasi Azure DevOps dan proyek grup dalam organisasi.

  • Membuat repositori templat proyek di proyek grup Azure DevOps, dan menaburkannya dari repositori templat proyek yang dikembangkan oleh tim Microsoft TDSP. Repositori templat proyek Microsoft TDSP menyediakan:

    • Struktur direktori standar, termasuk direktori untuk data, kode, dan dokumen.
    • Sekumpulan templat dokumen standar untuk memandu proses sains data yang efisien.
  • Membuat repositori utilitas, dan benihnya dari repositori utilitas yang dikembangkan oleh tim Microsoft TDSP. Repositori utilitas TDSP dari Microsoft menyediakan serangkaian utilitas yang berguna untuk membuat pekerjaan seorang ilmuwan data lebih efisien. Repositori utilitas Microsoft mencakup utilitas untuk eksplorasi, analisis, pelaporan, dan pemodelan dan pelaporan data interaktif.

  • Menyiapkan kebijakan kontrol keamanan untuk akun organisasi.

Untuk informasi selengkapnya, lihat Tugas manajer grup untuk tim ilmu data.

Tugas prospek tim

Pemimpin tim atau administrator proyek yang ditunjuk menyelesaikan tugas berikut untuk mengadopsi TDSP:

  • Membuat proyek tim di organisasi Azure DevOps grup.

  • Membuat repositori templat proyek dalam proyek, dan menyemainya dari repositori templat proyek grup yang disiapkan oleh manajer grup atau delegasi.

  • Membuat repositori utilitas tim, menaburkannya dari repositori utilitas grup, dan menambahkan utilitas khusus tim ke repositori.

  • Secara opsional membuat penyimpanan file Microsoft Azure untuk menyimpan aset data yang berguna untuk tim. Anggota tim lain dapat memasang penyimpanan file cloud bersama ini di desktop analitik mereka.

  • Secara opsional memasang Azure Files di komputer virtual ilmu data tim dan menambahkan aset data tim ke dalamnya.

  • Menyiapkan kontrol keamanan dengan menambahkan anggota tim dan mengonfigurasi izin mereka.

Untuk informasi selengkapnya, lihat Tugas prospek tim untuk tim ilmu data.

Tugas prospek proyek

Prospek proyek menyelesaikan tugas berikut untuk mengadopsi TDSP:

  • Membuat repositori proyek dalam proyek tim, dan benih itu dari repositori templat proyek.

  • Secara opsional membuat penyimpanan file Microsoft Azure untuk menyimpan aset data proyek.

  • Secara opsional memasang Azure Files ke komputer virtual ilmu data dan menambahkan aset data proyek ke dalamnya.

  • Menyetel kontrol keamanan dengan menambahkan anggota proyek dan mengonfigurasi izin mereka.

Untuk informasi selengkapnya, lihat Tugas prospek proyek untuk tim ilmu data.

Tugas kontributor individual proyek

Kontributor individu proyek, biasanya seorang ilmuwan data, melakukan tugas-tugas berikut menggunakan TDSP:

  • Mengkloning repositori proyek yang disiapkan oleh pimpinan proyek.

  • Secara opsional memasang tim bersama dan memproyeksikan penyimpanan file Azure di komputer virtual ilmu data mereka.

  • Menjalankan proyek.

Untuk informasi selengkapnya, lihat Tugas kontributor individual proyek untuk tim ilmu data.

Alur kerja eksekusi proyek ilmu data

Ilmuwan data, prospek proyek, dan prospek tim dapat membuat item kerja untuk melacak semua tugas dan tahapan untuk proyek dari awal hingga akhir. Gambar berikut menguraikan alur kerja TDSP untuk eksekusi proyek:

Diagram yang memperlihatkan alur kerja proyek ilmu data yang khas.

Langkah-langkah alur kerja dapat dikelompokkan ke dalam tiga aktivitas:

  • Prospek proyek melakukan perencanaan sprint.

  • Ilmuwan data mengembangkan artefak di git cabang untuk mengatasi item kerja.

  • Prospek proyek atau anggota tim lainnya melakukan tinjauan kode dan menggabungkan cabang kerja ke cabang utama.

Kontributor

Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.

Penulis utama:

Untuk melihat profil LinkedIn non-publik, masuk ke LinkedIn.