Bagikan melalui


Operasi pembelajaran mesin

Operasi pembelajaran mesin (juga disebut MLOps) adalah penerapan prinsip DevOps untuk aplikasi yang diinfus AI. Untuk menerapkan operasi pembelajaran mesin dalam organisasi, keterampilan, proses, dan teknologi khusus harus diberlakukan. Tujuannya adalah untuk memberikan solusi pembelajaran mesin yang kuat, dapat diskalakan, dapat diandalkan, dan otomatis.

Dalam artikel ini, pelajari cara merencanakan sumber daya untuk mendukung operasi pembelajaran mesin di tingkat organisasi. Tinjau praktik dan rekomendasi terbaik yang didasarkan pada penggunaan Azure Pembelajaran Mesin untuk mengadopsi operasi pembelajaran mesin di perusahaan.

Apa itu operasi pembelajaran mesin?

Algoritma dan kerangka kerja pembelajaran mesin modern membuatnya semakin mudah untuk mengembangkan model yang dapat membuat prediksi yang akurat. Operasi pembelajaran mesin adalah cara terstruktur untuk menggabungkan pembelajaran mesin dalam pengembangan aplikasi di perusahaan.

Dalam contoh skenario, Anda telah membangun model pembelajaran mesin yang melebihi semua ekspektasi akurasi Anda dan mengesankan sponsor bisnis Anda. Sekarang saatnya untuk menyebarkan model ke produksi, tetapi itu mungkin tidak sem mudah seperti yang Anda harapkan. Organisasi kemungkinan harus memiliki orang, proses, dan teknologi sebelum dapat menggunakan model pembelajaran mesin Anda dalam produksi.

Seiring waktu, Anda atau kolega mungkin mengembangkan model baru yang bekerja lebih baik daripada model aslinya. Mengganti model pembelajaran mesin yang digunakan dalam produksi memperkenalkan beberapa kekhawatiran yang penting untuk organisasi:

  • Anda mungkin ingin menerapkan model baru tanpa mengganggu operasi bisnis yang bergantung pada model yang disebarkan.
  • Untuk tujuan peraturan, Anda mungkin diharuskan untuk menjelaskan prediksi model atau membuat ulang model jika prediksi yang tidak biasa atau bias dihasilkan dari data dalam model baru.
  • Data yang Anda gunakan dalam pelatihan dan model pembelajaran mesin Anda mungkin berubah dari waktu ke waktu. Dengan perubahan data, Anda mungkin perlu melatih kembali model secara berkala untuk mempertahankan akurasi prediksinya. Seseorang atau peran harus diberi tanggung jawab untuk memberi makan data, memantau performa model, melatih kembali model, dan memperbaiki model jika gagal.

Misalkan Anda memiliki aplikasi yang melayani prediksi model melalui REST API. Bahkan kasus penggunaan sederhana seperti ini dapat menyebabkan masalah dalam produksi. Menerapkan strategi operasi pembelajaran mesin dapat membantu Anda mengatasi masalah penyebaran dan mendukung operasi bisnis yang mengandalkan aplikasi yang diinfus AI.

Beberapa tugas operasi pembelajaran mesin cocok dengan baik dalam kerangka kerja DevOps umum. Contohnya termasuk menyiapkan pengujian unit dan pengujian integrasi dan melacak perubahan dengan menggunakan kontrol versi. Tugas lain lebih unik untuk operasi pembelajaran mesin dan mungkin mencakup:

  • Aktifkan eksperimen dan perbandingan berkelanjutan terhadap model garis besar.
  • Pantau data masuk untuk mendeteksi penyimpangan data.
  • Memicu pelatihan ulang model dan menyiapkan pembatalan untuk pemulihan bencana.
  • Buat alur data yang dapat digunakan kembali untuk pelatihan dan penilaian.

Tujuan operasi pembelajaran mesin adalah untuk menutup kesenjangan antara pengembangan dan produksi dan untuk memberikan nilai kepada pelanggan lebih cepat. Untuk mencapai tujuan ini, Anda harus memikirkan kembali proses pengembangan dan produksi tradisional.

Tidak setiap persyaratan operasi pembelajaran mesin organisasi sama. Arsitektur operasi pembelajaran mesin dari perusahaan multinasional besar mungkin tidak akan menjadi infrastruktur yang sama dengan yang didirikan startup kecil. Organisasi biasanya mulai kecil dan dibangun seiring dengan kematangan, katalog model, dan pengalaman mereka tumbuh.

Model kematangan operasi pembelajaran mesin dapat membantu Anda melihat di mana organisasi Anda berada dalam skala kematangan operasi pembelajaran mesin dan membantu Anda merencanakan pertumbuhan di masa mendatang.

Operasi pembelajaran mesin vs. DevOps

Operasi pembelajaran mesin berbeda dari DevOps di beberapa area utama. Operasi pembelajaran mesin memiliki karakteristik berikut:

  • Eksplorasi mendahului pengembangan dan operasi.
  • Siklus hidup ilmu data membutuhkan cara kerja yang adaptif.
  • Batasan kualitas data dan kemajuan batas ketersediaan.
  • Upaya operasional yang lebih besar diperlukan daripada di DevOps.
  • Tim kerja memerlukan spesialis dan pakar domain.

Untuk ringkasan, tinjau tujuh prinsip operasi pembelajaran mesin.

Eksplorasi dilakukan sebelum pengembangan dan operasi

Proyek ilmu data berbeda dari pengembangan aplikasi atau proyek teknik data. Proyek ilmu data mungkin berhasil diproduksi, tetapi seringkali lebih banyak langkah yang terlibat daripada dalam penyebaran tradisional. Setelah analisis awal, akan menjadi jelas bahwa hasil bisnis tidak dapat dicapai dengan himpunan data yang tersedia. Fase eksplorasi yang lebih rinci biasanya adalah langkah pertama dalam proyek ilmu data.

Tujuan dari fase eksplorasi adalah untuk menentukan dan memperbaiki masalah. Selama fase ini, ilmuwan data menjalankan analisis data eksploratif. Mereka menggunakan statistik dan visualisasi untuk mengonfirmasi atau memalsukan hipotesis masalah. Pemangku kepentingan harus memahami bahwa proyek mungkin tidak melampaui fase ini. Pada saat yang sama, penting untuk membuat fase ini semulus mungkin untuk penyelesaian cepat. Kecuali masalah yang harus diselesaikan mencakup elemen keamanan, hindari membatasi fase eksplorasi dengan proses dan prosedur. Ilmuwan data harus diizinkan untuk bekerja dengan alat dan data yang mereka sukai. Data nyata diperlukan untuk pekerjaan eksplorasi ini.

Proyek ini dapat beralih ke tahap eksperimen dan pengembangan ketika pemangku kepentingan yakin bahwa proyek ilmu data layak dan dapat memberikan nilai bisnis yang nyata. Pada tahap ini, praktik pengembangan menjadi semakin penting. Pengambilan metrik untuk semua eksperimen yang dilakukan pada tahap ini adalah praktik yang baik. Penting juga untuk menggabungkan kontrol sumber sehingga Anda dapat membandingkan model dan beralih di antara berbagai versi kode.

Aktivitas pengembangan termasuk pemfaktoran ulang, pengujian, dan otomatisasi kode eksplorasi dalam alur eksperimen berulang. Organisasi harus membuat aplikasi dan alur untuk melayani model. Merefaktor kode dalam komponen dan pustaka modular membantu meningkatkan penggunaan kembali, pengujian, dan pengoptimalan performa.

Terakhir, alur inferensi aplikasi atau batch yang melayani model disebarkan ke lingkungan penahapan atau produksi. Selain memantau keandalan dan performa infrastruktur seperti untuk aplikasi standar, dalam penyebaran model pembelajaran mesin, Anda harus terus memantau kualitas data, profil data, dan model untuk degradasi atau penyimpangan. Model pembelajaran mesin juga memerlukan pelatihan ulang dari waktu ke waktu untuk tetap relevan dalam lingkungan yang berubah.

Diagram tahap DevOps pembelajaran mesin menjelajahi, bereksperimen, dan mengembangkan, dan beroperasi.

Siklus hidup ilmu data butuh cara kerja yang adaptif

Karena sifat dan kualitas data awalnya tidak pasti, Anda mungkin tidak mencapai tujuan bisnis Anda jika Anda menerapkan proses DevOps yang khas ke proyek ilmu data. Eksplorasi dan eksperimen adalah aktivitas dan kebutuhan berulang sepanjang proses pembelajaran mesin. Tim di Microsoft menggunakan siklus hidup proyek dan proses kerja yang mencerminkan sifat aktivitas khusus ilmu data. Proses Ilmu Data Tim dan Proses Siklus Hidup Ilmu Data merupakan contoh implementasi referensi.

Batasan kualitas data dan kemajuan batas ketersediaan

Agar tim pembelajaran mesin dapat mengembangkan aplikasi yang diinfus pembelajaran mesin secara efektif, akses ke data produksi lebih disukai untuk semua lingkungan kerja yang relevan. Jika akses data produksi tidak dimungkinkan karena persyaratan kepatuhan atau batasan teknis, pertimbangkan untuk menerapkan kontrol akses berbasis peran Azure (Azure RBAC) dengan Azure Pembelajaran Mesin, akses just-in-time, atau alur pergerakan data untuk membuat replika data produksi dan meningkatkan produktivitas pengguna.

Pembelajaran mesin butuh upaya operasional yang lebih besar

Tidak seperti perangkat lunak tradisional, performa solusi pembelajaran mesin terus berisiko karena solusinya tergantung pada kualitas data. Untuk mempertahankan solusi kualitatif dalam produksi, sangat penting bagi Anda untuk terus memantau dan mengevaluasi kembali kualitas data dan model. Diharapkan bahwa model produksi akan membutuhkan pelatihan ulang, penempatan ulang, dan penyetelan yang tepat waktu. Tugas-tugas ini berada di atas persyaratan keamanan, pemantauan infrastruktur, dan kepatuhan sehari-hari, dan memerlukan keahlian khusus.

Tim pembelajaran mesin memerlukan spesialis dan pakar domain

Meskipun proyek ilmu data berbagi peran dengan proyek IT reguler, keberhasilan upaya pembelajaran mesin sangat bergantung pada memiliki spesialis teknologi pembelajaran mesin yang penting dan pakar materi pelajaran domain. Seorang spesialis teknologi memiliki latar belakang yang tepat untuk melakukan eksperimen pembelajaran mesin end-to-end. Pakar domain dapat mendukung spesialis dengan menganalisis dan mensintesis data atau dengan data yang memenuhi syarat untuk digunakan.

Peran teknis umum yang unik untuk proyek ilmu data adalah pakar domain, insinyur data, ilmuwan data, insinyur AI, validator model, dan insinyur pembelajaran mesin. Untuk mempelajari selengkapnya tentang peran dan tugas dalam tim ilmu data yang khas, lihat Team Ilmu Data Process.

Tujuh prinsip operasi pembelajaran mesin

Saat Anda berencana untuk mengadopsi operasi pembelajaran mesin di organisasi Anda, pertimbangkan untuk menerapkan prinsip inti berikut sebagai fondasi:

  • Gunakan kontrol versi untuk output kode, data, dan eksperimen. Tidak seperti dalam pengembangan perangkat lunak tradisional, data memiliki pengaruh langsung pada kualitas model pembelajaran mesin. Anda harus membuat versi basis kode eksperimen Anda, tetapi juga membuat versi himpunan data Anda untuk memastikan bahwa Anda dapat mereproduksi eksperimen atau hasil inferensi. Output eksperimen penerapan versi seperti model dapat menghemat upaya dan biaya komputasi untuk membuatnya kembali.

  • Gunakan beberapa lingkungan. Untuk memisahkan pengembangan dan pengujian dari pekerjaan produksi, replikasi infrastruktur Anda di setidaknya dua lingkungan. Kontrol akses untuk pengguna mungkin berbeda untuk setiap lingkungan.

  • Kelola infrastruktur dan konfigurasi Anda sebagai kode. Saat Anda membuat dan memperbarui komponen infrastruktur di lingkungan kerja Anda, gunakan infrastruktur sebagai kode, sehingga inkonsistensi tidak berkembang di lingkungan Anda. Kelola spesifikasi pekerjaan eksperimen pembelajaran mesin sebagai kode sehingga Anda dapat dengan mudah menjalankan ulang dan menggunakan kembali versi eksperimen Anda di beberapa lingkungan.

  • Melacak dan mengelola eksperimen pembelajaran mesin. Lacak indikator performa utama dan artefak lain untuk eksperimen pembelajaran mesin Anda. Ketika Anda menyimpan riwayat performa pekerjaan, Anda dapat melakukan analisis kuantitatif tentang keberhasilan eksperimen dan meningkatkan kolaborasi dan kelincahan tim.

  • Uji kode, validasi integritas data, dan pastikan kualitas model. Uji basis kode eksperimen Anda untuk persiapan data dan fungsi ekstraksi fitur yang benar, integritas data, dan performa model.

  • Integrasi dan pengiriman berkelanjutan pembelajaran mesin. Gunakan integrasi berkelanjutan (CI) untuk mengotomatiskan pengujian untuk tim Anda. Sertakan pelatihan model sebagai bagian dari alur pelatihan berkelanjutan. Sertakan pengujian A/B sebagai bagian dari rilis Anda untuk memastikan bahwa hanya model kualitatif yang digunakan dalam produksi.

  • Memantau layanan, model, dan data. Saat Anda melayani model di lingkungan operasi pembelajaran mesin, sangat penting untuk memantau layanan untuk waktu aktif, kepatuhan, dan kualitas model infrastruktur mereka. Siapkan pemantauan untuk mengidentifikasi data dan penyimpangan model dan untuk memahami apakah pelatihan ulang diperlukan. Pertimbangkan untuk menyiapkan pemicu untuk pelatihan ulang otomatis.

Praktik terbaik dari Azure Pembelajaran Mesin

Azure Pembelajaran Mesin menawarkan layanan manajemen aset, orkestrasi, dan otomatisasi untuk membantu Anda mengelola siklus hidup pelatihan model pembelajaran mesin dan alur kerja penyebaran Anda. Tinjau praktik dan rekomendasi terbaik untuk menerapkan operasi pembelajaran mesin di bidang sumber daya orang, proses, dan teknologi, semuanya didukung oleh Azure Pembelajaran Mesin.

Sosial

  • Bekerja dalam tim proyek untuk paling baik menggunakan pengetahuan spesialis dan domain di organisasi Anda. Siapkan ruang kerja Azure Pembelajaran Mesin untuk setiap proyek agar mematuhi persyaratan pemisahan kasus penggunaan.

  • Tentukan serangkaian tanggung jawab dan tugas sebagai peran sehingga setiap anggota tim pada tim proyek operasi pembelajaran mesin dapat ditetapkan ke dan memenuhi beberapa peran. Gunakan peran kustom di Azure untuk menentukan serangkaian operasi Azure RBAC terperinci untuk Azure Pembelajaran Mesin yang dapat dilakukan setiap peran.

  • Standarisasi pada siklus hidup proyek dan metodologi Agile. Proses Ilmu Data Tim menyediakan implementasi siklus hidup referensi.

  • Tim yang seimbang dapat menjalankan semua tahap operasi pembelajaran mesin, termasuk eksplorasi, pengembangan, dan operasi.

Proses

  • Standarisasi pada templat kode untuk penggunaan kembali kode dan untuk mempercepat waktu peningkatan pada proyek baru atau ketika anggota tim baru bergabung dengan proyek. Gunakan alur Azure Pembelajaran Mesin, skrip pengiriman pekerjaan, dan alur CI/CD sebagai dasar untuk templat baru.

  • Gunakan kontrol versi. Pekerjaan yang dikirimkan dari folder yang didukung Git secara otomatis melacak metadata repositori dengan pekerjaan di Azure Machine Learning untuk reproduktifitas.

  • Gunakan penerapan versi untuk input dan output eksperimen untuk reproduksi. Gunakan himpunan data Azure Pembelajaran Mesin, manajemen model, dan kemampuan manajemen lingkungan untuk memfasilitasi penerapan versi.

  • Bangun riwayat eksekusi eksperimen yang dijalankan untuk perbandingan, perencanaan, dan kolaborasi. Gunakan kerangka kerja pelacakan eksperimen seperti MLflow untuk mengumpulkan metrik.

  • Terus mengukur dan mengontrol kualitas pekerjaan tim Anda melalui CI pada basis kode eksperimen penuh.

  • Hentikan pelatihan di awal proses ketika model tidak bertemu. Gunakan kerangka kerja pelacakan eksperimen dan riwayat eksekusi di Azure Pembelajaran Mesin untuk memantau eksekusi pekerjaan.

  • Tentukan eksperimen dan strategi manajemen model. Pertimbangkan untuk menggunakan nama seperti juara untuk merujuk ke model garis besar saat ini. Model penantang adalah model kandidat yang mungkin mengungguli model juara dalam produksi. Terapkan tag di Azure Pembelajaran Mesin untuk menandai eksperimen dan model. Dalam skenario seperti prakiraan penjualan, mungkin perlu waktu berbulan-bulan untuk menentukan apakah prediksi model akurat.

  • Tingkatkan CI untuk pelatihan berkelanjutan dengan menyertakan pelatihan model dalam build. Misalnya, mulai pelatihan model pada himpunan data lengkap dengan setiap permintaan pull.

  • Persingkat waktu yang diperlukan untuk mendapatkan umpan balik tentang kualitas alur pembelajaran mesin dengan menjalankan build otomatis pada sampel data. Gunakan parameter alur Azure Machine Learning untuk membuat parameter himpunan data input.

  • Gunakan penyebaran berkelanjutan (CD) untuk model pembelajaran mesin untuk mengotomatiskan penyebaran dan pengujian layanan penilaian real time di lingkungan Azure Anda.

  • Di beberapa industri yang diatur, Anda mungkin diharuskan untuk menyelesaikan langkah-langkah validasi model sebelum Anda dapat menggunakan model pembelajaran mesin di lingkungan produksi. Mengotomatiskan langkah-langkah validasi dapat mempercepat waktu pengiriman. Saat tinjauan manual atau langkah validasi masih menjadi hambatan, pertimbangkan apakah Anda dapat mensertifikasi alur validasi model otomatis. Gunakan tag sumber daya di Azure Pembelajaran Mesin untuk menunjukkan kepatuhan aset dan kandidat untuk ditinjau atau sebagai pemicu penyebaran.

  • Jangan pelatihan ulang dalam produksi, lalu langsung ganti model produksi tanpa melakukan pengujian integrasi. Meskipun performa model dan persyaratan fungsional mungkin tampak baik, di antara masalah potensial lainnya, model yang dilatih kembali mungkin memiliki jejak lingkungan yang lebih besar dan merusak lingkungan server.

  • Saat akses data produksi hanya tersedia dalam produksi, gunakan Azure RBAC dan peran kustom untuk memberikan jumlah akses baca praktisi pembelajaran mesin tertentu. Beberapa peran mungkin perlu membaca data untuk eksplorasi data terkait. Atau, buat salinan data tersedia di lingkungan nonproduksi.

  • Setujui konvensi penamaan dan tag untuk eksperimen Azure Machine Learning untuk membedakan pelatihan ulang alur pembelajaran mesin garis besar dari pekerjaan eksperimental.

Teknologi

  • Jika saat ini Anda mengirimkan pekerjaan melalui Azure Pembelajaran Mesin studio UI atau CLI, alih-alih mengirimkan pekerjaan melalui SDK, gunakan tugas Pembelajaran Mesin CLI atau Azure DevOps untuk mengonfigurasi langkah-langkah alur otomatisasi. Proses ini dapat mengurangi jejak kode dengan menggunakan kembali pengiriman pekerjaan yang sama langsung dari alur otomatisasi.

  • Gunakan pemrograman berbasis peristiwa. Misalnya, picu alur pengujian model offline dengan menggunakan Azure Functions setelah model baru terdaftar. Atau, kirim pemberitahuan ke alias email yang ditunjuk saat alur penting gagal dijalankan. Azure Pembelajaran Mesin membuat peristiwa di Azure Event Grid. Beberapa peran dapat berlangganan untuk diberi tahu tentang suatu peristiwa.

  • Saat Anda menggunakan Azure DevOps untuk otomatisasi, gunakan Tugas Azure DevOps untuk Pembelajaran Mesin untuk menggunakan model pembelajaran mesin sebagai pemicu alur.

  • Saat Anda mengembangkan paket Python untuk aplikasi pembelajaran mesin, Anda dapat menghostingnya di repositori Azure DevOps sebagai artefak dan menerbitkannya sebagai umpan. Dengan menggunakan pendekatan ini, Anda dapat mengintegrasikan alur kerja DevOps untuk membangun paket dengan ruang kerja Azure Pembelajaran Mesin Anda.

  • Pertimbangkan untuk menggunakan lingkungan penahapan untuk menguji integrasi sistem alur pembelajaran mesin dengan komponen aplikasi hulu atau hilir.

  • Buat pengujian unit dan integrasi untuk titik akhir inferensi Anda untuk penelusuran kesalahan yang ditingkatkan dan untuk mempercepat waktu penyebaran.

  • Untuk memicu pelatihan ulang, gunakan pemantauan himpunan data dan alur kerja berbasis peristiwa. Berlangganan peristiwa penyimpangan data dan mengotomatiskan pemicu alur pembelajaran mesin untuk pelatihan ulang.

Pabrik AI untuk operasi pembelajaran mesin organisasi

Tim ilmu data mungkin memutuskan dapat mengelola beberapa kasus penggunaan pembelajaran mesin secara internal. Mengadopsi operasi pembelajaran mesin membantu organisasi menyiapkan tim proyek untuk kualitas, keandalan, dan ketahanan solusi yang lebih baik. Melalui tim yang seimbang, proses yang didukung, dan otomatisasi teknologi, tim yang mengadopsi operasi pembelajaran mesin dapat menskalakan dan berfokus pada pengembangan kasus penggunaan baru.

Seiring bertambahnya jumlah kasus penggunaan dalam suatu organisasi, beban manajemen untuk mendukung kasus penggunaan tumbuh secara linier, atau bahkan lebih. Tantangan bagi organisasi menjadi cara mempercepat waktu ke pasar, mendukung penilaian kelayakan kasus penggunaan yang lebih cepat, menerapkan pengulangan, dan menggunakan sumber daya dan keterampilan yang tersedia dengan sebaik-baiknya pada berbagai proyek. Bagi banyak organisasi, mengembangkan pabrik AI adalah solusinya.

Pabrik AI adalah sistem proses bisnis yang dapat diulang dan artefak standar yang memfasilitasi pengembangan dan penyebaran serangkaian kasus penggunaan pembelajaran mesin yang besar. Pabrik AI mengoptimalkan penyiapan tim, praktik yang direkomendasikan, strategi operasi pembelajaran mesin, pola arsitektur, dan templat yang dapat digunakan kembali yang disesuaikan dengan persyaratan bisnis.

Pabrik AI yang berhasil bergantung pada proses yang dapat diulang dan aset yang dapat digunakan kembali untuk membantu organisasi menskalakan secara efisien dari puluhan kasus penggunaan hingga ribuan kasus penggunaan.

Gambar berikut merangkum elemen utama dari pabrik AI:

Diagram elemen kunci pabrik AI.

Standardisasi pola arsitektur berulang

Pengulangan adalah karakteristik utama pabrik AI. Tim ilmu data dapat mempercepat pengembangan proyek dan meningkatkan konsistensi di seluruh proyek dengan mengembangkan beberapa pola arsitektur berulang yang mencakup sebagian besar kasus penggunaan pembelajaran mesin bagi organisasi mereka. Ketika pola-pola ini di tempat, sebagian besar proyek dapat menggunakan pola untuk mendapatkan manfaat berikut:

  • Fase desain yang dipercepat
  • Persetujuan yang dipercepat dari tim IT dan tim keamanan saat mereka menggunakan kembali alat di seluruh proyek
  • Pengembangan yang dipercepat karena infrastruktur yang dapat digunakan kembali sebagai templat kode dan templat proyek

Pola arsitektur dapat mencakup namun tidak terbatas pada topik-topik berikut:

  • Layanan pilihan untuk setiap tahapan proyek
  • Konektivitas dan tata kelola data
  • Strategi operasi pembelajaran mesin yang disesuaikan dengan persyaratan industri, bisnis, atau klasifikasi data
  • Model juara manajemen eksperimen dan penantang

Memfasilitasi kolaborasi dan berbagi antar tim

Repositori dan utilitas kode bersama dapat mempercepat pengembangan solusi pembelajaran mesin. Repositori kode dapat dikembangkan dengan cara modular selama pengembangan proyek sehingga repositori tersebut cukup umum untuk digunakan dalam proyek lain. Repositori ini dapat disediakan di repositori pusat yang dapat diakses oleh semua tim ilmu data.

Berbagi dan menggunakan kembali kekayaan intelektual

Untuk memaksimalkan penggunaan kembali kode, tinjau kekayaan intelektual berikut di awal proyek:

  • Kode internal yang dirancang untuk digunakan kembali di organisasi. Contohnya termasuk paket dan modul.
  • Himpunan data yang dibuat dalam proyek pembelajaran mesin lain atau yang tersedia di ekosistem Azure.
  • Proyek ilmu data yang ada yang memiliki arsitektur dan masalah bisnis yang sama.
  • Repositori GitHub atau sumber terbuka yang dapat mempercepat proyek.

Setiap retrospektif proyek harus menyertakan item tindakan untuk menentukan apakah elemen proyek dapat dibagikan dan digeneralisasi untuk penggunaan kembali yang lebih luas. Daftar aset yang dapat dibagikan dan digunakan kembali oleh organisasi akan diperluas dari waktu ke waktu.

Untuk membantu berbagi dan penemuan, banyak organisasi telah memperkenalkan repositori bersama untuk mengatur cuplikan kode dan artefak pembelajaran mesin. Artefak di Azure Pembelajaran Mesin, termasuk himpunan data, model, lingkungan, dan alur, dapat didefinisikan sebagai kode, sehingga Anda dapat membagikannya secara efisien di seluruh proyek dan ruang kerja.

Template Proyek

Untuk mempercepat proses migrasi solusi yang ada dan untuk memaksimalkan penggunaan kembali kode, banyak organisasi menstandarkan templat proyek untuk memulai proyek baru. Contoh templat proyek yang direkomendasikan untuk digunakan dengan Azure Pembelajaran Mesin adalah contoh Azure Pembelajaran Mesin, Proses Siklus Hidup Ilmu Data, dan Proses Ilmu Data Tim.

Manajemen data pusat

Proses mendapatkan akses ke data untuk eksplorasi atau penggunaan produksi dapat memakan waktu. Banyak organisasi memfokuskan manajemen data untuk menyaingkan produsen data dan konsumen data untuk akses data yang lebih mudah untuk eksperimen pembelajaran mesin.

Utilitas bersama

Organisasi Anda dapat menggunakan dasbor terpusat di seluruh perusahaan untuk mengonsolidasikan informasi pengelogan dan pemantauan. Dasbor mungkin mencakup pengelogan kesalahan, ketersediaan layanan dan telemetri, dan pemantauan performa model.

Gunakan metrik Azure Monitor untuk membangun dasbor untuk Azure Pembelajaran Mesin dan layanan terkait seperti Azure Storage. Dasbor membantu Anda melacak kemajuan eksperimen, menghitung kesehatan infrastruktur, dan pemanfaatan kuota GPU.

Tim teknik pembelajaran mesin spesialis

Banyak organisasi telah menerapkan peran insinyur pembelajaran mesin. Teknisi pembelajaran mesin mengkhususkan diri dalam membuat dan menjalankan alur pembelajaran mesin yang kuat, alur kerja pemantauan dan pelatihan ulang penyimpangan, dan dasbor pemantauan. Insinyur memiliki tanggung jawab keseluruhan untuk mengindustruksi solusi pembelajaran mesin, dari pengembangan hingga produksi. Teknisi bekerja sama dengan rekayasa data, arsitek, keamanan, dan operasi untuk memastikan bahwa semua kontrol yang diperlukan telah diberlakukan.

Meskipun ilmu data membutuhkan keahlian domain yang mendalam, rekayasa pembelajaran mesin lebih berfokus pada teknis. Perbedaannya membuat teknisi pembelajaran mesin lebih fleksibel, sehingga mereka dapat mengerjakan berbagai proyek dan dengan berbagai departemen bisnis. Praktik ilmu data besar mungkin mendapat manfaat dari tim teknik pembelajaran mesin spesialis yang mendorong pengulangan dan penggunaan kembali alur kerja otomatisasi di berbagai kasus penggunaan dan area bisnis.

Pemberdayaan dan dokumentasi

Penting untuk memberikan panduan yang jelas tentang proses pabrik AI untuk tim dan pengguna baru dan yang sudah ada. Panduan membantu memastikan konsistensi dan mengurangi upaya yang diperlukan dari tim teknik pembelajaran mesin saat melakukan industrialisasi proyek. Pertimbangkan untuk merancang konten secara khusus untuk berbagai peran dalam organisasi Anda.

Setiap orang memiliki cara pembelajaran yang unik, sehingga campuran jenis panduan berikut dapat membantu mempercepat adopsi kerangka kerja pabrik AI:

  • Hub pusat yang memiliki tautan ke semua artefak. Misalnya, hub ini mungkin merupakan saluran di Microsoft Teams atau situs Microsoft SharePoint.
  • Pelatihan dan rencana pengaktifan yang dirancang untuk setiap peran.
  • Presentasi ringkasan tingkat tinggi tentang pendekatan dan video pendamping.
  • Dokumen atau playbook terperinci.
  • Video panduan.
  • Penilaian kesiapan.

Operasi pembelajaran mesin dalam seri video Azure

Seri video tentang operasi pembelajaran mesin di Azure menunjukkan kepada Anda cara membuat operasi pembelajaran mesin untuk solusi pembelajaran mesin Anda, dari pengembangan awal hingga produksi.

Etika

Etika memainkan peran instrumental dalam desain solusi AI. Jika prinsip etika tidak diterapkan, model terlatih mungkin menunjukkan bias yang sama yang ada dalam data yang dilatih. Hasilnya mungkin proyek dihentikan. Lebih penting lagi, reputasi organisasi mungkin berisiko.

Untuk memastikan bahwa prinsip-prinsip etika utama yang diwakili organisasi diimplementasikan di seluruh proyek, organisasi harus memberikan daftar prinsip-prinsip ini dan cara untuk memvalidasinya dari perspektif teknis selama fase pengujian. Gunakan fitur pembelajaran mesin di Azure Pembelajaran Mesin untuk memahami apa itu pembelajaran mesin yang bertanggung jawab dan cara membuatnya ke dalam operasi pembelajaran mesin Anda.

Langkah berikutnya

Pelajari selengkapnya tentang cara mengatur dan menyiapkan lingkungan Azure Pembelajaran Mesin, atau tonton seri video langsung tentang operasi pembelajaran mesin di Azure.

Pelajari selengkapnya tentang cara mengelola anggaran, kuota, dan biaya di tingkat organisasi dengan menggunakan Azure Pembelajaran Mesin: