Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini membandingkan pembelajaran mendalam dengan pembelajaran mesin dan menjelaskan bagaimana mereka cocok dengan kategori AI yang lebih luas. Pelajari tentang solusi pembelajaran mendalam yang bisa Anda buat di Azure Machine Learning, seperti deteksi penipuan, pengenalan suara dan wajah, analisis sentimen, dan perkiraan rangkaian waktu.
Untuk panduan tentang memilih algoritme untuk solusi Anda, lihat Cheat Sheet Algoritma Pembelajaran Mesin.
Model Foundry di Azure Machine Learning adalah model pembelajaran mendalam yang telah dilatih sebelumnya yang dapat disempurnakan untuk kasus penggunaan tertentu. Untuk informasi selengkapnya, lihat Menjelajahi Model Microsoft Foundry di Azure Machine Learning dan Cara menggunakan model dasar Sumber Terbuka yang dikumpulkan oleh Azure Machine Learning.
Pembelajaran mendalam, pembelajaran mesin, dan AI
Definisi berikut menjelaskan hubungan antara pembelajaran mendalam, pembelajaran mesin, AI:
Pembelajaran mendalam adalah subset pembelajaran mesin yang didasarkan pada jaringan saraf buatan. Proses pembelajarannya sangat dalam karena struktur jaringan saraf buatan terdiri dari beberapa lapisan input, output, dan tersembunyi. Setiap lapisan berisi unit yang mengubah data input menjadi informasi yang bisa digunakan oleh lapisan berikutnya untuk tugas prediktif tertentu. Karena struktur ini, mesin dapat belajar melalui pemrosesan datanya sendiri.
Pembelajaran mesin adalah subset kecerdasan buatan yang menggunakan teknik (seperti pembelajaran mendalam) yang memungkinkan mesin menggunakan pengalaman untuk meningkatkan kemampuan mereka dalam melakukan tugas. Proses pembelajaran terdiri dari langkah-langkah berikut:
- Umpan data ke algoritma. (Dalam langkah ini, Anda dapat memberikan informasi tambahan untuk model, misalnya, dengan melakukan ekstraksi fitur.)
- Gunakan data ini untuk melatih model.
- Uji dan sebarkan model.
- Konsumsi model yang disebarkan untuk melakukan tugas prediktif otomatis. (Dengan kata lain, hubungi dan gunakan model yang disebarkan untuk menerima prediksi yang dikembalikan lagi oleh model.)
AI adalah teknik yang memungkinkan komputer meniluki kecerdasan manusia. Ini termasuk pembelajaran mesin.
AI Generatif adalah subset AI yang menggunakan teknik (seperti pembelajaran mendalam) untuk menghasilkan konten baru. Misalnya, Anda dapat menggunakan AI generatif untuk membuat gambar, teks, atau audio. Model-model ini menggunakan sejumlah besar pengetahuan yang telah dilatih sebelumnya untuk menghasilkan konten ini.
Dengan menggunakan teknik pembelajaran mesin dan pembelajaran mendalam, Anda bisa membangun sistem komputer dan aplikasi yang melakukan tugas yang umumnya berasosiasi dengan kecerdasan manusia. Tugas-tugas ini termasuk pengenalan gambar, pengenalan ucapan, dan penterjemahan bahasa.
Teknik pembelajaran mendalam dan pembelajaran mesin
Sekarang setelah Anda memiliki pemahaman dasar tentang bagaimana pembelajaran mesin berbeda dari pembelajaran mendalam, mari kita bandingkan dua teknik. Dalam pembelajaran mesin, algoritma perlu diberi tahu cara membuat prediksi yang akurat dengan mengonsumsi informasi lebih lanjut. (Misalnya, dengan melakukan ekstraksi fitur.) Dalam pembelajaran mendalam, algoritma dapat mempelajari cara membuat prediksi yang akurat melalui pemrosesan datanya sendiri karena menggunakan struktur jaringan neural buatan.
Tabel berikut membandingkan dua teknik tersebut secara lebih rinci:
| Pembelajaran Mesin | Pembelajaran mendalam | |
|---|---|---|
| Jumlah titik data | Bisa menggunakan sejumlah kecil data untuk membuat prediksi. | Harus menggunakan data pelatihan dalam jumlah besar untuk membuat prediksi. |
| Dependensi perangkat keras | Dapat bekerja pada mesin kelas bawah. Tidak memerlukan sejumlah besar kekuatan komputasi. | Tergantung pada mesin kelas atas. Secara inheren melakukan sejumlah besar operasi perkalian matriks. GPU dapat mengoptimalkan operasi ini secara efisien. |
| Proses fiturisasi | Membutuhkan fitur untuk diidentifikasi dan dibuat secara akurat oleh pengguna. | Mempelajari fitur tingkat tinggi dari data dan membuat fitur baru dengan sendirinya. |
| Pendekatan pembelajaran | Membagi proses pembelajaran menjadi langkah-langkah yang lebih kecil. Lalu menggabungkan hasil dari setiap langkah menjadi satu output. | Melewati proses pembelajaran dengan menyelesaikan masalah secara end-to-end. |
| Waktu pelatihan | Membutuhkan waktu yang relatif sedikit untuk berlatih, mulai dari beberapa detik hingga beberapa jam. | Biasanya membutuhkan waktu lama untuk berlatih karena algoritma pembelajaran mendalam melibatkan banyak lapisan. |
| Hasil | Output biasanya merupakan nilai numerik, seperti skor atau klasifikasi. | Output dapat memiliki beberapa format, seperti teks, skor, atau suara. |
Apa itu pembelajaran transfer?
Pelatihan model pembelajaran mendalam seringkali memerlukan sejumlah besar data pelatihan, sumber daya komputasi kelas atas (GPU, TPU), dan waktu pelatihan yang lebih lama. Ketika Anda tidak memiliki ini tersedia, Anda dapat mempercepat proses pelatihan dengan menggunakan teknik yang dikenal sebagai pembelajaran transfer.
Pembelajaran transfer adalah teknik yang menerapkan pengetahuan yang diperoleh dari pemecahan satu masalah ke masalah lain tetapi masih terkait.
Karena struktur jaringan neuralnya, set lapisan pertama biasanya berisi fitur tingkat bawah, sedangkan set akhir lapisan berisi fitur tingkat yang lebih tinggi yang lebih dekat dengan domain yang dimaksud. Dengan mengganti lapisan final untuk digunakan di domain atau masalah baru, Anda dapat secara signifikan mengurangi jumlah waktu, data, dan sumber daya komputasi yang diperlukan untuk melatih model baru. Misalnya, jika Anda sudah memiliki model yang mengenali mobil, Anda dapat menggunakan kembali model tersebut dengan menggunakan pembelajaran transfer untuk juga mengenali truk, sepeda motor, dan jenis kendaraan lainnya.
Untuk mempelajari cara menerapkan pembelajaran transfer untuk klasifikasi gambar dengan menggunakan kerangka kerja sumber terbuka di Azure Machine Learning, lihat Melatih model PyTorch pembelajaran mendalam menggunakan pembelajaran transfer.
Kasus penggunaan pembelajaran mendalam
Karena struktur jaringan neural buatan, pembelajaran mendalam unggul dalam mengidentifikasi pola dalam data yang tidak terstruktur seperti gambar, suara, video, dan teks. Untuk alasan ini, pembelajaran mendalam mengubah banyak industri, termasuk perawatan kesehatan, energi, keuangan, dan transportasi dengan cepat. Industri-industri tersebut kini memikirkan kembali proses bisnis tradisional.
Beberapa aplikasi yang paling umum untuk pembelajaran mendalam dijelaskan dalam paragraf berikut ini. Di Azure Machine Learning, Anda dapat menggunakan model yang Anda buat dari kerangka kerja sumber terbuka atau membangun model dengan menggunakan alat yang disediakan.
Pengenalan entitas bernama
Pengenalan entitas bernama adalah metode pembelajaran mendalam yang mengambil sepotong teks sebagai input lalu mengubahnya menjadi kelas yang telah ditentukan sebelumnya. Informasi baru ini bisa berupa kode pos, tanggal, atau ID produk. Informasi tersebut lalu bisa disimpan dalam skema terstruktur untuk membuat daftar alamat atau berfungsi sebagai tolok ukur untuk mesin validasi identitas.
Deteksi objek
Pembelajaran mendalam telah diterapkan dalam banyak kasus penggunaan deteksi objek. Deteksi objek digunakan untuk mengidentifikasi objek dalam gambar (seperti mobil atau orang) dan menyediakan lokasi tertentu untuk setiap objek dengan menggunakan kotak pembatas.
Deteksi objek sudah digunakan di industri seperti game, ritel, pariwisata, dan mobil swakemudi.
Pembuatan keterangan gambar
Seperti pengenalan gambar, pada keterangan gambar, untuk gambar tertentu, sistem harus menghasilkan keterangan yang menjelaskan isi gambar. Saat Anda bisa mendeteksi dan memberi label objek dalam foto, langkah selanjutnya adalah mengubah label tersebut menjadi kalimat deskriptif.
Biasanya, aplikasi keterangan gambar menggunakan jaringan saraf yang berbelit untuk mengidentifikasi objek dalam gambar lalu menggunakan jaringan saraf berulang untuk mengubah label menjadi kalimat yang konsisten.
Penterjemahan mesin
Penterjemahan mesin mengambil kata atau kalimat dari satu bahasa dan secara otomatis menerjemahkannya ke dalam bahasa lain. Penterjemahan mesin telah ada untuk waktu yang lama, tetapi pembelajaran mendalam mencapai hasil yang mengesankan di dua bidang khusus: terjemahan teks otomatis (dan terjemahan ucapan ke teks) dan terjemahan otomatis gambar.
Dengan transformasi data yang sesuai, jaringan saraf bisa memahami sinyal teks, audio, dan visual. Terjemahan mesin bisa digunakan untuk mengidentifikasi cuplikan suara dalam file audio yang lebih besar dan mentranskripsi kata atau gambar yang diucapkan sebagai teks.
Analitik Teks
Analitik teks berdasarkan metode pembelajaran mendalam melibatkan analisis data teks dalam jumlah besar (misalnya, dokumen medis atau tanda terima pengeluaran), mengenali pola, dan membuat informasi yang terorganisir dan ringkas darinya.
Organisasi menggunakan pembelajaran mendalam untuk melakukan analisis teks untuk mendeteksi perdagangan orang dalam dan kepatuhan terhadap peraturan pemerintah. Contoh umum lainnya adalah penipuan asuransi: analitik teks sering digunakan untuk menganalisis sejumlah besar dokumen untuk mengenali kemungkinan klaim asuransi menjadi penipuan.
Jaringan saraf buatan
Jaringan saraf buatan dibentuk oleh lapisan simpul yang saling terhubung. Model pembelajaran mendalam menggunakan jaringan saraf yang mempunyai sejumlah besar lapisan.
Bagian berikut menjelaskan beberapa topologi jaringan neural buatan populer.
Jaringan saraf feedforward
Jaringan saraf feedforward adalah jenis jaringan saraf buatan yang paling sederhana. Dalam jaringan feedforward, informasi hanya bergerak ke satu arah dari lapisan input ke lapisan output. Jaringan saraf feedforward mengubah input dengan menaruhnya melalui serangkaian lapisan tersembunyi. Setiap lapisan terdiri dari satu set neuron, dan setiap lapisan sepenuhnya terhubung ke semua neuron di lapisan sebelum itu. Lapisan terakhir yang sepenuhnya terhubung (lapisan output) mewakili prediksi yang dihasilkan.
Jaringan saraf berulang (Recurrent Neural Network, RNN)
Jaringan saraf berulang adalah jaringan saraf buatan yang banyak digunakan. Jaringan ini menyimpan output lapisan lalu mengembalikannya ke lapisan input untuk membantu memprediksi hasil lapisan. Jaringan neural berulang memiliki kemampuan pembelajaran yang kuat. Jaringan ini banyak digunakan untuk tugas-tugas kompleks seperti perkiraan rangkaian waktu, belajar tulisan tangan, dan mengenali bahasa.
Jaringan saraf konvolusional (CNN)
Jaringan saraf konvolusional adalah jaringan saraf buatan yang sangat efektif, serta menyajikan arsitektur yang unik. Lapisan diatur dalam tiga dimensi: lebar, tinggi, dan kedalaman. Neuron pada satu lapisan tidak terhubung ke semua neuron di lapisan berikutnya, tetapi hanya ke wilayah kecil neuron lapisan. Output akhir dikurangi menjadi vektor tunggal skor probabilitas, yang ditata di sepanjang dimensi kedalaman.
Jaringan neural konvolusional digunakan di area seperti pengenalan video, pengenalan gambar, dan sistem pemberi rekomendasi.
Jaringan adversarial generatif (GAN)
Jaringan adversarial generatif adalah model generatif yang dilatih untuk membuat konten yang realistis seperti gambar. Mereka terdiri dari dua jaringan yang dikenal sebagai generator dan diskriminator. Kedua jaringan dilatih secara bersamaan. Selama pelatihan, generator menggunakan kebisingan acak untuk membuat data sintetis baru yang sangat menyerupai data asli. Diskriminator mengambil output dari generator sebagai input dan memakai data nyata untuk menentukan apakah konten yang dihasilkan asli atau sintetis. Setiap jaringan bersaing dengan jaringan lainnya. Generator mencoba menghasilkan konten sintetis yang tidak dapat dibedakan dari konten nyata, dan diskriminator mencoba mengklasifikasikan input dengan benar sebagai nyata atau sintetis. Output lalu digunakan untuk memperbarui bobot kedua jaringan untuk membantu mereka mencapai tujuan masing-masing dengan lebih baik.
Jaringan adversarial generatif digunakan untuk memecahkan masalah seperti terjemahan gambar ke gambar dan perkembangan usia.
Transformer
Transformer adalah arsitektur model yang cocok untuk memecahkan masalah yang berisi urutan, seperti teks atau data rangkaian waktu. Model ini terdiri dari lapisan encoder dan decoder. Encoder mengambil input dan memetakannya pada representasi numerik yang berisi informasi seperti konteks. Decoder menggunakan informasi dari encoder untuk menghasilkan output seperti teks yang diterjemahkan. Apa yang membuat transformer berbeda dari arsitektur lain yang mengandung encoder dan decoder adalah sub-layer perhatiannya. Perhatian mengacu pada fokus pada bagian tertentu dari input berdasarkan pentingnya konteksnya dalam kaitannya dengan input lain secara berurutan. Misalnya, ketika model meringkas artikel berita, tidak semua kalimat relevan untuk menjelaskan ide utama. Dengan berfokus pada kata-kata kunci di seluruh artikel, ringkasan bisa dilakukan dalam satu kalimat, yaitu judulnya.
Transformer digunakan untuk menyelesaikan masalah pemrosesan bahasa alami seperti terjemahan, pembuatan teks, jawaban atas pertanyaan, dan ringkasan teks.
Beberapa implementasi transformer yang terkenal adalah:
- Representasi Pengode Dua Arah dari Transformator (BERT)
- Transformer Generatif Pra-pelatihan 2 (GPT-2)
- Transformer Generatif Pra-terlatih 3 (GPT-3)
Langkah berikutnya
Artikel berikut ini menjelaskan lebih banyak opsi untuk menggunakan model pembelajaran mendalam sumber terbuka di Azure Machine Learning: