Bagikan melalui


Menyajikan prediksi real-time dengan titik akhir model ML (Pratinjau)

Penting

Fitur ini sedang dalam tahap pratinjau.

Microsoft Fabric memungkinkan Anda menyajikan prediksi real-time dari model ML dengan titik akhir online yang aman, dapat diskalakan, dan mudah digunakan. Titik akhir ini tersedia sebagai properti bawaan dari sebagian besar model Fabric—dan tidak memerlukan pengaturan untuk memulai penyebaran real-time yang dikelola sepenuhnya.

Anda dapat mengaktifkan, mengonfigurasi, dan mengkueri titik akhir model dengan REST API yang menghadap publik. Anda juga dapat memulai langsung dari antarmuka Fabric, menggunakan antarmuka yang membutuhkan sedikit penulisan kode untuk mengaktifkan titik akhir model dan menampilkan pratinjau prediksi secara instan.

Cuplikan layar memperlihatkan model ML di Fabric dengan properti titik akhir bawaan untuk menyajikan prediksi real time.

Prasyarat

  • Titik akhir model pembelajaran mesin diaktifkan secara default di penyewa Anda. Jika administrator Anda ingin menonaktifkan fitur ini, mereka dapat mematikan pengaturan penyewa untuk endpoint model ML di portal admin Fabric.

Keterbatasan

  • Titik akhir saat ini tersedia untuk serangkaian ragam model ML terbatas, termasuk Keras, LightGBM, Sklearn, dan XGBoost.
  • Titik akhir saat ini tidak tersedia untuk model dengan skema berbasis tensor atau tanpa skema.

Nota

Pada Januari 2026, titik akhir pembelajaran mesin sekarang mendukung model terlatih AutoML. Batasan sebelumnya ini telah dihapus.

Mulai menggunakan titik akhir model

Model ML di Fabric dirancang sebelumnya dengan titik akhir online yang dapat digunakan untuk memberikan prediksi waktu nyata. Setiap versi model terdaftar memiliki URL titik akhir khusus, yang dapat ditemukan di bawah judul "Detail titik akhir" di antarmuka Fabric. URL ini berakhir dengan subpath yang menunjuk versi tertentu tersebut (misalnya, /versions/1/score).

Cuplikan layar memperlihatkan properti titik akhir model ML, yang dapat digunakan untuk menyajikan prediksi real time.

Titik akhir model memiliki properti berikut:

Harta benda Deskripsi Default
Versi default Properti ini (Yes atau No) menunjukkan apakah versi ditetapkan sebagai default model untuk melayani prediksi nyata. Anda dapat menyesuaikan versi default dalam pengaturan model. No
Keadaan Properti ini menunjukkan apakah titik akhir siap untuk melayani prediksi. Statusnya bisa , Inactive, ActivatingActive, Deactivating, atau Failed. Hanya titik akhir aktif yang dapat melayani prediksi. Inactive
Tidur otomatis Properti ini (On atau Off) menunjukkan apakah titik akhir, setelah aktif, harus menurunkan skala penggunaan kapasitas menjadi nol tanpa adanya lalu lintas. Jika tidur otomatis aktif, maka titik akhir memasuki status diam setelah lima menit tanpa permintaan masuk. Panggilan pertama untuk membangunkan titik akhir diam melibatkan penundaan singkat. On

Mengaktifkan titik akhir model

Anda dapat mengaktifkan titik akhir model langsung dari antarmuka Fabric. Navigasikan ke versi yang ingin Anda gunakan untuk menyajikan prediksi real-time dan pilih "Aktifkan titik akhir versi" dari menu.

Cuplikan layar memperlihatkan cara mengaktifkan titik akhir model ML dari antarmuka Fabric.

Pesan notifikasi menunjukkan bahwa Fabric sedang menyiapkan titik akhir Anda untuk melayani prediksi, dan status titik akhir berubah menjadi "Mengaktifkan". Di balik layar, Fabric memulai infrastruktur kontainer yang mendasar untuk menghosting model Anda. Dalam beberapa menit, titik akhir Anda siap untuk melayani prediksi.

Cuplikan layar memperlihatkan titik akhir model ML yang sekarang diaktifkan.

Setiap titik akhir memiliki status yang menunjukkan apakah siap untuk melayani prediksi real time:

Keadaan Deskripsi
Inactive Titik akhir tidak diaktifkan untuk menyajikan prediksi real-time, dan tidak mengkonsumsi kapasitas Fabric.
Activating Titik akhir sedang dikonfigurasi untuk menyediakan prediksi waktu nyata. Di balik layar, Fabric menyiapkan infrastruktur kontainer dasar untuk menghosting model. Dalam beberapa menit, titik akhir aktif.
Active Titik akhir siap untuk menyajikan prediksi real-time. Di balik layar, Fabric mengelola infrastruktur yang mendasar, meningkatkan penggunaan sumber daya berdasarkan lalu lintas masuk. Lalu lintas yang lebih tinggi menghasilkan penggunaan kapasitas Fabric yang lebih tinggi.
Deactivating Titik akhir sedang dinonaktifkan, sehingga tidak lagi melayani prediksi real time atau mengonsumsi kapasitas Fabric. Di balik layar, Fabric membongkar infrastruktur kontainer yang mendasar.

Nota

Model ML dapat mendukung titik akhir aktif hingga lima versi sekaligus. Untuk menyajikan prediksi dari versi keenam, Anda harus terlebih dahulu menonaktifkan titik akhir aktif.

Mengelola titik akhir model

Untuk gambaran umum titik akhir aktif model Anda, pilih "Kelola titik akhir" dari pita di antarmuka. Setiap model memiliki titik akhir default yang dapat disesuaikan, yang melayani prediksi dari versi yang Anda pilih. Anda dapat memperbarui versi default menggunakan pemilih dropdown di panel pengaturan.

Cuplikan layar memperlihatkan URL titik akhir model ML default, yang dapat Anda konfigurasi untuk melayani prediksi dari versi tertentu.

Penting

Pastikan untuk mengatur properti default ke versi aktif jika Anda berencana untuk menggunakannya. Jika properti default tidak diatur, atau diatur ke versi tidak aktif, maka panggilan ke titik akhir default gagal.

Semua versi dengan titik akhir aktif tercantum di bawah pengaturan titik akhir model. Anda dapat memodifikasi properti tidur otomatis dari setiap titik akhir dengan mengubah pengalih menjadi "Aktif" atau "Nonaktif."

Cuplikan layar memperlihatkan cara mengubah properti tidur otomatis pada titik akhir model ML.

Petunjuk / Saran

Titik akhir aktif dengan mode tidur otomatis diaktifkan akan memasuki keadaan diam setelah lima menit tanpa lalu lintas data, dan panggilan pertama untuk membangunkannya akan melibatkan penundaan singkat. Anda mungkin ingin menonaktifkan properti ini untuk titik akhir dalam produksi.

Kueri titik akhir model untuk prediksi waktu nyata

Titik akhir model tersedia untuk pengujian instan dengan pengalaman kode rendah di Fabric. Navigasi ke versi dengan titik akhir aktif dan pilih "Prediksi pratinjau" dari pita di antarmuka. Anda dapat mengirim permintaan sampel ke titik akhir—dan mendapatkan prediksi sampel secara real time—menggunakan bidang formulir yang cocok dengan tanda tangan input model.

Cuplikan layar memperlihatkan pengalaman pratinjau bawaan untuk mendapatkan prediksi sampel dari titik akhir model ML aktif.

Untuk mengisi bidang formulir dengan nilai sampel acak, pilih "Isi otomatis." Anda dapat menambahkan lebih banyak set nilai formulir untuk menguji titik akhir dengan beberapa input. Pilih "Dapatkan prediksi" untuk mengirim titik akhir permintaan sampel Anda.

Cuplikan layar memperlihatkan tampilan berbasis formulir untuk mengirim permintaan sampel ke titik akhir model ML aktif.

Jika Anda lebih suka memformat permintaan sampel sebagai payload JSON, gunakan pemilih dropdown untuk mengubah tampilan.

Cuplikan layar memperlihatkan tampilan berbasis JSON untuk mengirim permintaan sampel ke titik akhir model ML aktif.

Menonaktifkan titik akhir model

Anda dapat menonaktifkan titik akhir model langsung dari antarmuka Fabric. Navigasi ke versi yang tidak lagi Anda butuhkan untuk melayani prediksi real-time dan pilih "Nonaktifkan titik akhir versi" dari pita menu di antarmuka, lalu tekan "OK."

Cuplikan layar memperlihatkan cara menonaktifkan titik akhir model ML dari antarmuka Fabric.

Notifikasi cepat menunjukkan bahwa Fabric sedang membongkar penyebaran aktif Anda, dan status endpoint berubah menjadi "Menonaktifkan." Endpoint tidak dapat lagi melayani prediksi real-time kecuali Anda mengaktifkannya kembali.

Cuplikan layar memperlihatkan titik akhir model ML yang sekarang dinonaktifkan.

Anda dapat menonaktifkan titik akhir untuk beberapa versi sekaligus dari panel pengaturan model. Pilih "Kelola titik akhir" dari pita di antarmuka dan pilih satu atau beberapa titik akhir aktif untuk dinonaktifkan.

Cuplikan layar memperlihatkan cara menonaktifkan beberapa titik akhir model ML sekaligus dari antarmuka Fabric.

Tingkat konsumsi

Hosting titik akhir model aktif menggunakan Fabric Capacity Units (CUs). Endpoint beroperasi pada simpul komputasi dan dapat secara otomatis memperbesar hingga tiga simpul berdasarkan lalu lintas masuk. Penagihan dihitung berdasarkan penggunaan per penghubung selama endpoint aktif. Tabel di bawah ini menunjukkan konsumsi CU untuk titik akhir model Pembelajaran Mesin aktif.

Operasi Satuan Ukuran Operasi Tingkat konsumsi
titik akhir model 1 titik akhir model (versi) per detik per simpul 5 DETIK CU

Tabel di bawah ini menunjukkan contoh skenario dan tingkat konsumsi yang sesuai dan biaya per jam.

Skenario Deskripsi Tingkat konsumsi Biaya Per Jam
Model dengan Titik Akhir Tidak Aktif Model ini tidak memiliki titik akhir versi aktif dan tidak ada pemanfaatan sumber daya terkait. Mereka tidak melibatkan biaya tambahan. 0 detik CU 0 CU Jam
Model dengan Titik Akhir Aktif tetapi Diam Model ini memiliki satu atau beberapa titik akhir versi aktif, tetapi, tanpa lalu lintas reguler, semuanya telah diskalakan ke nol, mengurangi biaya secara otomatis. 5 DETIK CU 0,42 CU Jam
Model dengan 1 Titik Akhir Aktif dan Lalu Lintas Rendah Konstan Model ini hanya memiliki 1 titik akhir versi aktif yang melayani prediksi, tetapi tanpa lalu lintas yang cukup untuk memicu peluasan skala penuh. Satu simpul dapat melayani semua lalu lintas. Titik akhir versi lainnya mungkin tidak aktif atau menganggur. 5 DETIK CU 5 Jam CU
Model dengan 1 Titik Akhir Aktif dan Lalu Lintas Tinggi Konstan Model ini hanya memiliki 1 titik akhir versi aktif yang melayani prediksi, dengan lalu lintas yang cukup untuk memicu peluasan skala penuh. Titik akhir versi lainnya mungkin tidak aktif atau menganggur. 15 Detik CU 15 Jam Satuan Kredit
Model dengan 5 Titik Akhir Aktif dan Lalu Lintas Tinggi Konstan Model ini memiliki 5 titik akhir versi aktif (batas saat ini) yang melayani prediksi, masing-masing dengan lalu lintas yang cukup untuk memicu eskalasi skala penuh. 75 detik CU 75 Jam Satuan Kredit

Aplikasi Metrik Kapasitas Fabric menampilkan total penggunaan kapasitas untuk operasi titik akhir model dengan nama "Titik Akhir Model". Selain itu, pengguna dapat melihat ringkasan biaya penagihan mereka untuk penggunaan Kapasitas Titik Akhir Model ML dengan item penagihan "Penggunaan Kapasitas Titik Akhir Model ML CU".

Operasi titik akhir model diklasifikasikan sebagai operasi latar belakang.

Tarif konsumsi dapat berubah sewaktu-waktu. Microsoft menggunakan upaya yang wajar untuk memberikan pemberitahuan melalui email atau melalui pemberitahuan dalam produk. Perubahan akan berlaku pada tanggal yang dinyatakan dalam Catatan Rilis Microsoft atau Blog Microsoft Fabric. Jika ada perubahan pada titik akhir model dalam Fabric Consumption Rate yang secara signifikan meningkatkan Unit Kapasitas (CU) yang diperlukan untuk penggunaannya, pelanggan dapat memanfaatkan opsi pembatalan yang tersedia untuk metode pembayaran yang telah dipilih.