Inferensi batch menggunakan API Model Foundation
Artikel ini menyediakan contoh notebook yang melakukan inferensi batch pada titik akhir throughput yang disediakan menggunakan API Model Foundation. Anda memerlukan kedua notebook untuk mencapai inferensi batch menggunakan API Model Foundation.
Contoh menunjukkan inferensi batch menggunakan model Instruksi DBRX untuk tugas obrolan.
Persyaratan
- Ruang kerja di wilayah yang didukung API Model Foundation
- Databricks Runtime 14.0 ML atau lebih tinggi
- Buku
provisioned-throughput-batch-inference
catatan danchat-batch-inference-api
buku catatan harus ada di direktori yang sama di ruang kerja
Menyiapkan tabel input, inferensi batch
Buku catatan berikut melakukan tugas-tugas berikut, menggunakan Python:
- Membaca data dari tabel input dan kolom input
- Membuat permintaan dan mengirimkannya ke titik akhir API Model Foundation
- Mempertahankan baris input bersama dengan data respons ke tabel output
Tugas inferensi batch model obrolan menggunakan buku catatan Python
Buku catatan berikut melakukan tugas yang sama seperti buku catatan di atas, tetapi menggunakan Spark:
- Membaca data dari tabel input dan kolom input
- Membuat permintaan dan mengirimkannya ke titik akhir API Model Foundation
- Mempertahankan baris input bersama dengan data respons ke tabel output
Tugas inferensi batch model obrolan menggunakan notebook UDF PySpark Pandas
Membuat titik akhir throughput yang disediakan
Jika Anda ingin menggunakan buku catatan spark alih-alih buku catatan python, pastikan untuk memperbarui perintah yang memanggil buku catatan Python.
- Membuat titik akhir penyajian throughput yang disediakan
- Pantau titik akhir hingga mencapai status siap
chat-batch-inference-api
Memanggil notebook untuk menjalankan tugas inferensi batch secara bersamaan terhadap titik akhir yang disiapkan. Jika Anda lebih suka menggunakan Spark, ubah referensi ini untuk memanggilchat-batch-inference-udf
buku catatan.- Menghapus titik akhir penyajian throughput yang disediakan setelah inferensi batch selesai
Melakukan inferensi batch pada buku catatan titik akhir throughput yang disediakan
Sumber Daya Tambahan:
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk