Bagikan melalui


grup perintah serving-endpoints

Note

Informasi ini berlaku untuk Databricks CLI versi 0.205 ke atas. Databricks CLI ada di Pratinjau Publik.

Penggunaan Databricks CLI tunduk pada Lisensi Databricks dan Pemberitahuan Privasi Databricks, termasuk ketentuan Data Penggunaan apa pun.

serving-endpoints Grup perintah dalam Databricks CLI memungkinkan Anda membuat, memperbarui, dan menghapus titik akhir penyajian model. Lihat Mengelola model yang melayani titik akhir.

databricks serving-endpoints catatan pembangunan

Ambil log pembangunan yang terkait dengan model yang disajikan.

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian tempat model yang dilayani berada. Bidang ini wajib diisi.

SERVED_MODEL_NAME

    Nama model yang dilayani yang membangun log akan diambil. Bidang ini wajib diisi.

Opsi

Bendera global

pembuatan titik akhir penyajian databricks

Buat titik akhir penyajian baru.

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    Nama titik akhir layanan. Bidang ini diperlukan dan harus unik di seluruh ruang kerja Databricks. Nama titik akhir dapat terdiri dari karakter alfanumerik, tanda hubung, dan garis bawah.

Opsi

--budget-policy-id string

    Kebijakan anggaran yang akan diterapkan ke endpoint layanan.

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

--no-wait

    jangan menunggu sampai mencapai status NOT_UPDATING

--route-optimized

    Aktifkan pengoptimalan rute untuk titik akhir penyajian.

--timeout duration

    jumlah waktu maksimum untuk mencapai status NOT_UPDATING (default 20m0s)

Bendera global

databricks hapus titik akhir layanan

Menghapus titik akhir penyajian.

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian yang akan dihapus.

Opsi

Bendera global

metrik ekspor titik akhir penyajian databricks

Ambil metrik yang terkait dengan titik akhir penyajian yang disediakan dalam format eksposisi Prometheus atau OpenMetrics.

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian untuk mengambil metrik. Bidang ini wajib diisi.

Opsi

Bendera global

titik akhir layanan databricks dapatkan

Ambil detail untuk satu titik akhir penyajian.

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    Nama titik akhir layanan. Bidang ini wajib diisi.

Opsi

Bendera global

databricks titik-akhir-pelayanan dapatkan-api-terbuka

Dapatkan skema kueri titik akhir penyajian dalam format OpenAPI. Skema berisi informasi untuk jalur yang didukung, format input dan output dan jenis data.

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian tempat model yang dilayani berada. Bidang ini wajib diisi.

Opsi

Bendera global

daftar titik akhir layanan Databricks

Dapatkan semua titik akhir penyajian.

databricks serving-endpoints list [flags]

Arguments

None

Opsi

Bendera global

log titik akhir penyajian databricks

Ambil log layanan yang terkait dengan model yang dilayani.

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian tempat model yang dilayani berada. Bidang ini wajib diisi.

SERVED_MODEL_NAME

    Nama model yang dilayani yang akan diambil lognya. Bidang ini wajib diisi.

Opsi

Bendera global

patch titik akhir penyajian databricks

Menambahkan atau menghapus tag titik akhir penyajian.

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian yang diberi tag untuk di-patch. Bidang ini wajib diisi.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

Bendera global

titik akhir penyajian databricks dimasukkan

Memperbarui limit laju dari endpoint servis.

Note

Tidak digunakan lagi: Gunakan Gateway AI untuk mengelola batas tarif sebagai gantinya.

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian yang batas tarifnya sedang diperbarui. Bidang ini wajib diisi.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

Bendera global

Layanan Endpoint Databricks menyediakan gerbang AI

Perbarui Gateway AI dari endpoint layanan. Model eksternal, throughput yang disediakan, dan titik akhir bayar per token didukung sepenuhnya; titik akhir agen saat ini hanya mendukung tabel inferensi.

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    Nama endpoint layanan yang Gateway AI-nya sedang diperbarui. Bidang ini wajib diisi.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

Bendera global

kueri titik akhir penyajian databricks

Mengkueri titik akhir penyajian.

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    Nama titik akhir layanan. Bidang ini wajib diisi.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

--max-tokens int

    Bidang token maks hanya digunakan untuk penyelesaian dan model obrolan eksternal & fondasi yang melayani titik akhir.

--n int

    Bidang n (jumlah kandidat) HANYA digunakan untuk penyelesaian dan model eksternal &fondasi obrolan yang melayani titik akhir.

--stream

    Bidang aliran hanya digunakan untuk penyelesaian dan model eksternal &fondasi obrolan yang melayani titik akhir.

--temperature float

    Bidang suhu hanya digunakan untuk penyelesaian akhir dan model obrolan eksternal & fondasi yang melayani titik akhir.

Bendera global

Konfigurasi pemutakhiran pada endpoint layanan databricks

Perbarui kombinasi entitas yang dilayani titik akhir penyajian, konfigurasi komputasi entitas yang dilayani, dan konfigurasi lalu lintas titik akhir. Titik akhir yang sudah memiliki pembaruan yang sedang berlangsung tidak dapat diperbarui hingga pembaruan saat ini selesai atau gagal.

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    Nama titik akhir penyajian yang akan diperbarui. Bidang ini wajib diisi.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

--no-wait

    jangan menunggu sampai mencapai status NOT_UPDATING

--timeout duration

    jumlah waktu maksimum untuk mencapai status NOT_UPDATING (default 20m0s)

Bendera global

endpoint-penyajian databricks mendapatkan-tingkat-izin

Mendapatkan tingkat izin titik akhir penyajian.

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Titik akhir penyajian untuk mendapatkan atau mengelola izin.

Opsi

Bendera global

databricks serving-endpoints mendapatkan-izin

Mendapatkan izin titik akhir penyajian.

Mendapatkan izin dari titik akhir penyajian. Titik akhir layanan dapat mewarisi izin dari objek akarnya.

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Titik akhir penyajian untuk mendapatkan atau mengelola izin.

Opsi

Bendera global

izin set titik akhir penyajian databricks

Atur izin titik akhir layanan.

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Titik akhir penyajian untuk mendapatkan atau mengelola izin.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

Bendera global

izin pembaruan titik akhir penyajian databricks

Perbarui izin pada titik akhir penyajian. Titik akhir layanan dapat mewarisi izin dari objek akarnya.

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Titik akhir penyajian untuk mendapatkan atau mengelola izin.

Opsi

--json JSON

    String JSON sebaris atau @path ke file JSON dengan isi permintaan.

Bendera global

Bendera dunia

--debug

  Apakah debug logging ingin diaktifkan?

-h atau --help

    Tampilkan bantuan untuk Databricks CLI atau grup perintah terkait atau perintah terkait.

--log-file tali

    String yang mewakili file yang akan digunakan untuk menulis log output. Jika bendera ini tidak ditentukan, maka defaultnya adalah menulis log output ke stderr.

--log-format format

    Jenis format log, text atau json. Nilai defaultnya adalah text.

--log-level tali

    Untaian yang menggambarkan tingkat format log. Jika tidak ditentukan, maka tingkat format log akan dinonaktifkan.

-o, --output jenis

    Jenis output perintah, text atau json. Nilai defaultnya adalah text.

-p, --profile tali

    Nama profil dalam file ~/.databrickscfg yang digunakan untuk menjalankan perintah. Jika bendera ini tidak ditentukan maka jika ada, profil bernama DEFAULT digunakan.

--progress-format format

    Format untuk menampilkan log kemajuan: default, , append, inplaceatau json

-t, --target tali

    Jika berlaku, target bundel yang akan digunakan