Bagikan melalui


Komputasi GPU tanpa server

Penting

Fitur ini ada di Beta. Admin ruang kerja dapat mengontrol akses ke fitur ini dari halaman Pratinjau . Lihat Kelola Pratinjau Azure Databricks.

Artikel ini menjelaskan komputasi GPU tanpa server pada Databricks dan menyediakan kasus penggunaan yang direkomendasikan, panduan tentang cara menyiapkan sumber daya komputasi GPU, dan batasan fitur.

Apa itu komputasi GPU tanpa server?

Komputasi GPU tanpa server adalah bagian dari penawaran komputasi Tanpa Server. Komputasi GPU tanpa server dikhususkan untuk beban kerja pembelajaran mendalam tunggal dan multi-simpul kustom. Anda dapat menggunakan komputasi GPU tanpa server untuk melatih dan menyempurnakan model kustom menggunakan kerangka kerja favorit Anda dan mendapatkan efisiensi, performa, dan kualitas canggih.

Komputasi GPU tanpa server meliputi:

  • Pengalaman terintegrasi di seluruh Notebooks, Unity Catalog, dan MLflow: Anda dapat mengembangkan kode Anda secara interaktif menggunakan Notebooks.
  • Akselerator GPU A10:GPU A10 dirancang untuk mempercepat pembelajaran mesin kecil hingga menengah dan beban kerja pembelajaran mendalam, termasuk model ML klasik dan menyempurnakan model bahasa yang lebih kecil. A10s sangat cocok untuk tugas dengan persyaratan komputasi sedang.
  • Dukungan multi-GPU dan multi-simpul: Anda dapat menjalankan beban kerja pelatihan terdistribusi beberapa GPU dan beberapa simpul menggunakan API Python GPU Tanpa Server. Lihat Pelatihan terdistribusi.

Paket yang telah diinstal sebelumnya pada komputasi GPU tanpa server bukan pengganti Databricks Runtime ML. Meskipun ada paket umum, tidak semua dependensi dan pustaka ML Runtime Databricks tercermin dalam lingkungan komputasi GPU tanpa server.

Lingkungan Python pada komputasi GPU Tanpa Server

Databricks menyediakan dua lingkungan terkelola untuk melayani kasus penggunaan yang berbeda.

Nota

Lingkungan dasar ruang kerja tidak didukung untuk komputasi GPU tanpa server. Sebagai gantinya, gunakan lingkungan default atau AI, dan tentukan dependensi tambahan langsung di panel sisi Lingkungan atau pip install lingkungan tersebut.

Lingkungan dasar default

Ini menyediakan lingkungan minimal dengan API klien yang stabil untuk memastikan kompatibilitas aplikasi. Hanya paket Python yang diperlukan yang diinstal. Ini memungkinkan Databricks untuk meningkatkan server secara independen, memberikan peningkatan performa, peningkatan keamanan, dan perbaikan bug tanpa memerlukan perubahan kode pada beban kerja. Ini adalah lingkungan default saat Anda memilih komputasi GPU tanpa server. Pilih lingkungan ini jika Anda ingin sepenuhnya menyesuaikan lingkungan untuk pelatihan Anda.

Untuk detail selengkapnya tentang versi paket yang diinstal dalam versi yang berbeda, lihat catatan rilis:

Lingkungan AI

Lingkungan AI Databricks tersedia di lingkungan GPU tanpa server 4. Lingkungan AI dibangun di atas lingkungan dasar default dengan paket runtime umum dan paket khusus untuk pembelajaran mesin pada GPU. Ini berisi pustaka pembelajaran mesin populer, termasuk PyTorch, LangChain, Transformers, Ray, dan XGBoost untuk pelatihan dan inferensi model. Pilih lingkungan ini untuk menjalankan beban kerja pelatihan.

Untuk detail selengkapnya tentang versi paket yang diinstal dalam versi yang berbeda, lihat catatan rilis:

Databricks merekomendasikan komputasi GPU tanpa server untuk setiap kasus penggunaan pelatihan model yang memerlukan penyesuaian pelatihan dan GPU.

Contohnya:

  • Penyempurnaan LLM
  • Penglihatan Komputer
  • Sistem pemberi rekomendasi
  • Pembelajaran Penguatan
  • Prakiraan rangkaian waktu berbasis pembelajaran mendalam

Persyaratan

  • Ruang kerja di salah satu wilayah yang didukung Azure berikut ini:
    • eastus
    • eastus2
    • centralus
    • northcentralus
    • westcentralus
    • westus

Menyiapkan komputasi GPU tanpa server

Untuk menyambungkan notebook Anda ke komputasi GPU tanpa server dan mengonfigurasi lingkungan:

  1. Dari buku catatan, klik menu drop-down Sambungkan di bagian atas dan pilih GPU Tanpa Server.
  2. Klik ikon Lingkungan. untuk membuka panel sisi Lingkungan .
  3. Pilih A10 dari bidang Akselerator .
  4. Pilih Tidak Ada untuk lingkungan default atau AI v4 untuk lingkungan AI dari bidang Lingkungan dasar .
  5. Jika Anda memilih Tidak Ada dari bidang Lingkungan dasar , pilih versi Lingkungan.
  6. Klik Terapkan lalu Konfirmasikan bahwa Anda ingin menerapkan komputasi GPU tanpa server ke lingkungan buku catatan Anda.

Nota

Koneksi ke komputasi Anda berakhir secara otomatis setelah 60 menit tidak aktif.

Menambahkan pustaka ke lingkungan

Anda dapat menginstal pustaka tambahan ke lingkungan komputasi GPU tanpa server. Lihat Menambahkan dependensi ke buku catatan.

Nota

Menambahkan dependensi menggunakan panel Lingkungan seperti yang terlihat di Menambahkan dependensi ke buku catatan tidak didukung untuk pekerjaan terjadwal komputasi GPU tanpa server.

Membuat dan menjadwalkan pekerjaan

Langkah-langkah berikut menunjukkan cara membuat dan menjadwalkan pekerjaan untuk beban kerja komputasi GPU tanpa server Anda. Lihat Membuat dan mengelola pekerjaan buku catatan terjadwal untuk detail selengkapnya.

Setelah Anda membuka buku catatan yang ingin Anda gunakan:

  1. Pilih tombol Jadwalkan di kanan atas.
  2. Pilih Tambahkan jadwal.
  3. Isi formulir Jadwal baru dengan Nama pekerjaan, Jadwal, dan Komputasi.
  4. Pilih Buat.

Anda juga dapat membuat dan menjadwalkan pekerjaan dari antarmuka pengguna Pekerjaan dan alur . Lihat Membuat pekerjaan baru untuk panduan langkah demi langkah.

Pelatihan terdistribusi

Lihat Pelatihan Terdistribusi.

Keterbatasan

  • Komputasi GPU tanpa server hanya mendukung akselerator A10.
  • Private Link tidak didukung. Penyimpanan atau repositori pip yang menggunakan Private Link tidak didukung.
  • Komputasi GPU tanpa server tidak didukung untuk ruang kerja profil keamanan kepatuhan (seperti HIPAA atau PCI). Pemrosesan data yang diatur saat ini tidak didukung.
  • Untuk pekerjaan terjadwal pada komputasi GPU Tanpa Server, perilaku pemulihan otomatis untuk versi paket yang tidak kompatibel yang terkait dengan buku catatan Anda tidak didukung.
  • Waktu operasi maksimum untuk beban kerja adalah tujuh hari. Untuk pekerjaan pelatihan model yang melebihi batas ini, harap terapkan titik pemeriksaan dan mulai ulang pekerjaan setelah runtime maksimum tercapai.

Pemuatan data

Lihat Memuat data pada komputasi GPU Tanpa Server.

Praktik terbaik

Lihat Praktik terbaik untuk komputasi GPU Tanpa Server.

Memecahkan masalah pada Komputasi GPU Tanpa Server

Jika Anda mengalami masalah saat menjalankan beban kerja pada komputasi GPU Tanpa Server, lihat panduan pemecahan masalah untuk masalah umum, solusi, dan sumber daya dukungan.

Contoh buku catatan

Di bawah ini adalah berbagai contoh notebook yang menunjukkan cara menggunakan komputasi GPU Tanpa Server untuk tugas yang berbeda.

Task Description
Model bahasa besar (LLM) Contoh untuk menyempurnakan model bahasa besar termasuk metode hemat parameter seperti adaptasi Low-Rank (LoRA) dan pendekatan penyempurnaan yang diawasi.
Visi komputer Contoh untuk tugas visi komputer termasuk deteksi objek dan klasifikasi gambar.
Sistem pemberi rekomendasi berbasis pembelajaran mendalam Contoh untuk membangun sistem rekomendasi menggunakan pendekatan pembelajaran mendalam modern seperti model dua menara.
ML Klasik Contoh untuk tugas pembelajaran mesin tradisional termasuk pelatihan model XGBoost dan prakiraan rangkaian waktu.
Pelatihan terdistribusi multi-GPU dan multi-simpul Contoh untuk meningkatkan skala pelatihan di beberapa GPU dan node menggunakan Serverless GPU API, termasuk penyesuaian terdistribusi.

Contoh pelatihan multi-GPU

Lihat Pelatihan terdistribusi multi-GPU dan multi-simpul untuk notebook yang menunjukkan cara menggunakan berbagai pustaka pelatihan terdistribusi untuk pelatihan multi-GPU.