Model bahasa besar (LLM) pada Databricks
Azure Databricks memudahkan untuk mengakses dan membangun model bahasa besar yang tersedia untuk umum.
Databricks Runtime for Pembelajaran Mesin mencakup pustaka seperti Hugging Face Transformers dan LangChain yang memungkinkan Anda mengintegrasikan model yang sudah dilatih sebelumnya atau pustaka sumber terbuka lainnya ke dalam alur kerja Anda. Dari sini, Anda dapat memanfaatkan kemampuan platform Azure Databricks untuk menyempurnakan LLM menggunakan data Anda sendiri untuk performa domain yang lebih baik.
Selain itu, Azure Databricks menawarkan fungsionalitas bawaan bagi pengguna SQL untuk mengakses dan bereksperimen dengan LLM seperti Azure OpenAI dan OpenAI menggunakan fungsi AI.
Pelatihan Model AI Mosaik
Penting
Fitur ini ada di Pratinjau Publik. Hubungi tim akun Databricks Anda untuk mendaftar di Pratinjau Umum.
Pelatihan Model AI Mosaik (sebelumnya Pelatihan Model Foundation) adalah antarmuka sederhana ke tumpukan pelatihan Databricks untuk melakukan penyempurnaan model penuh.
Anda dapat melakukan hal berikut menggunakan Pelatihan Model AI Mosaik:
- Sesuaikan model dengan data kustom Anda, dengan titik pemeriksaan disimpan ke MLflow. Anda mempertahankan kontrol penuh atas model yang disempurnakan.
- Daftarkan model secara otomatis ke Unity Catalog, memungkinkan penyebaran mudah dengan penyajian model.
- Menyempurnakan model kepemilikan yang lengkap dengan memuat bobot model yang sebelumnya disempurnakan.
Lihat Pelatihan Model AI Mosaik untuk model fondasi.
Memeluk Transformers Wajah
Dengan Memeluk Transformer Wajah pada Databricks, Anda dapat menskalakan aplikasi batch pemrosesan bahasa alami (NLP) dan menyempurnakan model untuk aplikasi model bahasa besar.
Pustaka Hugging Face transformers
telah diinstal sebelumnya pada Databricks Runtime 10.4 LTS ML ke atas. Banyak model NLP populer bekerja paling baik pada perangkat keras GPU, sehingga Anda mungkin mendapatkan performa terbaik menggunakan perangkat keras GPU terbaru kecuali Anda menggunakan model yang dioptimalkan khusus untuk digunakan pada CPU.
DSPy
DSPy mengotomatiskan penyetelan permintaan dengan menerjemahkan tanda tangan bahasa alami yang ditentukan pengguna ke dalam instruksi lengkap dan contoh beberapa bidikan.
Lihat Membangun aplikasi genAI menggunakan DSPy di Azure Databricks misalnya tentang cara menggunakan DSPy.
LangChain
LangChain tersedia sebagai rasa MLflow eksperimental yang memungkinkan pelanggan LangChain memanfaatkan alat yang kuat dan kemampuan pelacakan eksperimen MLflow langsung dari lingkungan Azure Databricks.
LangChain adalah kerangka kerja perangkat lunak yang dirancang untuk membantu membuat aplikasi yang menggunakan model bahasa besar (LLM) dan menggabungkannya dengan data eksternal untuk menghadirkan lebih banyak konteks pelatihan untuk LLM Anda.
Databricks Runtime ML termasuk langchain
dalam Databricks Runtime 13.1 ML ke atas.
Pelajari tentang integrasi LangChain tertentu Databricks.
Fungsi AI
Penting
Fitur ini ada di Pratinjau Publik.
Fungsi AI adalah fungsi SQL bawaan yang memungkinkan pengguna SQL untuk:
- Gunakan API Model Databricks Foundation untuk menyelesaikan berbagai tugas pada data perusahaan Anda.
- Akses model eksternal seperti GPT-4 dari OpenAI dan bereksperimenlah dengannya.
- Model kueri yang dihosting oleh Mosaic AI Model Melayani titik akhir dari kueri SQL.