Temel Modelde İnce Ayarlama
Önemli
Bu özellik şu bölgelerde Genel Önizleme aşamasındadır: centralus
, eastus
, eastus2
, northcentralus
ve westus
.
Temel Model İnce Ayarı (artık Mozaik AI Modeli Eğitimi'nin bir parçası) ile kendi verilerinizi kullanarak bir temel modeli özelleştirerek uygulamanızın performansını iyileştirebilirsiniz. Tam parametre ince ayarı yaparak veya temel modelin eğitimine devam ederek, modeli sıfırdan eğitmeye kıyasla çok daha az veri, zaman ve işlem kaynağı kullanarak kendi modelinizi eğitebilirsiniz.
Databricks ile her şeye tek bir platformda sahip olursunuz: eğitim için kullanılacak kendi verileriniz, eğitmek için temel modeliniz, MLflow'a kaydedilen denetim noktaları ve Unity Kataloğu'nda kayıtlı olan ve dağıtılmaya hazır olan model.
Bkz . Öğretici: Temel Model İnce Ayarlama API'sini kullanarak çalıştırma oluşturmayı ve dağıtmayı öğrenmek için Temel Model İnce Ayarlama çalıştırması oluşturma ve dağıtma, ardından sonuçları gözden geçirme ve Databricks kullanıcı arabirimini ve Mozaik Yapay Zeka Modeli Sunma'yı kullanarak modeli dağıtma.
Temel Model İnce Ayarı nedir?
Temel Model İnce Ayarı, temel modeli ayarlamak veya daha fazla eğitmek için Databricks API'sini veya kullanıcı arabirimini kullanmanıza olanak tanır.
Temel Model İnce Ayarını kullanarak şunları yapabilirsiniz:
- MLflow'a kaydedilmiş denetim noktalarıyla modeli özel verilerinizle eğitin. Eğitilen modelin tam denetimini elinde tutarsınız.
- Modeli Unity Kataloğu'na otomatik olarak kaydederek model sunma ile kolay dağıtıma olanak tanır.
- Daha önce eğitilmiş bir modelin ağırlıklarını yükleyerek tamamlanmış, özel bir modeli daha fazla eğitin.
Databricks, aşağıdakiler için Temel Model İnce Ayarını denemenizi önerir:
- Birkaç deneme öğrenmesi denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
- Mevcut bir modelde istem mühendisliğini denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
- Veri gizliliği için özel bir model üzerinde tam sahiplik istiyorsunuz.
- Gecikme süresine veya maliyete duyarlısınız ve göreve özgü verilerinizle daha küçük, daha ucuz bir model kullanmak istiyorsunuz.
Desteklenen görevler
Temel Model İnce Ayarı aşağıdaki kullanım örneklerini destekler:
- Sohbet tamamlama: Önerilen görev. Kullanıcı ve yapay zeka yardımcısı arasındaki sohbet günlüklerinde modelinizi eğitin. Bu biçim hem gerçek sohbet günlükleri için hem de soru yanıtlama ve konuşma metni için standart bir biçim olarak kullanılabilir. Metin, belirli bir model için uygun biçime otomatik olarak biçimlendirilir. Şablon oluşturma hakkında daha fazla bilgi için HuggingFace belgelerindeki örnek sohbet şablonlarına bakın.
- Yönergesinde ince ayarlama: Modelinizi yapılandırılmış istem yanıt verileri üzerinde eğitin. Modelinizi yeni bir göreve uyarlamak, yanıt stilini değiştirmek veya yönerge takip özellikleri eklemek için bunu kullanın. Bu görev verilerinize otomatik olarak biçimlendirme uygulamaz ve yalnızca özel veri biçimlendirmesi gerektiğinde önerilir.
- Devam eden ön eğitim: Modelinizi ek metin verileriyle eğitin. Bir modele yeni bilgi eklemek veya modeli belirli bir etki alanına odaklamak için bunu kullanın.
Gereksinim -leri
- Aşağıdaki Azure bölgelerinden birinde bir Databricks çalışma alanı:
centralus
,eastus
,eastus2
,northcentralus
veyawestus
. - Temel Model kullanılarak
pip install databricks_genai
yüklenen API'lerde ince ayar. - Verileriniz bir Delta tablosundaysa, Databricks Runtime 12.2 LTS ML veya daha üstünü kullanın.
Gerekli giriş verileri biçimleri hakkında bilgi için bkz . Temel Model için veri hazırlama İnce ayarlama .
Model eğitimi için önerilen veri boyutu
Databricks başlangıçta bir-dört dönem kullanarak eğitim önerir. İnce ayarlı modelinizi değerlendirdikten sonra, model çıkışlarının eğitim verilerinize daha benzer olmasını istiyorsanız, bir-iki dönem daha kullanarak eğitime devam etmeye başlayabilirsiniz.
Model performansı, ince ayar verilerinizde temsil edilmeyen görevlerde önemli ölçüde azalırsa veya model ince ayar verilerinizin tam kopyalarını çıkarıyor gibi görünüyorsa Databricks, eğitim dönemlerinin sayısını azaltmanızı önerir.
Yönerge ince ayarı ve sohbet tamamlama için, modelin en az bir tam bağlam uzunluğu için yeterli belirteç sağlamanız gerekir. Örneğin, meta-llama/Llama-3.2-3B-Instruct
için 131072 belirteç.
Sürekli ön eğitim için Databricks, özel verilerinizi öğrenen daha kaliteli bir model elde etmek için en az 1,5 milyon belirteç önerir.
Desteklenen modeller
Aşağıdaki tabloda desteklenen modeller listelenmektedir. İlgili model lisansı ve kabul edilebilir kullanım ilkesi bilgileri için bkz. Model lisansları.
En son model desteğine devam etmek için Databricks desteklenen modelleri güncelleştirebilir veya eski modelleri devre dışı bırakabilir. bkz. Kullanımdan kaldırılacak modeller.
Model | Bağlam uzunluğu üst sınırı | Notlar |
---|---|---|
meta-llama/Llama-3.2-1B |
131072 | |
meta-llama/Llama-3.2-1B-Instruct |
131072 | |
meta-llama/Llama-3.2-3B |
131072 | |
meta-llama/Llama-3.2-3B-Instruct |
131072 | |
meta-llama/Meta-Llama-3.1-70B |
131072 | |
meta-llama/Meta-Llama-3.1-70B-Instruct |
131072 | |
meta-llama/Meta-Llama-3.1-8B |
131072 | |
meta-llama/Meta-Llama-3.1-8B-Instruct |
131072 |
Kullanımdan kaldırılacak modeller
Aşağıdaki tabloda, kullanımdan kaldırılması planlanan desteklenen modeller listelenmektedir. Kullanımdan kaldırılan modeller, planlanan kullanımdan kaldırma tarihleri ve önerilen model değiştirmeleri için Kullanımdan kaldırılan modeller bakın.
Önemli
30 Ocak 2025'in ardından Meta Llama 3.1 405B model ailesi kullanımdan kaldırıldı. Önerilen değiştirme modelleri için bkz. Kullanımdan kaldırılan modeller.
Model | Bağlam uzunluğu üst sınırı | Notlar |
---|---|---|
mistralai/Mistral-7B-v0.1 |
32768 | Bu model artık 30 Nisan 2025'in ardından desteklenmiyor. |
mistralai/Mistral-7B-Instruct-v0.2 |
32768 | Bu model artık 30 Nisan 2025'in ardından desteklenmiyor. |
mistralai/Mixtral-8x7B-v0.1 |
32768 | Bu model artık 30 Nisan 2025'in ardından desteklenmiyor. |
databricks/dbrx-base |
32768 | Bu model artık 30 Nisan 2025'in ardından desteklenmiyor. |
databricks/dbrx-instruct |
32768 | Bu model artık 30 Nisan 2025'in ardından desteklenmiyor. |
Modeli lisansları
Aşağıdaki tabloda, desteklenen model aileleri için geçerli model lisansı ve kabul edilebilir kullanım ilkesi bilgileri sağlanmaktadır.
Model ailesi | Lisans ve kabul edilebilir kullanım ilkesi |
---|---|
Meta Lama 3.2 | Meta Llama 3.2, LLAMA 3.2 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, bu lisansın koşullarına ve Llama 3.2 Kabul Edilebilir Kullanım İlkesi'ne uyumluluğunu sağlamakla sorumludur. |
Meta Llama 3.1 | Meta Llama 3.1, LLAMA 3.1 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur. |
DBRX | DBRX, Databricks Açık Model Lisansı, Telif Hakkı © Databricks, Inc. altında sağlanır ve bu lisansa tabidir. Tüm hakları saklıdır. Müşteriler, Databricks Kabul Edilebilir Kullanım ilkesi de dahil olmak üzere geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur. |
Temel Model İnce Ayarını Kullanma
Temel Model hassas ayarlamaya SDK kullanılarak databricks_genai
erişilebilir. Aşağıdaki örnek, Unity Katalog Birimlerindeki verileri kullanan bir eğitim çalışması oluşturup başlatır. Yapılandırma ayrıntıları için bkz . Temel Model İnce Ayarlama API'sini kullanarak eğitim çalıştırması oluşturma.
from databricks.model_training import foundation_model as fm
model = 'meta-llama/Meta-Llama-3.1-8B-Instruct'
# UC Volume with JSONL formatted data
train_data_path = 'dbfs:/Volumes/main/mydirectory/ift/train.jsonl'
register_to = 'main.mydirectory'
run = fm.create(
model=model,
train_data_path=train_data_path,
register_to=register_to,
)
Veri hazırlama, eğitim çalıştırma yapılandırması ve dağıtımında ince ayarlama adımlarını gösteren bir yönerge ince ayarı örneği için Yönerge ince ayarı: Adlandırılmış Varlık Tanıma tanıtım not defterine bakın.
Sınırlamalar
İşlem kullanılabilirliği nedeniyle büyük veri kümeleri (10B+ belirteçler) desteklenmez.
Sürekli ön eğitim için iş yükleri 60-256 MB dosyayla sınırlıdır. 1 GB'tan büyük dosyalar daha uzun işleme sürelerine neden olabilir.
Databricks, Temel Model İnce Ayarlaması'nı kullanarak en son son son modelleri özelleştirme için kullanılabilir hale getirmek için çaba gösterir. Yeni modeller kullanıma sunuldukça API veya kullanıcı arabiriminden eski modellere erişim kaldırılabilir, eski modeller kullanım dışı bırakılmış veya desteklenen modeller güncelleştirilebilir. Bkz . Üretken yapay zeka modelleri bakım ilkesi.
Çalışma alanınızda Azure Özel Bağlantı ayarlandıysa, Temel Model İnce Ayarı yalnızca
eastus2
içindeki Azure çalışma alanlarını destekler.Depolama alanınızda Özel Bağlantı ayarlandıysa, Databricks Unity Kataloğu tablolarının kullanılmasını önerir.
Verilerinizi Unity Kataloğu'nda depolayan Azure Data Lake Storage hesabında güvenlik duvarları etkinleştirildiyse, Temel Model İnce Ayarlama'yı kullanmak için Databricks sunucusuz veri düzlemi kümelerinden gelen trafiğe izin vermeniz gerekir. Daha fazla bilgi ve olası özel çözümler için Databricks hesap ekibinize ulaşın.