Aracılığıyla paylaş


Mozaik AI Modeli Eğitimine Giriş

Önemli

Bu özellik Genel Önizlemededir. Genel Önizleme'ye kaydolmak için Databricks hesap ekibinize ulaşın.

Mozaik AI Modeli Eğitimi (eski adıyla Temel Model Eğitimi) ile kendi verilerinizi kullanarak bir temel modeli özelleştirerek uygulamanızın performansını iyileştirebilirsiniz. Temel modelin ince ayarlarını yaparak veya eğitimine devam ederek, modeli sıfırdan eğitmeye kıyasla çok daha az veri, zaman ve işlem kaynağı kullanarak kendi modelinizi eğitebilirsiniz.

Databricks ile her şeye tek bir platformda sahip olursunuz: eğitim için kullanılacak kendi verileriniz, eğitmek için temel modeliniz, MLflow'a kaydedilen denetim noktaları ve Unity Kataloğu'nda kayıtlı olan ve dağıtılmaya hazır olan model.

Mozaik Yapay Zeka Modeli Eğitimi nedir?

Mozaik AI Modeli Eğitimi, temel modeli ayarlamak veya daha fazla eğitmek için Databricks API'sini veya kullanıcı arabirimini kullanmanıza olanak tanır.

Mozaik yapay zeka modeli eğitimini kullanarak şunları yapabilirsiniz:

  • MLflow'a kaydedilmiş denetim noktalarıyla modeli özel verilerinizle eğitin. Eğitilen modelin tam denetimini elinde tutarsınız.
  • Modeli Unity Kataloğu'na otomatik olarak kaydederek model sunma ile kolay dağıtıma olanak tanır.
  • Daha önce eğitilmiş bir modelin ağırlıklarını yükleyerek tamamlanmış, özel bir modeli daha fazla eğitin.

Databricks aşağıdakiler için Mozaik Yapay Zeka Modeli Eğitimi'nin denenmesini önerir:

  • Birkaç deneme öğrenmesi denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
  • Mevcut bir modelde istem mühendisliğini denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
  • Veri gizliliği için özel bir model üzerinde tam sahiplik istiyorsunuz.
  • Gecikme süresine veya maliyete duyarlısınız ve göreve özgü verilerinizle daha küçük, daha ucuz bir model kullanmak istiyorsunuz.

Desteklenen görevler

Mozaik Yapay Zeka Modeli Eğitimi aşağıdaki kullanım örneklerini destekler:

  • Sohbet tamamlama: Önerilen görev. Kullanıcı ve yapay zeka yardımcısı arasındaki sohbet günlüklerinde modelinizi eğitin. Bu biçim hem gerçek sohbet günlükleri için hem de soru yanıtlama ve konuşma metni için standart bir biçim olarak kullanılabilir. Metin, belirli bir model için uygun biçime otomatik olarak biçimlendirilir. Şablon oluşturma hakkında daha fazla bilgi için HuggingFace belgelerindeki örnek sohbet şablonlarına bakın.
  • Denetimli ince ayar: Modelinizi yapılandırılmış istem yanıtı verileri üzerinde eğitin. Modelinizi yeni bir göreve uyarlamak, yanıt stilini değiştirmek veya yönerge takip özellikleri eklemek için bunu kullanın. Bu görev verilerinize otomatik olarak biçimlendirme uygulamaz ve yalnızca özel veri biçimlendirmesi gerektiğinde önerilir.
  • Devam eden ön eğitim: Modelinizi ek metin verileriyle eğitin. Bir modele yeni bilgi eklemek veya modeli belirli bir etki alanına odaklamak için bunu kullanın.

Gereksinim -leri

  • Aşağıdaki Azure bölgelerinden birinde databricks çalışma alanı: centralus, eastus, eastus2, northcentralus, westcentralus, , westus, westus3.
  • kullanılarak pip install databricks_genaiyüklenen Mozaik AI Modeli Eğitim API'leri.
  • Verileriniz bir Delta tablosundaysa Databricks Runtime 12.2 LTS ML veya üzeri.

Gerekli giriş verileri biçimleri hakkında bilgi için bkz . Mozaik AI Modeli Eğitimi için verileri hazırlama.

Denetimli ince ayar ve sohbet tamamlama için, modelin en az bir tam bağlam uzunluğu için yeterli belirteç sağlamanız gerekir. Örneğin, için 4096 belirteçleri veya için meta-llama/Llama-2-7b-chat-hfmistralai/Mistral-7B-v0.132768 belirteçleri.

Sürekli ön eğitim için Databricks, özel verilerinizi öğrenen daha yüksek kaliteli bir model elde etmek için en az 1,5 milyon örnek önerir.

Desteklenen modeller

Desteklenen en son modeller ve ilişkili bağlam uzunlukları için işlevini kullanın get_models() .

Önemli

Llama 3, LLAMA 3 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. altında lisanslanır. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

Llama 2 ve Code Llama modelleri , LLAMA 2 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

DBRX, Databricks Açık Model Lisansı, Telif Hakkı © Databricks, Inc. altında sağlanır ve bu lisansa tabidir. Tüm hakları saklıdır. Müşteriler, Databricks Kabul Edilebilir Kullanım ilkesi de dahil olmak üzere geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.


from databricks.model_training import foundation_model

foundation_model.get_models()

Aşağıdaki tablo örnek bir çıktıdır ve desteklenen modellerin kapsamlı bir listesi olarak tasarlanmamıştır.

Model Bağlam uzunluğu üst sınırı
databricks/dbrx-base 4096
databricks/dbrx-instruct 4096
meta-llama/Meta-Llama-3-70B 8192
meta-llama/Meta-Llama-3-70B-Instruct 8192
meta-llama/Meta-Llama-3-8B 8192
meta-llama/Meta-Llama-3-8B-Instruct 8192
meta-llama/Llama-2-7b-hf 4096
meta-llama/Llama-2-13b-hf 4096
meta-llama/Llama-2-70b-hf 4096
meta-llama/Llama-2-7b-chat-hf 4096
meta-llama/Llama-2-13b-chat-hf 4096
meta-llama/Llama-2-70b-chat-hf 4096
codellama/CodeLlama-7b-hf 16384
codellama/CodeLlama-13b-hf 16384
codellama/CodeLlama-34b-hf 16384
codellama/CodeLlama-7b-Instruct-hf 16384
codellama/CodeLlama-13b-Instruct-hf 16384
codellama/CodeLlama-34b-Instruct-hf 16384
codellama/CodeLlama-7b-Python-hf 16384
codellama/CodeLlama-13b-Python-hf 16384
codellama/CodeLlama-34b-Python-hf 16384
mistralai/Mistral-7B-v0.1 32768
mistralai/Mistral-7B-Instruct-v0.2 32768
mistralai/Mixtral-8x7B-v0.1 32768

Mozaik Yapay Zeka Modeli Eğitimini Kullanma

Mozaik AI Modeli Eğitimi'ne databricks_genai SDK kullanılarak erişilebilir. Aşağıdaki örnek Unity Katalog Birimlerindeki verileri kullanan bir eğitim çalıştırması oluşturur ve başlatır. Yapılandırma ayrıntıları için bkz . Mozaik AI Modeli Eğitim API'sini kullanarak eğitim çalıştırması oluşturma.

from databricks.model_training import foundation_model as fm

model = 'meta-llama/Llama-2-7b-chat-hf'
# UC Volume with JSONL formatted data
train_data_path = 'dbfs:/Volumes/main/mydirectory/ift/train.jsonl'
register_to = 'main.mydirectory'
run = fm.create(
  model=model,
  train_data_path=train_data_path,
  register_to=register_to,
)

Veri hazırlama, eğitim çalıştırma yapılandırması ve dağıtımında ince ayarlama adımlarını gösteren bir yönerge ince ayarı örneği için Yönerge ince ayarı: Adlandırılmış Varlık Tanıma tanıtım not defterine bakın.

Sınırlamalar

  • İşlem kullanılabilirliği nedeniyle büyük veri kümeleri (10B+ belirteçler) desteklenmez.
  • PrivateLink desteklenmez.
  • Sürekli ön eğitim için iş yükleri 60-256 MB dosyayla sınırlıdır. 1 GB'tan büyük dosyalar daha uzun işleme sürelerine neden olabilir.
  • Databricks, Mozaik Yapay Zeka Modeli Eğitimi'ni kullanarak en son modelleri özelleştirme için kullanılabilir hale getirmek için çaba harcar. Yeni modelleri kullanıma sunarken API ve/veya kullanıcı arabiriminden eski modellere erişme, eski modelleri kullanımdan kaldırma veya desteklenen modelleri güncelleştirme olanağını kaldırabiliriz. Temel model API'den ve/veya kullanıcı arabiriminden kaldırılacaksa veya kullanımdan kaldırılacaksa Databricks, kaldırma ve/veya kullanımdan kaldırma tarihinden en az üç ay önce müşterileri bilgilendirmek için aşağıdaki adımları uygular:
    • Databricks çalışma alanınızın Denemeler > Mozaik AI Modeli Eğitimi sayfasından model kartında modelin kullanımdan kaldırılması için zamanlandığını belirten bir uyarı iletisi görüntüleyin.
    • Modelin kullanımdan kaldırılması için zamanlandığını belirten bir bildirim eklemek için belgelerimizi güncelleştirin.