Aracılığıyla paylaş


Temel modeller için Mozaik Yapay Zeka Modeli Eğitimi

Önemli

Bu özellik şu bölgelerde Genel Önizleme aşamasındadır: centralus, eastus, eastus2, northcentralusve westus.

Mozaik AI Modeli Eğitimi (eski adıyla Temel Model Eğitimi) ile kendi verilerinizi kullanarak bir temel modeli özelleştirerek uygulamanızın performansını iyileştirebilirsiniz. Tam parametre ince ayarı yaparak veya temel modelin eğitimine devam ederek, modeli sıfırdan eğitmeye kıyasla çok daha az veri, zaman ve işlem kaynağı kullanarak kendi modelinizi eğitebilirsiniz.

Databricks ile her şeye tek bir platformda sahip olursunuz: eğitim için kullanılacak kendi verileriniz, eğitmek için temel modeliniz, MLflow'a kaydedilen denetim noktaları ve Unity Kataloğu'nda kayıtlı olan ve dağıtılmaya hazır olan model.

Mozaik Yapay Zeka Modeli Eğitim API'sini kullanarak çalıştırma oluşturmayı öğrenmek için Bkz . Mozaik AI Modeli Eğitimi çalıştırması oluşturma ve dağıtma, ardından sonuçları gözden geçirme ve Databricks kullanıcı arabirimini ve Mozaik Yapay Zeka Modeli Sunma'yı kullanarak modeli dağıtma.

Mozaik Yapay Zeka Modeli Eğitimi nedir?

Mozaik AI Modeli Eğitimi, temel modeli ayarlamak veya daha fazla eğitmek için Databricks API'sini veya kullanıcı arabirimini kullanmanıza olanak tanır.

Mozaik yapay zeka modeli eğitimini kullanarak şunları yapabilirsiniz:

  • MLflow'a kaydedilmiş denetim noktalarıyla modeli özel verilerinizle eğitin. Eğitilen modelin tam denetimini elinde tutarsınız.
  • Modeli Unity Kataloğu'na otomatik olarak kaydederek model sunma ile kolay dağıtıma olanak tanır.
  • Daha önce eğitilmiş bir modelin ağırlıklarını yükleyerek tamamlanmış, özel bir modeli daha fazla eğitin.

Databricks aşağıdakiler için Mozaik Yapay Zeka Modeli Eğitimi'nin denenmesini önerir:

  • Birkaç deneme öğrenmesi denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
  • Mevcut bir modelde istem mühendisliğini denediniz ve daha iyi sonuçlar elde etmek istiyorsunuz.
  • Veri gizliliği için özel bir model üzerinde tam sahiplik istiyorsunuz.
  • Gecikme süresine veya maliyete duyarlısınız ve göreve özgü verilerinizle daha küçük, daha ucuz bir model kullanmak istiyorsunuz.

Desteklenen görevler

Mozaik Yapay Zeka Modeli Eğitimi aşağıdaki kullanım örneklerini destekler:

  • Sohbet tamamlama: Önerilen görev. Kullanıcı ve yapay zeka yardımcısı arasındaki sohbet günlüklerinde modelinizi eğitin. Bu biçim hem gerçek sohbet günlükleri için hem de soru yanıtlama ve konuşma metni için standart bir biçim olarak kullanılabilir. Metin, belirli bir model için uygun biçime otomatik olarak biçimlendirilir. Şablon oluşturma hakkında daha fazla bilgi için HuggingFace belgelerindeki örnek sohbet şablonlarına bakın.
  • Denetimli ince ayar: Modelinizi yapılandırılmış istem yanıtı verileri üzerinde eğitin. Modelinizi yeni bir göreve uyarlamak, yanıt stilini değiştirmek veya yönerge takip özellikleri eklemek için bunu kullanın. Bu görev verilerinize otomatik olarak biçimlendirme uygulamaz ve yalnızca özel veri biçimlendirmesi gerektiğinde önerilir.
  • Devam eden ön eğitim: Modelinizi ek metin verileriyle eğitin. Bir modele yeni bilgi eklemek veya modeli belirli bir etki alanına odaklamak için bunu kullanın.

Gereksinim -leri

  • Aşağıdaki Azure bölgelerinden birinde bir Databricks çalışma alanı: centralus, eastus, eastus2, northcentralusveya westus.
  • kullanılarak pip install databricks_genaiyüklenen Mozaik AI Modeli Eğitim API'leri.
  • Verileriniz bir Delta tablosundaysa Databricks Runtime 12.2 LTS ML veya üzeri.

Gerekli giriş verileri biçimleri hakkında bilgi için bkz . Mozaik AI Modeli Eğitimi için verileri hazırlama.

Model eğitimi için önerilen veri boyutu

Databricks başlangıçta bir-dört dönem kullanarak eğitim önerir. İnce ayarlı modelinizi değerlendirdikten sonra, model çıkışlarının eğitim verilerinize daha benzer olmasını istiyorsanız, bir-iki dönem daha kullanarak eğitime devam etmeye başlayabilirsiniz.

Model performansı, ince ayar verilerinizde temsil edilmeyen görevlerde önemli ölçüde azalırsa veya model ince ayar verilerinizin tam kopyalarını çıkarıyor gibi görünüyorsa Databricks, eğitim dönemlerinin sayısını azaltmanızı önerir.

Denetimli ince ayar ve sohbet tamamlama için, modelin en az bir tam bağlam uzunluğu için yeterli belirteç sağlamanız gerekir. Örneğin, için 4096 belirteçleri veya için meta-llama/Llama-2-7b-chat-hf mistralai/Mistral-7B-v0.132768 belirteçleri.

Sürekli ön eğitim için Databricks, özel verilerinizi öğrenen daha kaliteli bir model elde etmek için en az 1,5 milyon belirteç önerir.

Desteklenen modeller

Aşağıdaki tabloda desteklenen modeller listelenmektedir. Desteklenen en son modeller ve ilişkili bağlam uzunlukları için işlevini kullanın get_models() .


from databricks.model_training import foundation_model

foundation_model.get_models()

Önemli

Meta Llama 3.2, LLAMA 3.2 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, bu lisansın koşullarına ve Llama 3.2 Kabul Edilebilir Kullanım İlkesi'ne uyumluluğunu sağlamakla sorumludur.

Meta Llama 3.1, LLAMA 3.1 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

Llama 3, LLAMA 3 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. altında lisanslanır. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

Llama 2 ve Code Llama modelleri , LLAMA 2 Topluluk Lisansı, Telif Hakkı © Meta Platformları, Inc. Tüm Hakları Saklıdır. Müşteriler, geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

DBRX, Databricks Açık Model Lisansı, Telif Hakkı © Databricks, Inc. altında sağlanır ve bu lisansa tabidir. Tüm hakları saklıdır. Müşteriler, Databricks Kabul Edilebilir Kullanım ilkesi de dahil olmak üzere geçerli model lisanslarıyla uyumluluğu sağlamakla sorumludur.

Model Bağlam uzunluğu üst sınırı Notlar
databricks/dbrx-base 32768
databricks/dbrx-instruct 32768
meta-llama/Llama-3.2-1B 131072
meta-llama/Llama-3.2-1B-Instruct 131072
meta-llama/Llama-3.2-3B 131072
meta-llama/Llama-3.2-3B-Instruct 131072
meta-llama/Meta-Llama-3.1-405B 131072
meta-llama/Meta-Llama-3.1-405B-Instruct 131072
meta-llama/Meta-Llama-3.1-70B 131072
meta-llama/Meta-Llama-3.1-70B-Instruct 131072
meta-llama/Meta-Llama-3.1-8B 131072
meta-llama/Meta-Llama-3.1-8B-Instruct 131072
meta-llama/Meta-Llama-3-70B 8192 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Meta-Llama-3-70B-Instruct 8192 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Meta-Llama-3-8B 8192 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Meta-Llama-3-8B-Instruct 8192 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-7b-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-13b-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-70b-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-7b-chat-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-13b-chat-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
meta-llama/Llama-2-70b-chat-hf 4096 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-7b-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-13b-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-34b-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-7b-Instruct-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-13b-Instruct-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-34b-Instruct-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-7b-Python-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-13b-Python-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
codellama/CodeLlama-34b-Python-hf 16384 13 Aralık 2024'tan sonra bu model artık desteklenmeyecektir. Önerilen değiştirme için bkz . Kullanımdan kaldırılan modeller .
mistralai/Mistral-7B-v0.1 32768
mistralai/Mistral-7B-Instruct-v0.2 32768
mistralai/Mixtral-8x7B-v0.1 32768

Mozaik Yapay Zeka Modeli Eğitimini Kullanma

Mozaik AI Modeli Eğitimi'ne databricks_genai SDK kullanılarak erişilebilir. Aşağıdaki örnek Unity Katalog Birimlerindeki verileri kullanan bir eğitim çalıştırması oluşturur ve başlatır. Yapılandırma ayrıntıları için bkz . Mozaik AI Modeli Eğitim API'sini kullanarak eğitim çalıştırması oluşturma.

from databricks.model_training import foundation_model as fm

model = 'meta-llama/Meta-Llama-3.1-8B-Instruct'
# UC Volume with JSONL formatted data
train_data_path = 'dbfs:/Volumes/main/mydirectory/ift/train.jsonl'
register_to = 'main.mydirectory'
run = fm.create(
  model=model,
  train_data_path=train_data_path,
  register_to=register_to,
)

Veri hazırlama, eğitim çalıştırma yapılandırması ve dağıtımında ince ayarlama adımlarını gösteren bir yönerge ince ayarı örneği için Yönerge ince ayarı: Adlandırılmış Varlık Tanıma tanıtım not defterine bakın.

Sınırlamalar

  • İşlem kullanılabilirliği nedeniyle büyük veri kümeleri (10B+ belirteçler) desteklenmez.

  • Sürekli ön eğitim için iş yükleri 60-256 MB dosyayla sınırlıdır. 1 GB'tan büyük dosyalar daha uzun işleme sürelerine neden olabilir.

  • Databricks, Mozaik Yapay Zeka Modeli Eğitimi'ni kullanarak en son modelleri özelleştirme için kullanılabilir hale getirmek için çaba harcar. Yeni modeller kullanıma sunuldukça API veya kullanıcı arabiriminden eski modellere erişim olanağı kaldırılabilir, eski modeller kullanım dışı bırakılmış veya desteklenen modeller güncelleştirilebilir. Bkz . Üretken yapay zeka modelleri bakım ilkesi.

  • Mozaik Yapay Zeka Modeli Eğitimi yalnızca Özel Bağlantı arkasındaki depolamayı kullanarak Azure çalışma alanları için model eğitimini destekler.

    • şu anda yalnızca içindeki eastus2 Özel Bağlantı arkasındaki depolama alanından veri okuma desteklenmektedir.
  • Verilerinizi Unity Kataloğu'nda depolayan Azure Data Lake Storage hesabında etkinleştirilmiş güvenlik duvarlarınız varsa Mozaik AI Modeli Eğitimi'ni kullanmak için Databricks sunucusuz veri düzlemi kümelerinden gelen trafiğe izin vermeniz gerekir. Daha fazla bilgi ve olası özel çözümler için Databricks hesap ekibinize ulaşın.