Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Tek düğümlü görevler için AI Çalışma Zamanı Genel Önizleme aşamasındadır. Çoklu GPU iş yükleri için dağıtılmış eğitim API'si Beta'da kalır.
AI Çalışma Zamanına Genel Bakış
AI Runtime, Databricks'te derin öğrenme iş yüklerine yönelik bir işlem teklifidir ve Databricks Sunucusuz için GPU desteği sunar. En sevdiğiniz çerçeveleri kullanarak özel modelleri eğitmek ve ince ayar yapmak ve en son verimlilik, performans ve kalite elde etmek için AI Çalışma Zamanı'nı kullanabilirsiniz. Sunucusuz işlemin Databricks mimarisine nasıl uyduğunu gösteren bir genel bakış için bkz. Sunucusuz çalışma alanı mimarisi.
Temel özellikler
- Tam olarak yönetilen GPU altyapısı : Gpu'lara sunucusuz, esnek erişim ve yönetecek küme yapılandırması, sürücü seçimi veya otomatik ölçeklendirme ilkeleri yoktur.
- Derin öğrenme için ayrılmış bir çalışma zamanı — Bağımlılıklar üzerinde maksimum esneklik için en düşük varsayılan temel ortamı veya popüler ML çerçeveleriyle önceden yüklenmiş tam özellikli bir yapay zeka ortamı seçin.
- Sorunsuz geliştirme, veri erişimi ve deneme izleme için not defterleri, işler, Unity Kataloğu ve MLflow arasında yerel olarak tümleştirilmiştir.
Donanım seçenekleri
| Hızlandırıcı | En Uygun | Çoklu GPU |
|---|---|---|
| A10 | Küçükten orta düzeye ML ve klasik ML modelleri veya daha küçük dil modellerinde ince ayar yapma gibi derin öğrenme görevleri | Hayır |
| H100 | Büyük modellerde eğitim veya ince ayar yapma ya da gelişmiş derin öğrenme görevleri çalıştırma dahil olmak üzere büyük ölçekli yapay zeka iş yükleri | Evet (8 GPU) |
Önerilen kullanım örnekleri
Databricks, derin öğrenme, büyük ölçekli klasik iş yükleri veya GPU'lar içeren özel model eğitimi kullanım örnekleri için AI Runtime'ı önerir.
Örneğin:
- LLM ince ayarı (LoRA, QLoRA, tam ince ayar)
- Görüntü işleme (nesne algılama, görüntü sınıflandırma)
- Derin öğrenme tabanlı öneri sistemleri
- Pekiştirmeye dayalı öğrenme
- Derin öğrenme tabanlı zaman serisi tahmini
Gereksinimler
- Aşağıdaki Azure tarafından desteklenen bölgelerden birinde bir çalışma alanı:
centraluseastuseastus2northcentraluswestcentraluswestuswestus3
Sınırlamalar
- AI Çalışma Zamanı yalnızca A10 ve H100 hızlandırıcılarını destekler.
- AI Çalışma Zamanı, uyumluluk güvenlik profili çalışma alanları (HIPAA veya PCI gibi) için desteklenmez. Düzenlenen verilerin işlenmesi desteklenmez.
-
Ortamlar panelini kullanarak bağımlılık ekleme, yapay zeka çalışma zamanı zamanlanmış işleri için desteklenmez. Bunun yerine not defterinizde kullanarak
%pip installbağımlılıkları program aracılığıyla yükleyin. - AI Çalışma Zamanı'ndaki zamanlanmış işler için, not defterinizle ilişkilendirilmiş uyumsuz paket sürümleri için otomatik kurtarma davranışı desteklenmez.
- bir iş yükü için maksimum çalışma zamanı yedi gündür. Bu sınırı aşan model eğitim işleri için denetim noktası oluşturmayı uygulayın ve çalışma zamanı üst sınırına ulaşıldığında işi yeniden başlatın.
- AI Runtime, GPU kaynaklarına isteğe bağlı erişim sağlar. Bu, GPU'lara kolay ve esnek erişim sağlarken, bölgenizde kapasitenin kısıtlandığı veya kullanılamadığı dönemler olabilir.
- AI Runtime, talebin yüksek olduğu anlarda belirli durumlarda bölgeler arası GPU'lardan yararlanıyor. Bu tür kullanımla ilişkili çıkış maliyetleri olabilir.
AI Runtime'a bağlanma
AI Runtime'a not defterlerinden etkileşimli olarak bağlanabilir, not defterlerini yinelenen işler olarak zamanlayabilir veya İşler API'sini ve Databricks Varlık Paketlerini kullanarak program aracılığıyla iş oluşturabilirsiniz. Adım adım yönergeler için bkz. AI Runtime'a bağlanma.
Ortamı ayarlama
AI Runtime iki yönetilen Python ortamı sunar: minimum varsayılan temel ortam ve PyTorch ve Transformers gibi popüler ML çerçeveleriyle önceden yüklenmiş tam özellikli databricks yapay zeka ortamı. Ortam seçme, önbelleğe alma davranışı, özel modülleri içeri aktarma ve bilinen sınırlamalar hakkında ayrıntılı bilgi için bkz. Ortamınızı ayarlama.
Veri okuma
Sorunsuz bir deneyim için yapay zeka çalışma zamanında veri erişiminin nasıl çalıştığını anlamak önemlidir. Ayrıntılar için bkz . Yapay zeka çalışma zamanına veri yükleme.
Dağıtılmış eğitim
Önemli
Bu özellik Beta sürümündedir. Çalışma alanı yöneticileri Bu özelliğe erişimi Önizlemeler sayfasından denetleyebilir. Bkz. Azure Databricks önizlemelerini yönetme.
AI Runtime, dizüstü bilgisayarınızın bağlı olduğu tek düğüm üzerinde birden çok GPU'yu kullanarak dağıtılmış eğitimi destekler.
@distributed Python API'sindeki serverless_gpu (Beta) dekoratör kullanarak PyTorch DDP, FSDP veya DeepSpeed ile çok GPU'lu iş yüklerini minimum yapılandırmayla başlatabilirsiniz. Ayrıntılar için bkz . Multi-GPU iş yükü.
Deneme izleme ve gözlemlenebilirlik
MLflow tümleştirmesi, günlükleri görüntüleme ve model kontrol noktası yönetimi için Deneme izleme ve gözlemlenebilirlik bölümüne bakın.
Derin öğrenme için Genie Code
Genie Code, yapay zeka çalışma zamanında derin öğrenme iş yüklerini destekler. Eğitim kodu oluşturma, kitaplık yükleme hatalarını çözme, iyileştirme önerme ve yaygın sorunlarda hata ayıklama konusunda yardımcı olabilir. Bkz . Veri bilimi için Genie Code kullanma.
Guides
Klasik iş yüklerinden, örneğin not defterlerinden geçiş ve sorun giderme için bkz. AI Runtime için kullanıcı kılavuzları.