Aracılığıyla paylaş


Databricks'te MLflow

Bu makalede, yüksek kaliteli üretken yapay zeka aracıları ve makine öğrenmesi modelleri geliştirmek için Databricks'te MLflow'un nasıl kullanıldığı açıklanmaktadır.

Not

Azure Databricks'i kullanmaya yeni başlıyorsanız Databricks Free Edition'da MLflow'u denemeyi göz önünde bulundurun.

MLflow nedir?

MLflow aracılar, LLM'ler ve ML modelleri için en büyük açık kaynak yapay zeka mühendislik platformudur. MLflow, her boyuttan ekibin üretim kalitesindeki yapay zeka uygulamalarında hata ayıklamasını, değerlendirmesini, izlemesini ve iyileştirmesini sağlarken maliyetleri denetler ve modellere ve verilere erişimi yönetir. Aylık 30 milyondan fazla indirme ile binlerce kuruluş, yapay zekayı güvenle üretime göndermek için her gün MLflow'a güveniyor.

MLflow'un aracılar ve LLM uygulamalarına yönelik kapsamlı özellik kümesi, üretim sınıfı gözlemlenebilirlik, değerlendirme, istem yönetimi, maliyetleri ve model erişimini yönetmek için bir Yapay Zeka Ağ Geçidi ve daha fazlasını içerir.

Makine öğrenmesi (ML) modeli geliştirme için MLflow deneme izleme, model değerlendirme özellikleri, üretim modeli kayıt defteri ve model dağıtım araçları sağlar.

MLflow herhangi bir LLM sağlayıcısını, aracı çerçevesini, ML kitaplığını ve programlama dilini destekler. MLflow Python, TypeScript/JavaScript, Java ve R için yerel SDK'lar sağlar.

MLflow 3

Azure Databricks'te MLflow 3, aracılar ve LLM uygulamaları için en son düzeyde gözlemlenebilirlik, değerlendirme ve istem yönetimi sunar. MLflow 3, ML modeli geliştirme için deneme izleme, model değerlendirmesi, üretim modeli kayıt defteri ve model dağıtım araçları sağlar. Azure Databricks'te MLflow 3'i kullanarak şunları yapabilirsiniz:

  • Geliştirme not defterindeki etkileşimli sorgulardan üretim toplu işlemine veya gerçek zamanlı dağıtımlara kadar tüm ortamlarda modellerinizin, yapay zeka uygulamalarınızın ve aracılarınızın performansını merkezi olarak izleyin ve analiz edin.

    Model izleme arayüzü.

  • Unity Kataloğu'nu kullanarak değerlendirme ve dağıtım iş akışlarını düzenleyin ve modelinizin, yapay zeka uygulamanızın veya aracınızın her sürümü için kapsamlı durum günlüklerine erişin.

    Aşamalı dağıtım ve ölçüm koleksiyonu içeren karmaşık bir dağıtım işi.

  • Unity Kataloğu'ndaki model sürümü sayfasından ve REST API'den model ölçümlerini ve parametrelerini görüntüleyin ve erişin.

    Unity Kataloğu'nda birden çok çalıştırmanın ölçümlerini gösteren model sürümü sayfası.

  • Tüm genel yapay zeka uygulamalarınız ve aracılarınız için istek ve yanıtlara (izlemeler) açıklama ekleyin ve insan uzmanların ve otomatik tekniklerin (hakim olarak LLM gibi) zengin geri bildirim sunmasını sağlayın. Uygulama sürümlerinin performansını değerlendirmek ve karşılaştırmak ve kaliteyi artırmak için veri kümeleri oluşturmak için bu geri bildirimden yararlanabilirsiniz.

    Birden çok izlemenin ayrıntılarını gösteren model sayfasının İzlemeler sekmesi.

Bu özellikler tüm yapay zeka girişimleriniz için değerlendirme, dağıtım, hata ayıklama ve izlemeyi basitleştirir ve kolaylaştırır.

MLflow 3 ayrıca Günlüğe Kaydedilen Modeller ve Dağıtım Görevleri kavramlarını da tanıtır.

  • Günlüğe Kaydedilen Modeller , bir modelin yaşam döngüsü boyunca ilerleme durumunu izlemenize yardımcı olur. kullanarak log_model()bir modeli günlüğe kaydettiğinizde, modelin yaşam döngüsü boyunca, farklı ortamlarda ve çalıştırmalarda kalıcı olan ve meta veriler, ölçümler, parametreler ve modeli oluşturmak için kullanılan kod gibi yapıtlara bağlantılar içeren bir LoggedModel oluşturulur. Kaydedilmiş Modeli kullanarak modelleri birbiriyle karşılaştırabilir, en yüksek performanslı modeli bulabilir ve hata ayıklama sırasında bilgileri takip edebilirsiniz.
  • Değerlendirme , onay ve dağıtım gibi adımlar dahil olmak üzere model yaşam döngüsünü yönetmek için dağıtım işleri kullanılabilir. Bu model iş akışları Unity Kataloğu tarafından yönetilir ve tüm olaylar Unity Kataloğu'ndaki model sürümü sayfasında bulunan bir etkinlik günlüğüne kaydedilir.

MLflow 3'ü yüklemek ve kullanmaya başlamak için aşağıdaki makalelere bakın.

Databricks tarafından yönetilen MLflow

Databricks, MLflow'u kurumsal kullanım için daha sağlam ve ölçeklenebilir hale getirmek için açık kaynak deneyimini temel alan, tam olarak yönetilen ve barındırılan bir sürümü sağlar.

Temsilciler ve LLM uygulamaları

Databricks'te MLflow aracıları ve LLM uygulamalarını geliştirmek, değerlendirmek ve izlemek için eksiksiz bir platform sağlar.

  • Gözlemlenebilirlik:MLflow İzleme , bir isteğin her ara adımıyla ilişkili girişleri, çıkışları ve meta verileri kaydeder ve aracılarda beklenmeyen davranışın kaynağını hızlı bir şekilde bulmanızı sağlar.
  • Değerlendirme: MLflow değerlendirmesiyle desteklenen aracı kalitesini ölçmek ve iyileştirmek için Mozaik AI Aracısı Değerlendirmesi'ni kullanın.
  • İstem yönetimi: Yapay zeka uygulamalarınızda kullanılan istem şablonlarını sürüm, yönetme ve yineleme.
  • Aracı geliştirme: Aracı kodu, performans ölçümleri ve izlemeleri izlemek için MLflow kullanan aracılar oluşturmak için Mozaik AI Aracı Çerçevesi'ni kullanın.
  • Etkileşimli hata ayıklama: MLflow denemenizde izlemelere, değerlendirme çalıştırmalarına, puanlayıcılara ve daha fazlasına doğal dil erişimi için aracı gözlemlenebilirliği ve değerlendirmesi için Genie Code kullanın.

ML modeli geliştirme

Databricks'te MLflow, ML modeli geliştirme için deneme izleme, model değerlendirmesi, üretim modeli kayıt defteri ve model dağıtım araçları sağlar.

Aşağıdaki diyagramda Databricks'in makine öğrenmesi modellerini eğitmek ve dağıtmak için MLflow ile tümleştirmesi gösterilmektedir.

MLflow, ML modelleri geliştirmek ve dağıtmak için Databricks ile tümleşir.

Databricks tarafından yönetilen MLflow, ML yaşam döngüsündeki tüm verilerinizi ve yapay zeka varlıklarınızı birleştirmek için Unity Kataloğu ve Cloud Data Lake'i kullanır:

  1. Özellik deposu: Databricks otomatik özellik aramaları tümleştirmeyi basitleştirir ve hataları azaltır.
  2. Modelleri Eğitin: Model eğitmek veya temel modellerde ince ayar yapmak için Mozaik Yapay Zeka kullanın.
  3. İzleme: MLflow, model performansını değerlendirmek ve karşılaştırmak için parametreleri, metrikleri ve çıktıları kaydederek eğitimi izler.
  4. Model Kayıt Defteri: Unity Kataloğu ile tümleştirilmiş MLflow Model Kayıt Defteri, yapay zeka modellerini ve yapıtlarını merkezileştirir.
  5. Model Sunumu: Mosaic AI Model Hizmeti, modelleri bir REST API uç noktasına sunar.
  6. İzleme: Mosaic Yapay Zeka Modeli Yönetimi, modelleri izlemek ve hata ayıklamak için istek ve yanıtları otomatik olarak yakalar. MLflow bu verileri her istek için izleme verileriyle genişleter.

Model eğitimi

MLflow Modelleri, Databricks'te yapay zeka ve ML geliştirmenin temelini oluşturur. MLflow Modelleri, makine öğrenmesi modellerini ve üretken yapay zeka aracılarını paketlemek için standartlaştırılmış bir biçimdir. Standartlaştırılmış biçim, modellerin ve aracıların Databricks'te aşağı akış araçları ve iş akışları tarafından kullanılabilmesini sağlar.

Databricks, farklı ml modellerini eğitmeye yardımcı olacak özellikler sağlar.

  • Mozaik AIkullanarak yapay zeka modellerini eğitin.

Deneme izleme

Databricks, model geliştirirken çalışmanızı izlemek için kuruluş birimleri olarak MLflow denemelerini kullanır.

Deney takibi, makine öğrenmesi eğitimi ve aracı geliştirme sırasında parametreleri, ölçümleri, çıkartıları ve kod sürümlerini günlüğe kaydetmenize ve yönetmenize olanak tanır. Günlükleri denemeler ve çalıştırmalar halinde düzenlemek modelleri karşılaştırmanıza, performansı analiz etmenizi ve daha kolay yinelemenizi sağlar.

Unity Katalog ile Model Kayıt Defteri

MLflow Model Kayıt Defteri, model dağıtım işlemini yönetmek için merkezi bir model deposu, kullanıcı arabirimi ve API kümesidir.

Databricks, modellere merkezi idare sağlamak için Model Kayıt Defteri'ni Unity Kataloğu ile tümleştirir. Unity Kataloğu tümleştirmesi, çalışma alanlarındaki modellere erişmenizi, model kökenini izlemenizi ve modelleri yeniden kullanmak üzere keşfetmenizi sağlar.

Model Hizmeti

Databricks Model Sunma, MLflow Model Kayıt Defteri ile sıkı bir şekilde tümleşiktir ve yapay zeka modellerini dağıtmak, yönetmek ve sorgulamak için birleşik, ölçeklenebilir bir arabirim sağlar. Hizmet ettiğiniz her model, web veya istemci uygulamalarıyla tümleştirebileceğiniz bir REST API olarak kullanılabilir.

Bunlar ayrı bileşenler olsa da Model Sunma, model sürümü oluşturma, bağımlılık yönetimi, doğrulama ve idareyi işlemek için MLflow Model Kayıt Defteri'ni yoğun bir şekilde kullanır.

Açık kaynak ve Databricks tarafından yönetilen MLflow özellikleri karşılaştırması

Açık kaynak ve Databricks tarafından yönetilen sürümler arasında paylaşılan genel MLflow kavramları, API'leri ve özellikleri içinMLflow belgelerine bakın. Databricks tarafından yönetilen MLflow'a özel özellikler için Databricks belgelerine bakın.

Aşağıdaki tabloda, açık kaynak MLflow ile Databricks tarafından yönetilen MLflow arasındaki temel farklar vurgulanır ve daha fazla bilgi edinmenize yardımcı olacak belge bağlantıları sağlanır:

Özellik Açık kaynak MLflow'da kullanılabilirlik Databricks tarafından yönetilen MLflow'da kullanılabilirlik
Güvenlik Kullanıcı kendi güvenlik idare katmanını sağlamalıdır Databricks kurumsal düzeyde güvenlik
Olağanüstü durum kurtarma Kullanılamaz Databricks olağanüstü durum kurtarma
Deneme izleme MLflow İzleme API'si MLflow İzleme API'si, Databricks gelişmiş deney izleme ile entegre edilmiştir.
Model Kayıt Defteri MLflow Model Kayıt Defteri Databricks Unity Kataloğu ile tümleştirilmiş MLflow Model Kayıt Defteri
Unity Kataloğu entegrasyonu Unity Kataloğu ile açık kaynak tümleştirmesi Databricks Unity Kataloğu
Model dağıtımı Dış hizmet çözümleriyle kullanıcı tarafından yapılandırılmış tümleştirmeler (SageMaker, Kubernetes, kapsayıcı hizmetleri vb.) Databricks Model Servisi ve harici servis çözümleri
Yapay zeka aracıları MLflow LLM geliştirme MLflow LLM geliştirmesi, Mozaik AI Aracı Çerçevesi ve Aracı Değerlendirme ile entegre edilmiştir.
Şifreleme Kullanılamaz Müşteri tarafından yönetilen anahtarları kullanarak şifreleme

Not

Açık kaynak telemetri koleksiyonu MLflow 3.2.0'da kullanıma sunulmuştur ve Databricks'te varsayılan olarak devre dışıdır. Daha fazla ayrıntı için MLflow kullanım izleme belgelerine bakın.