Toplu çıkarım ve tahmin için modelleri dağıtma

Makale
05/23/2024

Bu makalede, çevrimdışı (toplu iş ve akış) çıkarım için MLflow modellerinin nasıl dağıtılacağı açıklanmaktadır. Databricks, toplu iş veya akış çıkarımı için makine öğrenmesi modellerini dağıtmak için MLflow kullanmanızı önerir. MLflow modelleriyle çalışma hakkında genel bilgi için bkz . MLflow modellerini günlüğe kaydetme, yükleme, kaydetme ve dağıtma.

Azure Databricks'te gerçek zamanlı model sunma hakkında bilgi için bkz . Azure Databricks ile hizmet veren model.

Model çıkarımı için MLflow kullanma

MLflow, toplu iş veya akış çıkarımı için kod oluşturmanıza yardımcı olur.

MLflow Model Kayıt Defteri'nde, Delta Live Tables aracılığıyla toplu işlem veya akış çıkarımı için otomatik olarak bir not defteri oluşturabilirsiniz.
Modelinizin MLflow Çalıştırma sayfasında, pandas veya Apache Spark DataFrames'te çıkarım için oluşturulan kod parçacığını kopyalayabilirsiniz.

Yukarıdaki seçeneklerden biri tarafından oluşturulan kodu da özelleştirebilirsiniz. Örnekler için aşağıdaki not defterlerine bakın:

Model çıkarımı örneği , scikit-learn ile eğitilmiş ve daha önce MLflow'da günlüğe kaydedilmiş bir modeli kullanarak modelin nasıl yüklendiğini gösterir ve bunu kullanarak farklı biçimlerdeki veriler üzerinde tahminler yapar. Not defteri, modelin pandas DataFrame'e scikit-learn modeli olarak nasıl uygulanacağını ve modelin Spark DataFrame'e PySpark UDF olarak nasıl uygulanacağını gösterir.
MLflow Model Kayıt Defteri örneği, Model Kayıt Defteri ile model oluşturma, yönetme ve dağıtmayı gösterir. Bu sayfada, çevrimdışı (toplu) tahmin örneklerini tanımlamak için .predict arama yapabilirsiniz.

Azure Databricks işi oluşturma

Toplu iş veya akış tahminlerini iş olarak çalıştırmak için, tahminleri gerçekleştirmek için kullanılan kodu içeren bir not defteri veya JAR oluşturun. Ardından, not defterini veya JAR'ı Azure Databricks işi olarak yürütür. İşler hemen veya bir zamanlamaya göre çalıştırılabilir.

Akış çıkarımı

MLflow Model Kayıt Defteri'nden, MLflow PySpark çıkarımı UDF'sini Delta Live Tablolarıyla tümleştiren bir not defterini otomatik olarak oluşturabilirsiniz.

Oluşturulan çıkarım not defterini Apache Spark Yapılandırılmış Akış API'sini kullanacak şekilde de değiştirebilirsiniz.

Derin öğrenme modelleriyle çıkarım

Azure Databricks'te derin öğrenme modeli çıkarımı hakkında ve örnekleri için aşağıdaki makalelere bakın:

MLlib ve XGBoost4J modelleriyle çıkarım

MLlib ve XGBoost4J modelleriyle ölçeklenebilir model çıkarımı için, çıkarım işlemini doğrudan Spark DataFrame'lerde gerçekleştirmek için yerel transform yöntemleri kullanın. MLlib örnek not defterleri çıkarım adımlarını içerir.

Model çıkarımı özelleştirme ve iyileştirme

Spark DataFrame'lerde çıkarım çalıştırmak için MLflow API'lerini kullandığınızda, modeli Bir Spark UDF olarak yükleyebilir ve dağıtılmış bilgi işlem kullanarak uygun ölçekte uygulayabilirsiniz.

Modelinizi, ön işleme veya son işleme eklemek ve büyük modeller için hesaplama performansını iyileştirmek üzere özelleştirebilirsiniz. Modelleri özelleştirmek için iyi bir seçenek, modeli özel mantıkla sarmalamanıza olanak tanıyan MLflow pyfunc API'dir.

Daha fazla özelleştirme yapmanız gerekiyorsa makine öğrenmesi modelinizi pandas UDF veya pandas Iterator UDF'de el ile sarmalayabilirsiniz. Derin öğrenme örneklerine bakın.

Daha küçük veri kümeleri için, kitaplık tarafından sağlanan yerel model çıkarım yordamlarını da kullanabilirsiniz.

Aracılığıyla paylaş