Öğretici: Ayrılmış SQL havuzları için makine öğrenmesi modeli puanlama sihirbazı
Tahmine dayalı makine öğrenmesi modelleriyle ayrılmış SQL havuzlarındaki verilerinizi kolayca zenginleştirmeyi öğrenin. Veri bilimcilerinizin oluşturduğu modeller artık tahmine dayalı analiz için veri uzmanları tarafından kolayca erişilebilir. Azure Synapse Analytics'teki bir veri uzmanı, Azure Synapse SQL havuzlarında dağıtım için Azure Machine Learning model kayıt defterinden bir model seçebilir ve verileri zenginleştirmek için tahminleri başlatabilir.
Bu öğreticide aşağıdakilerin nasıl yapılacağını öğreneceksiniz:
- Tahmine dayalı bir makine öğrenmesi modeli eğitin ve modeli Azure Machine Learning modeli kayıt defterine kaydedin.
- Ayrılmış bir SQL havuzunda tahminleri başlatmak için SQL puanlama sihirbazını kullanın.
Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.
Önkoşullar
- Azure Synapse Analytics çalışma alanında varsayılan depolama alanı olarak yapılandırılmış bir Azure Data Lake Storage 2. Nesil depolama hesabı. Birlikte çalıştığınız Data Lake Storage 2. Nesil dosya sisteminin Depolama Blob Verileri Katkıda Bulunanı olmanız gerekir.
- Azure Synapse Analytics çalışma alanınızda ayrılmış SQL havuzu. Ayrıntılar için bkz. Ayrılmış SQL havuzu oluşturma.
- Azure Synapse Analytics çalışma alanınızda Azure Machine Learning bağlı hizmeti. Ayrıntılar için bkz. Azure Synapse'de Azure Machine Learning bağlı hizmeti oluşturma.
Azure portalında oturum açın
Azure Portal’ında oturum açın.
Azure Machine Learning'de model eğitin
Başlamadan önce sklearn sürümünüzün 0.20.3 olduğunu doğrulayın.
Not defterindeki tüm hücreleri çalıştırmadan önce işlem örneğinin çalıştığını denetleyin.
Azure Machine Learning çalışma alanınıza gidin.
Predict NYC Taxi Tips.ipynb dosyasını indirin.
Azure Machine Learning Studio'da Azure Machine Learning çalışma alanını açın.
Not Defterleri>Dosyaları karşıya yükleme'ye gidin. Ardından indirdiğiniz PREDICT NYC Taxi Tips.ipynb dosyasını seçip karşıya yükleyin.
Not defteri karşıya yüklenip açıldıktan sonra Tüm hücreleri çalıştır'ı seçin.
Hücrelerden biri başarısız olabilir ve Azure'da kimlik doğrulaması yapmanız istenebilir. Hücre çıkışlarında bunu izleyin ve bağlantıyı izleyip kodu girerek tarayıcınızda kimlik doğrulaması yapın. Ardından not defterini yeniden çalıştırın.
Not defteri bir ONNX modelini eğitecek ve MLflow'a kaydedecektir. Yeni modelin düzgün kaydedildiğini denetlemek için Modeller'e gidin.
Not defterini çalıştırmak, test verilerini bir CSV dosyasına da aktarır. CSV dosyasını yerel sisteminize indirin. Daha sonra CSV dosyasını ayrılmış bir SQL havuzuna aktaracak ve modeli test etmek için verileri kullanacaksınız.
CSV dosyası, not defteri dosyanızla aynı klasörde oluşturulur. Dosya Gezgini hemen görmüyorsanız Yenile'yi seçin.
SQL puanlama sihirbazıyla tahminleri başlatma
Synapse Studio ile Azure Synapse çalışma alanını açın.
Veri>Bağlantılı>Depolama Hesapları'na gidin. Varsayılan depolama hesabına yükleyin
test_data.csv
.SQL betiklerigeliştirme> bölümüne gidin. Ayrılmış SQL havuzunuza yüklemek
test_data.csv
için yeni bir SQL betiği oluşturun.Not
Çalıştırmadan önce bu betikteki dosya URL'sini güncelleştirin.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Veri>Çalışma Alanı'na gidin. Ayrılmış SQL havuzu tablosuna sağ tıklayarak SQL puanlama sihirbazını açın. Modelle Makine Öğrenmesi>Tahmini'ne tıklayın.
Not
Azure Machine Learning için oluşturulmuş bağlı bir hizmetiniz olmadığı sürece makine öğrenmesi seçeneği görünmez. (Bu öğreticinin başındaki Önkoşullar bölümüne bakın.)
Açılan kutudan bağlantılı bir Azure Machine Learning çalışma alanı seçin. Bu adım, seçilen Azure Machine Learning çalışma alanının model kayıt defterinden makine öğrenmesi modellerinin listesini yükler. Şu anda yalnızca ONNX modelleri desteklenmektedir, bu nedenle bu adım yalnızca ONNX modellerini görüntüler.
Yeni eğitilen modeli seçin ve ardından Devam'ı seçin.
Tablo sütunlarını model girişleriyle eşleyin ve model çıkışlarını belirtin. Model MLflow biçiminde kaydedilirse ve model imzası doldurulursa eşleme, adların benzerliğine dayalı bir mantık kullanılarak sizin için otomatik olarak gerçekleştirilir. Arabirim ayrıca el ile eşlemeyi de destekler.
Devam’ı seçin.
Oluşturulan T-SQL kodu saklı bir yordam içinde sarmalanır. Bu nedenle saklı yordam adı sağlamanız gerekir. Meta veriler (sürüm, açıklama ve diğer bilgiler) dahil olmak üzere model ikili dosyası Azure Machine Learning'den ayrılmış bir SQL havuzu tablosuna fiziksel olarak kopyalanır. Bu nedenle modelin kaydedildiği tabloyu belirtmeniz gerekir.
Varolan tablo'yu veya Yeni oluştur'u seçebilirsiniz. İşiniz bittiğinde Modeli dağıt + betiği aç'ı seçerek modeli dağıtın ve bir T-SQL tahmin betiği oluşturun.
Betik oluşturulduktan sonra puanlama işlemini yürütmek ve tahminleri almak için Çalıştır'ı seçin.