Aracılığıyla paylaş


Python eğitimi: SQL makine öğrenmesi ile k-means kümeleme kullanarak müşterileri kategorilere ayırma

Şunlar için geçerlidir: SQL Server 2017 (14.x) ve sonraki sürümleri Azure SQL Yönetimli Örnek

Bu dört bölümden oluşan öğretici serisinde, müşteri verilerini kategorilere ayırmak için SQL Server Machine Learning Services'te veya Büyük Veri Kümelerinde bir K-Means kümeleme modeli geliştirmek ve dağıtmak için Python'ı kullanın.

Bu dört bölümden oluşan öğretici serisinde Python kullanarak SQL Server Machine Learning Services'da müşteri verilerini kümeleme amacıyla bir K-Means kümeleme modeli geliştirin ve dağıtın.

Bu dört bölümden oluşan öğretici serisinde Python kullanarak Azure SQL Yönetilen Örneği Machine Learning Services'da müşteri verilerini kümeleme amacıyla bir K-Means kümeleme modeli geliştirin ve dağıtın.

Bu serinin birinci bölümünde, öğreticinin önkoşullarını ayarlayın ve ardından örnek veri kümesini bir veritabanına geri yükleyin. Bu serinin ilerleyen bölümlerinde, SQL makine öğrenmesi ile Python'da bir kümeleme modeli eğitmek ve dağıtmak için bu verileri kullanın.

Bu serinin ikinci ve üçüncü bölümlerinde, verilerinizi analiz edip hazırlamak ve bir makine öğrenmesi modeli eğitmek için Azure Data Studio not defterinde bazı Python betikleri geliştirin. Ardından, dördüncü bölümde, saklı yordamları kullanarak bu Python betiklerini bir veritabanında çalıştırın.

Kümeleme , verileri bir grubun üyelerinin bir şekilde benzer olduğu gruplar halinde düzenlemek olarak açıklanabilir. Bu öğretici serisi için bir perakende işletmeniz olduğunu düşünün. Bir ürün satın alma ve iade veri kümesindeki müşterilerin kümelemini gerçekleştirmek için K-Means algoritmasını kullanın. Müşterileri kümeleyerek, belirli grupları hedefleyerek pazarlama çalışmalarınızı daha etkili bir şekilde odaklayabilirsiniz. K-Ortalamalar kümelemesi, benzerliklere göre verilerdeki desenleri arayabilen denetimsiz bir öğrenme algoritmasıdır.

Bu makalede şunların nasıl yapıldığını öğrenin:

  • Örnek veritabanını geri yükleme

İkinci bölümde, kümeleme gerçekleştirmek için veritabanındaki verileri hazırlamayı öğrenin.

Üçüncü bölümde Python'da K-Means kümeleme modeli oluşturmayı ve eğitmeyi öğrenin.

Dördüncü bölümde, yeni verilere göre Python'da kümeleme gerçekleştirebilen bir veritabanında saklı yordam oluşturmayı öğrenin.

Önkoşullar

  • Azure Data Studio. Hem Python hem de SQL için Azure Data Studio'da bir not defteri kullanın. Not defterleri hakkında daha fazla bilgi için bkz. Azure Data Studio'da not defterlerini kullanma.

  • Ek Python paketleri - Bu öğretici serisindeki örneklerde, yüklemiş olabileceğiniz veya yüklememiş olabileceğiniz Python paketleri kullanılır.

    Bir Yönetim Komut İstemi açın ve Azure Data Studio'da kullandığınız Python sürümünün yükleme yoluna geçin. Örneğin, cd %LocalAppData%\Programs\Python\Python37-32. Ardından, henüz yüklü olmayan bu paketlerden herhangi birini yüklemek için aşağıdaki komutları çalıştırın. Bu paketlerin doğru Python yükleme konumuna yüklendiğinden emin olun. Hedef dizini belirtmek için seçeneğini -t kullanabilirsiniz.

    pip install matplotlib
    pip install pandas
    pip install pyodbc
    pip install scipy
    pip install scikit-learn
    

Aşağıdaki icacls komutlarını çalıştırarak READ ve EXECUTE erişimini, SQL Server Launchpad Service ve SID S-1-15-2-1 (ALL_APPLICATION_PACKAGES) için yüklü kitaplıklara verin.

  icacls "C:\Program Files\Python310\Lib\site-packages" /grant "NT Service\MSSQLLAUNCHPAD":(OI)(CI)RX /T
  icacls "C:\Program Files\Python310\Lib\site-packages" /grant *S-1-15-2-1:(OI)(CI)RX /T

Örnek veritabanını geri yükleme

Bu öğreticide kullanılan örnek veri kümesi, indirip kullanabilmeniz için bir .bak veritabanı yedekleme dosyasına kaydedildi. Bu veri kümesi, İşlem İşleme Performans Konseyi (TPC) tarafından sağlanan tpcx-bb veri kümesinden türetilir.

Uyarı

Büyük Veri Kümelerinde Machine Learning Services kullanıyorsanız bkz. Veritabanını SQL Server büyük veri kümesi ana örneğine geri yükleme.

  1. tpcxbb_1gb.bak dosyasını indirin.

  2. Aşağıdaki ayrıntıları kullanarak Azure Data Studio'da bir veritabanını yedekleme dosyasından geri yükleme bölümünde yer alan yönergeleri izleyin:

    • İndirdiğiniz tpcxbb_1gb.bak dosyasını içe aktarın.
    • Hedef veritabanını olarak adlandırın tpcxbb_1gb.
  3. Veritabanını geri yükledikten sonra tabloyu sorgulayarak veri kümesinin dbo.customer var olduğunu doğrulayabilirsiniz:

    USE tpcxbb_1gb;
    SELECT * FROM [dbo].[customer];
    
  1. tpcxbb_1gb.bak dosyasını indirin.

  2. Şu ayrıntıları kullanarak SQL Server Management Studio'da veritabanını SQL Yönetilen Örneğine geri yükleme bölümünde yer alan yönergeleri izleyin:

    • İndirdiğiniz tpcxbb_1gb.bak dosyasını içe aktarın.
    • Hedef veritabanını olarak adlandırın tpcxbb_1gb.
  3. Veritabanını geri yükledikten sonra tabloyu sorgulayarak veri kümesinin dbo.customer var olduğunu doğrulayabilirsiniz:

    USE tpcxbb_1gb;
    SELECT * FROM [dbo].[customer];
    

Kaynakları temizle

Bu öğreticiye devam etmeyecekseniz tpcxbb_1gb veritabanını silin.

Sonraki adım

Bu öğretici serisinin birinci bölümünde şu adımları tamamladınız:

  • Örnek veritabanını geri yükleme

Makine öğrenmesi modeline yönelik verileri hazırlamak için bu öğretici serisinin ikinci bölümünü izleyin: