Aracılığıyla paylaş


Sunucusuz SQL havuzuyla verileri analiz etme

Bu öğreticide sunucusuz SQL havuzuyla verileri analiz etmeyi öğreneceksiniz.

Yerleşik sunucusuz SQL havuzu

Sunucusuz SQL havuzları, kapasite ayırmanıza gerek kalmadan SQL kullanmanıza olanak tanır. Sunucusuz sql havuzu için faturalama, sorguyu çalıştırmak için kullanılan düğüm sayısına değil, sorguyu çalıştırmak için işlenen veri miktarına bağlıdır.

Her çalışma alanı Yerleşik adlı önceden yapılandırılmış sunucusuz SQL havuzuyla birlikte gelir.

Sunucusuz SQL havuzuyla NYC Taxi verilerini analiz etme

Not

Örnek verileri birincil depolama hesabına yerleştirdiğinizden emin olun

  1. Synapse Studio'da Geliştirme hub'ına gidin

  2. Yeni bir SQL betiği oluşturun.

  3. Betiğe aşağıdaki kodu yapıştırın. (Depolama hesabınızın adını contosolake ve kapsayıcınızın adını users ile güncelleştirin.)

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Çalıştır seçin.

Veri keşfi yalnızca verilerinizin temel özelliklerini anlayabileceğiniz basitleştirilmiş bir senaryodur. Bu öğreticide veri keşfi ve analizi hakkında daha fazla bilgi edinin.

Veri araştırma veritabanı oluşturma

Dosyaların içeriğine doğrudan veritabanı üzerinden master göz atabilirsiniz. Bazı basit veri araştırma senaryoları için ayrı bir veritabanı oluşturmanız gerekmez. Ancak, veri keşfetmeye devam ettikçe aşağıdakiler gibi bazı yardımcı program nesneleri oluşturmak isteyebilirsiniz:

  • Depolama hesapları için isimlendirilmiş referansları temsil eden dış veri kaynakları.
  • Dış veri kaynağında kimlik doğrulamasının nasıl yapılacağını belirtmenizi sağlayan veritabanı kapsamlı kimlik bilgileri.
  • Bazı veri kaynaklarına veya veritabanı nesnelerine erişme izinlerine sahip veritabanı kullanıcıları.
  • Sorgularda kullanabileceğiniz yardımcı program görünümleri, yordamlar ve işlevler.

Tip

Synapse Studio'da yeni bir SQL betiği açtığınızda, üst araç çubuğundaki veritabanı açılan menüsünden master'ı seçebilirsiniz. Bu, sunucusuz SQL havuzları için görüntülenen varsayılan sistem veritabanıdır.

  1. master Özel veritabanı nesneleri için ayrı bir veritabanı oluşturmak için veritabanını kullanın. Özel veritabanı nesneleri veritabanında master oluşturulamaz.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Önemli

    UTF-8 metninin _UTF8 sütunlarına doğru şekilde dönüştürülmesini sağlamak için VARCHAR sonek ile sıralama kullanın. Latin1_General_100_BIN2_UTF8 Parquet dosyalarından ve Azure Cosmos DB kapsayıcılarından veri okuyan sorgularda en iyi performansı sağlar. Harmanlamaları değiştirme hakkında daha fazla bilgi için Synapse SQL için desteklenen harmanlama türleri başlıklı sayfaya bakın.

  2. Aşağıdaki komutu kullanarak veritabanı bağlamını master'den DataExplorationDB'e değiştirin. Geçerli veritabanınızı değiştirmek için use database UI denetimini de kullanabilirsiniz:

    USE DataExplorationDB
    
  3. kimlik bilgileri ve veri kaynakları gibi yardımcı nesneler oluşturun.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Not

    Bir dış veri kaynağı kimlik bilgisi olmadan oluşturulabilir. Bir kimlik bilgisi yoksa, çağıranın kimliği dış veri kaynağına erişmek için kullanılır.

  4. İsteğe bağlı olarak, içinde dış verilere erişecek bir kullanıcı DataExplorationDB için oturum açmak üzere yeni oluşturulan DataExplorationDB veritabanını kullanın:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Ardından yukarıdaki oturum açma için DataExplorationDB içinde bir veritabanı kullanıcısı oluşturun ve ADMINISTER DATABASE BULK OPERATIONS iznini verin.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. Göreli yolu ve veri kaynağını kullanarak dosyanın içeriğini keşfedin:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. Değişikliklerinizi çalışma alanında yayımlayın .

Veri araştırma veritabanı, yardımcı program nesnelerinizi depolayabileceğiniz basit bir yer tutucudur. Synapse SQL havuzu çok daha fazlasını yapmanızı ve Azure veri kaynaklarının üzerine kurulmuş ilişkisel bir katman olan Mantıksal Veri Ambarı oluşturmanıza olanak tanır. Bu öğreticide mantıksal veri ambarı oluşturma hakkında daha fazla bilgi edinin.

Sonraki adımlar