Sunucusuz SQL havuzuyla verileri analiz etme
Bu öğreticide sunucusuz SQL havuzuyla verileri analiz etmeyi öğreneceksiniz.
Yerleşik sunucusuz SQL havuzu
Sunucusuz SQL havuzları, kapasite ayırmanıza gerek kalmadan SQL'i kullanmanıza olanak tanır. Sunucusuz SQL havuzu için faturalama, sorguyu çalıştırmak için kullanılan düğüm sayısına değil, sorguyu çalıştırmak için işlenen veri miktarına bağlıdır.
Her çalışma alanı Yerleşik adlı önceden yapılandırılmış bir sunucusuz SQL havuzuyla birlikte gelir.
Sunucusuz SQL havuzuyla NYC Taxi verilerini analiz etme
Synapse Studio'da Geliştirme hub'ına gidin
Yeni bir SQL betiği oluşturun.
Aşağıdaki kodu betiğine yapıştırın.
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
Çalıştır'ı seçin.
Veri keşfi yalnızca verilerinizin temel özelliklerini anlayabileceğiniz basitleştirilmiş bir senaryodur. Bu öğreticide veri keşfi ve analizi hakkında daha fazla bilgi edinin.
Veri araştırma veritabanı oluşturma
Dosyaların içeriğine doğrudan veritabanı üzerinden master
göz atabilirsiniz. Bazı basit veri araştırma senaryoları için ayrı bir veritabanı oluşturmanız gerekmez.
Ancak, veri keşfetmeye devam ettikçe, aşağıdakiler gibi bazı yardımcı nesneler oluşturmak isteyebilirsiniz:
- Depolama hesapları için adlandırılmış başvuruları temsil eden dış veri kaynakları.
- Dış veri kaynağında kimlik doğrulamasının nasıl yapılacağını belirtmenizi sağlayan veritabanı kapsamlı kimlik bilgileri.
- Bazı veri kaynaklarına veya veritabanı nesnelerine erişme izinlerine sahip veritabanı kullanıcıları.
- Sorgularda kullanabileceğiniz yardımcı program görünümleri, yordamlar ve işlevler.
Veritabanını kullanarak
master
özel veritabanı nesneleri için ayrı bir veritabanı oluşturun. Özel veritabanı nesneleri, veritabanındamaster
oluşturulamaz.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
Önemli
UTF-8 metninin sütunlara düzgün bir şekilde dönüştürülmesini
VARCHAR
sağlamak için sonekli_UTF8
harmanlama kullanın.Latin1_General_100_BIN2_UTF8
Parquet dosyalarından ve Azure Cosmos DB kapsayıcılarından veri okuyan sorgularda en iyi performansı sağlar. Harmanlamaları değiştirme hakkında daha fazla bilgi için Synapse SQL için desteklenen harmanlama türlerine bakın.Aşağıdaki komutu kullanarak veritabanı bağlamını olarak
master
DataExplorationDB
değiştirin. Geçerli veritabanınızı değiştirmek için kullanıcı arabirimi denetimi kullanım veritabanını da kullanabilirsiniz:USE DataExplorationDB
'den
DataExplorationDB
kimlik bilgileri ve veri kaynakları gibi yardımcı program nesneleri oluşturun.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
Not
Kimlik bilgisi olmadan dış veri kaynağı oluşturulabilir. Kimlik bilgisi yoksa, dış veri kaynağına erişmek için çağıranın kimliği kullanılır.
İsteğe bağlı olarak, içinde dış verilere erişecek bir kullanıcı
DataExplorationDB
için oturum açmak üzere yeni oluşturulanDataExplorationDB
veritabanını kullanın:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
Ardından yukarıdaki oturum açma bilgileri için içinde
DataExplorationDB
bir veritabanı kullanıcısı oluşturun ve bu izni verinADMINISTER DATABASE BULK OPERATIONS
.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
Göreli yolu ve veri kaynağını kullanarak dosyanın içeriğini keşfedin:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
Değişikliklerinizi çalışma alanında yayımlayın.
Veri araştırma veritabanı, yardımcı program nesnelerinizi depolayabileceğiniz basit bir yer tutucudur. Synapse SQL havuzu çok daha fazlasını yapmanızı ve Azure veri kaynaklarının üzerine kurulmuş ilişkisel bir katman olan Mantıksal Data Warehouse oluşturmanızı sağlar. Bu öğreticide mantıksal veri ambarı oluşturma hakkında daha fazla bilgi edinin.
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin