Aracılığıyla paylaş


SQL Server'da PolyBase ile veri sanallaştırma

Şunlar için geçerlidir:SQL ServerAzure Synapse AnalyticsAnaliz Platformu Sistemi (PDW)

PolyBase, SQL Server için veri sanallaştırmayı etkinleştirir.

PolyBase nedir?

PolyBase, SQL Server örneğinizin istemci bağlantı yazılımını ayrı olarak yüklemeden doğrudan SQL Server, Oracle, Teradata, MongoDB, Hadoop kümeleri, Cosmos DB ve S3 uyumlu nesne depolamadan Transact-SQL (T-SQL) ile verileri sorgulamasını sağlar. Üçüncü taraf ODBC sürücülerini kullanarak ek sağlayıcılara bağlanmak için genel ODBC bağlayıcısını da kullanabilirsiniz. PolyBase, T-SQL sorgularının dış kaynaklardan gelen verileri SQL Server örneğindeki ilişkisel tablolara birleştirmesine olanak tanır.

PolyBase ayrıca CSV, Parquet, JSON ve Delta Lake dosyaları gibi yarı yapılandırılmış ve yapılandırılmış dosya tabanlı veri biçimlerini sorgulamayı da destekler. Bu, dosya tabanlı verilerin T-SQL iş akışlarınıza sorunsuz bir şekilde tümleştirilmesini sağlar.

PolyBase özelliğiyle veri sanallaştırma için önemli bir kullanım örneği, verilerin özgün konumunda ve biçiminde kalmasına izin vermektir. DıŞ verileri SQL Server örneği aracılığıyla sanallaştırarak SQL Server'daki diğer tablolarda olduğu gibi sorgulanabilmesini sağlayabilirsiniz. Bu işlem, veri taşıma için ETL işlemleri gereksinimini en aza indirir. Bu veri sanallaştırma senaryosu PolyBase bağlayıcılarının kullanımıyla mümkündür.

Desteklenen SQL ürünleri ve hizmetleri

PolyBase, Microsoft'un aşağıdaki SQL ürünleri için aynı işlevleri sağlar:

SQL Server 2025 PolyBase geliştirmeleri

SQL Server 2025 'e (17.x) yeni eklendi Ayrıntılar
CSV, Parquet ve Delta 1 için yerel destek tr-TR: Dış Veri için PolyBase Sorgu Hizmeti'nin, OPENROWSET, CREATE EXTERNAL TABLE veya CREATE EXTERNAL TABLE AS SELECT ile aşağıdaki dış veri türlerinde kullanılması artık gerekmez: Parquet, Delta, Azure Blob Depolama (ABS), Azure Data Lake Depolama (ADLS) veya S3-Uyumlu Nesne depolama.
Linux'ta genel ODBC veri kaynaklarını kullanma Daha fazla bilgi için bkz. Odbc genel türleriyle dış verilere erişmek için PolyBase'i yapılandırma.
TDS 8.0 desteği PolyBase, SQL Server sürüm 18 ve Encrypt=Yes (Zorunlu) için ODBC Sürücüsü ile varsayılan olarak güvenli bir yapılandırma kullanır. Diğer SQL Server özelliklerinden farklı olarak PolyBase otomatik olarak imzalanan sertifika senaryolarına olanak tanır TrustServerCertificate=True . TDS 8.0 ile TLS 1.3 ve katı şifrelemeyi uygulamak için Encrypt=Strict ve TrustServerCertificate=No ayarlayın. Daha fazla bilgi için bkz. CREATE EXTERNAL DATA SOURCE - CONNECTION_OPTIONS. SQL Server 2025'te Veritabanı Altyapısı özelliklerindeki önemli değişiklikleri gözden geçirin.
Yönetimli Kimlik Yönetilen Kimlik, Azure Arc tarafından etkinleştirilen SQL Server ve Azure VM'lerinde SQL Server 2025 için kullanılabilir.

1 SQL Server 2025'te (17.x), diğer veritabanlarına bağlanmak için Dış Veriler için PolyBase Sorgu Hizmeti hala gereklidir. Örneğin: SQL Server, Oracle, DB2, Teradata, MongoDB veya ODBC.

SQL Server 2022 PolyBase geliştirmeleri

SQL Server 2022 (16.x) sürümünde yeni Ayrıntılar
S3 uyumlu nesne depolama SQL Server 2022 (16.x), S3 REST API'sini kullanarak yeni bağlayıcı, S3 uyumlu nesne depolama alanı ekler. S3 uyumlu nesne depolama alanında veri dosyalarını sorgulamak için hem OPENROWSET hem de CREATE EXTERNAL TABLE kullanabilirsiniz.
PolyBase hizmetlerinden ayrı bazı bağlayıcılar S3 uyumlu nesne depolama bağlayıcısı ADSL 2. Nesil ve Azure Blob Depolama artık PolyBase hizmetlerine bağımlı değildir. Oracle, Teradata, MongoDB ve Genel ODBC ile bağlantıyı desteklemek için PolyBase hizmetlerinin çalışmaya devam etmesi gerekir. PolyBase özelliği SQL Server örneğinizde hala yüklü olmalıdır.
Parquet dosya biçimi PolyBase artık S3 uyumlu nesne depolamada depolanan Parquet dosyalarından verileri sorgulayabildi. Daha fazla bilgi için bkz. PolyBase ile S3 uyumlu bir nesne depolama alanında parquet dosyasını sanallaştırma.
Delta tablo biçimi PolyBase artık S3 uyumlu nesne depolama, Azure Depolama Hesabı V2 ve Azure Data Lake Storage 2. Nesil'de depolanan Delta Tablo formatındaki verileri salt okunur olarak sorgulayabiliyor. Daha fazla bilgi için bkz . PolyBase ile delta tablosunu sanallaştırma
Dış Tabloyu Seç Komutu ile Oluştur (CETAS) PolyBase artık CETAS kullanarak bir dış tablo oluşturabilir ve ardından Transact-SQL SELECT deyiminin sonucunu Paralel olarak Azure Data Lake Storage 2. Nesil, Azure Depolama Hesabı V2 ve S3 uyumlu nesne depolama alanına aktarabilir. Daha fazla bilgi için bkz. CREATE EXTERNAL TABLE AS SELECT (CETAS).

SQL Server 2022'nin (16.x) daha yeni özellikleri için bkz. SQL Server 2022'deki yenilikler.

Tavsiye

SQL Server 2022'deki (16.x) PolyBase özellikleri ve yetenekleri öğreticisi için bkz. SQL Server 2022'de PolyBase'i kullanmaya başlama.

PolyBase bağlayıcıları

PolyBase özelliği aşağıdaki dış veri kaynaklarına bağlantı sağlar:

Dış veri kaynakları PolyBase ile SQL Server 2016-2019 PolyBase ile SQL Server 2022 (16.x) APS Kişisel Savunma Silahı (APS PDW) Azure Synapse Analytics
Oracle, MongoDB, Teradata Okumak Okumak Hayı Hayı
Genel ODBC Okuma (Yalnızca Windows) Okuma (Yalnızca Windows) Hayı Hayı
Azure Depolama Okuma/Yazma Okuma/Yazma Okuma/Yazma Okuma/Yazma
Hadoop Okuma/Yazma Hayı Okuma/Yazma Hayı
SQL Sunucusu Okumak Okumak Hayı Hayı
S3 uyumlu nesne depolama Hayı Okuma/Yazma Hayı Hayı
  • SQL Server 2022 (16.x) ve sonraki sürümleri Hadoop'ı desteklemez.
  • SQL Server 2016 (13.x), Hadoop ve Azure Blob Depolama bağlantıları desteğiyle PolyBase'i kullanıma sunar.
  • SQL Server 2019 (15.x), SQL Server, Oracle, Teradata ve MongoDB gibi daha fazla bağlayıcı kullanıma sunuldu.
  • SQL Server 2022 (16.x), S3 uyumlu depolama bağlayıcısını kullanıma sunar.
  • SQL Server 2019 (15.x) Toplu güncelleştirme 19, Oracle TNS için destek kullanıma sunuldu.
  • SQL Server 2022 (16.x) Toplu güncelleştirme 2' de Oracle TNS desteği sunulmuştur.

Dış bağlayıcılara örnek olarak şunlar verilebilir:

1 PolyBase, SQL Server 2019 aracılığıyla hortonworks Veri Platformu (HDP) ve Cloudera Dağıtılmış Hadoop (CDH) olarak iki Hadoop sağlayıcısını destekler. HDFS Cloudera (CDP) ve Hortonworks (HDP) dış veri kaynakları için SQL Server desteği kullanımdan kaldırılmıştır ve SQL Server 2022 (16.x) ve sonraki sürümlere dahil değildir. Daha fazla bilgi için bkz. Microsoft SQL Server platformunda Büyük veri seçenekleri.

PolyBase'i SQL Server örneğinde kullanmak için:

  1. PolyBase'i Windows'aveya PolyBase'i Linux'a yükleyin.
  2. SQL Server 2019'dan (15.x) başlayarak, gerekirse polyBase'i sp_configure'da etkinleştirin.
  3. Dış veri kaynağı oluşturma.
  4. Dış tablo oluşturma.

Azure tümleştirmesi

PolyBase'in temel yardımıyla, T-SQL sorguları Azure Blob Depolama'dan verileri içeri ve dışarı aktarabilir. Ayrıca PolyBase, Azure Synapse Analytics'in Azure Data Lake Store'dan ve Azure Blob Depolama'dan verileri içeri ve dışarı aktarmasını sağlar.

PolyBase neden kullanılır?

PolyBase, bir SQL Server örneğinden verileri dış verilerle birleştirmenizi sağlar. PolyBase verileri dış veri kaynaklarına birleştirmeye izin vermeden önce şunları yapabilirsiniz:

  • Tüm verilerin tek bir konumda olması için verilerinizin yarısını aktarın.
  • Her iki veri kaynağını da sorgulayın, ardından verileri istemci düzeyinde birleştirmek ve tümleştirmek için özel sorgu mantığı yazın.

PolyBase, verileri birleştirmek için Transact-SQL kullanmanıza olanak tanır.

PolyBase, Hadoop ortamınıza ek yazılım yüklemenizi gerektirmez. Bir veritabanı tablosunu sorgulamak için kullanılan T-SQL söz dizimini kullanarak dış verileri sorgularsınız. PolyBase tarafından uygulanan destek eylemlerinin tümü saydam bir şekilde gerçekleşir. Sorgu yazarının dış kaynak hakkında herhangi bir bilgiye ihtiyacı yoktur.

PolyBase kullanımları

PolyBase, SQL Server'da aşağıdaki senaryoları etkinleştirir:

  • Sorunsuz veri erişimi: T-SQL kullanarak CSV, Parquet ve Delta Lake tabloları gibi diğer RDBM'leri veya dış dosyaları yerel tablolar gibi sorgular.
  • Soğuk verilerin taşınması: Kolay erişilebilir durumda kalmasını sağlama.
  • Gelişmiş üretkenlik: Birden çok kaynaktan gelen verileri tümleştirmek ve analiz etmek için gereken süreyi ve çabayı azaltın.
  • Maliyet verimliliği: Geleneksel veri tümleştirme yöntemleriyle ilişkili veri çoğaltma ve depolama maliyetleri gereksinimini en aza indirin.
  • Gerçek zamanlı içgörüler: Veri taşıma veya eşitlemeden kaynaklanan gecikmeler olmadan gerçek zamanlı veri sorgulamayı ve içgörüleri etkinleştirin.
  • Güvenlik: Ayrıntılı izinler, kimlik bilgileri yönetimi ve denetim için SQL Server güvenlik özelliklerini kullanın.

Gösteri

Dosya sayısı veya sorgulanabilecek veri miktarıyla ilgili sabit bir sınır yoktur. Sorgu performansı, veri miktarına, veri biçimine, verilerin düzenlenip düzenlenm biçimine ve sorguların ve birleştirmelerin karmaşıklığına bağlıdır.

PolyBase için performans yönergeleri ve önerileri hakkında daha fazla bilgi için bkz. SQL Server için PolyBase'de performansla ilgili dikkat edilmesi gerekenler.

SQL Server 2022'ye yükseltme

SQL Server 2022 'den (16.x) başlayarak Hortonworks Veri Platformu (HDP) ve Cloudera Dağıtılmış Hadoop (CDH) artık desteklenmiyor. Bu değişiklikler nedeniyle, SQL Server 2022 (16.x) veya sonraki bir sürümüne geçmeden önce veya Azure Depolama kullanan TYPE = HADOOP önceki SQL Server sürümlerinde oluşturulan PolyBase dış veri kaynaklarını el ile bırakmanız gerekir. Dış veri kaynaklarının bırakılması için veritabanı kapsamlı kimlik bilgileri ve dış tablolar gibi ilişkili veritabanı nesnelerinin de bırakılması gerekir.

Azure Depolama bağlayıcıları aşağıdaki başvuru tablosuna göre değiştirilmelidir:

Dış veri kaynağı Kaynak İçin
Azure Blob Saklama Alanı wasb[s] abs
ADLS 2. Nesil abfs[s] adls

Başlayın

PolyBase'i kullanmadan önce , PolyBase'i Windows'a veyaPolyBase'i Linux'a yüklemeniz ve gerekirse PolyBase'i sp_configure'de etkinleştirmeniz gerekir.

PolyBase özellikleri ve yetenekleri öğreticisi için bkz. SQL Server 2022'de PolyBase'i kullanmaya başlama.

Çeşitli dış veri kaynakları hakkında daha fazla eğitim için şunları inceleyin:

Diğer platformlarda veri sanallaştırma

Veri sanallaştırma özellikleri diğer platformlarda da kullanılabilir: