Aracılığıyla paylaş


SQL Server'da PolyBase ile veri sanallaştırma

Şunlar için geçerlidir: SQL Server Not supported.Not supported. Azure Synapse Analytics Analytics Platform Sistemi(PDW)

PolyBase, SQL Server için bir veri sanallaştırma özelliğidir.

PolyBase nedir?

PolyBase, SQL Server örneğinizin istemci bağlantı yazılımını ayrı olarak yüklemeden doğrudan SQL Server, Oracle, Teradata, MongoDB, Hadoop kümeleri, Cosmos DB ve S3 uyumlu nesne depolamadan T-SQL ile veri sorgulamasına olanak tanır. Üçüncü taraf ODBC sürücülerini kullanarak ek sağlayıcılara bağlanmak için genel ODBC bağlayıcısını da kullanabilirsiniz. PolyBase, T-SQL sorgularının dış kaynaklardan gelen verileri SQL Server örneğindeki ilişkisel tablolara birleştirmesine olanak tanır.

PolyBase özelliğiyle veri sanallaştırma için önemli bir kullanım örneği, verilerin özgün konumunda ve biçiminde kalmasına izin vermektir. DıŞ verileri SQL Server örneği aracılığıyla sanallaştırarak SQL Server'daki diğer tablolarda olduğu gibi sorgulanabilmesini sağlayabilirsiniz. Bu işlem, veri taşıma için ETL işlemleri gereksinimini en aza indirir. Bu veri sanallaştırma senaryosu PolyBase bağlayıcılarının kullanımıyla mümkündür.

Desteklenen SQL ürünleri ve hizmetleri

PolyBase, Microsoft'un aşağıdaki SQL ürünleri için aynı işlevleri sağlar:

  • SQL Server 2016 (13.x) ve sonraki sürümleri (Windows)
  • SQL Server 2019 (15.x) ve sonraki sürümleri (Windows ve Linux)
  • SQL Server Analytics Platform Sistemi (PDW)
  • Azure Synapse Analytics (ayrılmış SQL havuzları için)

Uyarı

Veri sanallaştırması, Azure Data Lake Storage (ADLS) Gen2 ve Azure Blob Depolama'daki dosyalarda depolanan dış verileri sorgulamak kapsamında Azure SQL Yönetilen Örneği için de kullanılabilir. Daha fazla bilgi için bkz. Azure SQL Yönetilen Örneği ile veri sanallaştırma.

SQL Server 2025 PolyBase geliştirmeleri

SQL Server 2025 (17.x) Yenilikler Önizlemesi Ayrıntılar
CSV, Parquet ve Delta 1 için yerel destek Aşağıdaki dış veri türleriyle OPENROWSET, CREATE EXTERNAL TABLE veya CREATE EXTERNAL TABLE AS SELECT kullanmak için Dış Veriler için PolyBase Sorgu Hizmeti'ni yüklemeniz gerekmez: Parquet, Delta, Azure Blob Depolama (ABS), Azure Data Lake Storage (ADLS) veya S3-Compatible Nesne depolama.
Linux'ta genel ODBC veri kaynaklarını kullanma Daha fazla bilgi için bkz. Odbc genel türleriyle dış verilere erişmek için PolyBase'i yapılandırma.

1 SQL Server 2025 (17.x) Önizleme sürümünde, diğer veritabanlarına bağlanmak için Dış Veriler için PolyBase Sorgu Hizmeti hala gereklidir. Örneğin: SQL Server, Oracle, DB2, Teradata, MongoDB veya ODBC.

SQL Server 2022 PolyBase geliştirmeleri

SQL Server 2022 (16.x) sürümünde yeni Ayrıntılar
S3 uyumlu nesne depolama SQL Server 2022 (16.x), S3 REST API'sini kullanarak yeni bağlayıcı, S3 uyumlu nesne depolama alanı ekler. S3 uyumlu nesne depolama alanında veri dosyalarını sorgulamak için hem OPENROWSET hem de CREATE EXTERNAL TABLE kullanabilirsiniz.
PolyBase hizmetlerinden ayrı bazı bağlayıcılar S3 uyumlu nesne depolama bağlayıcısı ADSL 2. Nesil ve Azure Blob Depolama artık PolyBase hizmetlerine bağımlı değildir. Oracle, Teradata, MongoDB ve Genel ODBC ile bağlantıyı desteklemek için PolyBase hizmetlerinin çalışmaya devam etmesi gerekir. PolyBase özelliği SQL Server örneğinizde hala yüklü olmalıdır.
Parquet dosya biçimi PolyBase artık S3 uyumlu nesne depolamada depolanan Parquet dosyalarından verileri sorgulayabildi. Daha fazla bilgi için bkz. PolyBase ile S3 uyumlu bir nesne depolama alanında parquet dosyasını sanallaştırma.
Delta tablo biçimi PolyBase artık S3 uyumlu nesne depolama, Azure Depolama Hesabı V2 ve Azure Data Lake Storage 2. Nesil'de depolanan Delta Tablo formatındaki verileri salt okunur olarak sorgulayabiliyor. Daha fazla bilgi için bkz . PolyBase ile delta tablosunu sanallaştırma
Dış Tabloyu Seç Komutu ile Oluştur (CETAS) PolyBase artık CETAS kullanarak dış tablo oluşturabilir ve ardından Transact-SQL SELECT deyiminin sonucunu Azure Data Lake Storage 2. Nesil, Azure Depolama Hesabı V2 ve S3 uyumlu nesne depolama alanına dışarı aktarabilir. Daha fazla bilgi için bkz. CREATE EXTERNAL TABLE AS SELECT (CETAS).

SQL Server 2022'nin (16.x) diğer yeni özellikleri için bkz. SQL Server 2022'deki yenilikler

Tavsiye

SQL Server 2022'deki (16.x) PolyBase özellikleri ve yetenekleri öğreticisi için bkz. SQL Server 2022'de PolyBase'i kullanmaya başlama.

PolyBase bağlayıcıları

PolyBase özelliği aşağıdaki dış veri kaynaklarına bağlantı sağlar:

Dış veri kaynakları PolyBase ile SQL Server 2016-2019 PolyBase ile SQL Server 2022 (16.x) APS PDW Azure Synapse Analytics
Oracle, MongoDB, Teradata Okumak Okumak Hayı Hayı
Genel ODBC Okuma (Yalnızca Windows) Okuma (Yalnızca Windows) Hayı Hayı
Azure Depolama Okuma/Yazma Okuma/Yazma Okuma/Yazma Okuma/Yazma
Hadoop Okuma/Yazma Hayı Okuma/Yazma Hayı
SQL Sunucusu Okumak Okumak Hayı Hayı
S3 uyumlu nesne depolama Hayı Okuma/Yazma Hayı Hayı
  • SQL Server 2022 (16.x), Hadoop'ı desteklemez.
  • SQL Server 2016 (13.x), Hadoop ve Azure Blob Depolama bağlantıları desteğiyle PolyBase'i kullanıma sunar.
  • SQL Server 2019 (15.x), SQL Server, Oracle, Teradata ve MongoDB gibi daha fazla bağlayıcı kullanıma sunuldu.
  • SQL Server 2022 (16.x), S3 uyumlu depolama bağlayıcısını kullanıma sunar.
  • SQL Server 2019 (15.x) Toplu güncelleştirme 19, Oracle TNS için destek kullanıma sunuldu.
  • SQL Server 2022 (16.x) Toplu güncelleştirme 2' de Oracle TNS desteği sunulmuştur.

Dış bağlayıcılara örnek olarak şunlar verilebilir:

* PolyBase, SQL Server 2019 aracılığıyla Hortonworks Veri Platformu (HDP) ve Cloudera Dağıtılmış Hadoop (CDH) olarak iki Hadoop sağlayıcısını destekler. HDFS Cloudera (CDP) ve Hortonworks (HDP) dış veri kaynakları için SQL Server desteği kullanımdan kaldırılmıştır ve SQL Server 2022 (16.x) ve sonraki sürümlerde yer almamıştır. Daha fazla bilgi için bkz. Microsoft SQL Server platformunda Büyük veri seçenekleri.

PolyBase'i SQL Server örneğinde kullanmak için:

  1. PolyBase'i Windows'aveya PolyBase'i Linux'a yükleyin.
  2. SQL Server 2019'dan (15.x) başlayarak, gerekirse polyBase'i sp_configure'da etkinleştirin.
  3. Dış veri kaynağı oluşturma.
  4. Dış tablo oluşturma.

Azure tümleştirmesi

PolyBase'in temel yardımıyla, T-SQL sorguları Azure Blob Depolama'dan verileri içeri ve dışarı aktarabilir. Ayrıca PolyBase, Azure Synapse Analytics'in Azure Data Lake Store'dan ve Azure Blob Depolama'dan verileri içeri ve dışarı aktarmasını sağlar.

PolyBase neden kullanılır?

PolyBase, bir SQL Server örneğinden verileri dış verilerle birleştirmenizi sağlar. PolyBase verileri dış veri kaynaklarına birleştirmeye izin vermeden önce şunları yapabilirsiniz:

  • Tüm verilerin tek bir konumda olması için verilerinizin yarısını aktarın.
  • Her iki veri kaynağını da sorgulayın, ardından verileri istemci düzeyinde birleştirmek ve tümleştirmek için özel sorgu mantığı yazın.

PolyBase, verileri birleştirmek için Transact-SQL kullanmanıza olanak tanır.

PolyBase, Hadoop ortamınıza ek yazılım yüklemenizi gerektirmez. Bir veritabanı tablosunu sorgulamak için kullanılan T-SQL söz dizimini kullanarak dış verileri sorgularsınız. PolyBase tarafından uygulanan destek eylemlerinin tümü saydam bir şekilde gerçekleşir. Sorgu yazarının dış kaynak hakkında herhangi bir bilgiye ihtiyacı yoktur.

PolyBase kullanımları

PolyBase, SQL Server'da aşağıdaki senaryoları etkinleştirir:

  • Azure Blob Depolama'da depolanan verileri sorgulama. Azure Blob Depolama, Azure hizmetleri tarafından kullanılmak üzere verileri depolamak için uygun bir yerdir. PolyBase, T-SQL kullanarak verilere erişmeyi kolaylaştırır.

  • Sql Server örneğinden veya PDW'den Hadoop'ta depolanan verileri sorgulama. Kullanıcılar verileri Hadoop gibi uygun maliyetli dağıtılmış ve ölçeklenebilir sistemlerde depoluyor. PolyBase, T-SQL kullanarak verileri sorgulamayı kolaylaştırır.

  • Hadoop, Azure Blob Depolama veya Azure Data Lake Store'dan verileri içeri aktarma. Hadoop, Azure Blob Depolama veya Azure Data Lake Store'dan verileri ilişkisel tablolara aktararak Microsoft SQL'in columnstore teknolojisinin ve analiz özelliklerinin hızını kullanın. Ayrı bir ETL veya içeri aktarma aracı gerekmez.

  • Verileri Hadoop, Azure Blob Depolama veya Azure Data Lake Store'a aktarın. Uygun maliyetli depolama alanı elde etmek ve kolay erişim için çevrimiçi tutmak için verileri Hadoop, Azure Blob Depolama veya Azure Data Lake Store'a arşivleyin.

  • BI araçlarıyla tümleştirme. PolyBase'i Microsoft'un iş zekası ve analiz yığınıyla kullanın veya SQL Server ile uyumlu üçüncü taraf araçları kullanın.

Gösteri

Dosya sayısı veya sorgulanabilecek veri miktarıyla ilgili sabit bir sınır yoktur. Sorgu performansı, veri miktarına, veri biçimine, verilerin düzenlenip düzenlenm biçimine ve sorguların ve birleştirmelerin karmaşıklığına bağlıdır.

PolyBase için performans yönergeleri ve önerileri hakkında daha fazla bilgi için bkz. SQL Server için PolyBase'de performansla ilgili dikkat edilmesi gerekenler.

SQL Server 2022'ye yükseltme

SQL Server 2022 'den (16.x) başlayarak Hortonworks Veri Platformu (HDP) ve Cloudera Dağıtılmış Hadoop (CDH) artık desteklenmiyor. Bu değişiklikler nedeniyle, SQL Server 2022'ye (16.x) geçmeden önce veya Azure Depolama kullanan TYPE = HADOOP SQL Server'ın önceki sürümlerinde oluşturulan PolyBase dış veri kaynaklarını el ile bırakmanız gerekir. Dış veri kaynaklarının bırakılması için veritabanı kapsamlı kimlik bilgileri ve dış tablolar gibi ilişkili veritabanı nesnelerinin de bırakılması gerekir.

Azure Depolama bağlayıcıları aşağıdaki başvuru tablosuna göre değiştirilmelidir:

Dış veri kaynağı Kaynak İçin
Azure Blob Depolama Alanı wasb[s] Karın kasları
ADLS 2. Nesil abfs[s] adls

Başlayın

PolyBase'i kullanmadan önce , PolyBase'i Windows'a veyaPolyBase'i Linux'a yüklemeniz ve gerekirse PolyBase'i sp_configure'de etkinleştirmeniz gerekir.

PolyBase özellikleri ve yetenekleri öğreticisi için bkz. SQL Server 2022'de PolyBase'i kullanmaya başlama.

Çeşitli dış veri kaynakları hakkında daha fazla eğitim için şunları inceleyin:

Diğer platformlarda veri sanallaştırma

Veri sanallaştırma özellikleri diğer platformlarda da kullanılabilir: