Tanya jawab umum di PolyBase

Berlaku untuk: SQL Server 2016 (13.x) dan versi yang lebih baru

PolyBase vs. server tertaut

Tabel berikut menyoroti perbedaan antara PolyBase dan fitur server tertaut:

PolyBase Server Tertaut
Objek cakupan database Objek terlingkup instans
Menggunakan driver ODBC Menggunakan penyedia OLEDB
Mendukung operasi baca-saja untuk semua sumber data dan menulis ke beberapa sumber data eksternal Mendukung operasi baca dan tulis
Kueri ke sumber data jarak jauh dari satu koneksi dapat diskalakan Kueri ke sumber data jarak jauh dari satu koneksi tidak dapat diskalakan
Pendorongan predikat didukung Pendorongan predikat didukung
Tidak diperlukan konfigurasi terpisah untuk grup ketersediaan Konfigurasi terpisah yang diperlukan untuk setiap instans dalam grup ketersediaan
Autentikasi dasar saja Autentikasi dasar & terintegrasi
Cocok untuk kueri analitik yang memproses sejumlah besar baris Cocok untuk kueri OLTP yang mengembalikan satu atau beberapa baris
Kueri menggunakan tabel eksternal tidak dapat berpartisipasi dalam transaksi terdistribusi Kueri terdistribusi dapat berpartisipasi dalam transaksi terdistribusi

Apa yang baru dalam PolyBase di SQL Server 2022?

SQL Server 2022 (16.x) sekarang mendukung file CSV, Parquet, dan Delta yang disimpan di Akun Azure Storage v2, Azure Data Lake Storage Gen2, atau penyimpanan objek yang kompatibel dengan S3 menggunakan S3 REST API, lokal, atau di cloud.

SQL Server 2022 (16.x) sekarang dapat menggunakan CREATE EXTERNAL TABLE sebagai SELECT (CETAS), bersama dengan perintah seperti OPENROWSET, CREATE EXTERNAL TABLE (CET), dan semua penyempurnaan T-SQL baru.

Saat ini, dukungan untuk sumber data eksternal Hadoop telah dihapus di SQL Server 2022 (16.x).

Pembaruan kumulatif SQL Server 2022 (16.x) 2 sekarang memperkenalkan dukungan untuk file Oracle TNS. Silakan merujuk ke CREATE EXTERNAL DATA SOURCE untuk informasi dan sampel lebih lanjut.

Baca selengkapnya tentang Virtualisasi Data dengan PolyBase untuk SQL Server 2022 dan tinjau penyempurnaan PolyBase SQL Server 2022.

Apa yang baru dalam PolyBase di SQL Server 2019?

PolyBase di SQL Server 2019 (15.x) sekarang dapat membaca data dari berbagai sumber data yang lebih besar. Data dari sumber data eksternal ini dapat disimpan sebagai tabel eksternal di SQL Server Anda. PolyBase juga mendukung komputasi pushdown ke sumber data eksternal ini, tidak termasuk jenis generik ODBC.

Sumber Data yang Kompatibel

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Jenis generik ODBC yang kompatibel

Pembaruan kumulatif SQL Server 2019 (15.x) 19 sekarang memperkenalkan dukungan untuk file Oracle TNS. Silakan merujuk ke CREATE EXTERNAL DATA SOURCE untuk informasi dan sampel lebih lanjut.

Catatan

PolyBase dapat memungkinkan koneksi ke sumber data eksternal menggunakan driver ODBC pihak ketiga. Driver ini tidak disediakan bersama dengan PolyBase dan mungkin tidak berfungsi seperti yang dimaksudkan. Untuk informasi selengkapnya, lihat Mengonfigurasi PolyBase untuk mengakses data eksternal dengan jenis generik ODBC.

Apa CONNECTION_OPTIONS yang dapat saya tentukan untuk koneksi ke sumber data pihak ketiga?

Tinjau CONNECTION_OPTIONS CREATE EXTERNAL DATA SOURCE (Transact-SQL) untuk opsi koneksi penyedia data yang didukung untuk SQL Server, Oracle, Teradata, API MongoDB untuk Cosmos DB, dan penyedia data ODBC generik.

Bagaimana cara menampilkan rencana eksekusi kueri jarak jauh komputasi pushdown PolyBase?

Ini dimungkinkan melalui beberapa metode tergantung pada versi SQL Server. Lihat Pemecahan Masalah PolyBase - Untuk menampilkan rencana kueri PolyBase.

Bagaimana cara mengetahui apakah komputasi pushdown PolyBase terjadi?

Apakah PolyBase didukung di Azure SQL Database?

Tidak, tetapi Anda dapat mengkueri data dalam file yang ditempatkan di Azure Blob Storage menggunakan fungsi OPENROWSET, atau menggunakan CREATE EXTERNAL TABLE untuk membaca dari kumpulan SQL tanpa server di Synapse Analytics. Untuk informasi selengkapnya, lihat Azure SQL dapat membaca file penyimpanan Azure Data Lake menggunakan tabel eksternal Synapse SQL.

Apakah PolyBase didukung di Azure SQL Managed Instance?

Azure SQL Managed Instance memiliki kemampuan virtualisasi data sendiri untuk Azure Data Lake Storage (ADLS) dan Azure Blob Storage sebagai sumber data. Untuk informasi selengkapnya, lihat Virtualisasi data dengan Azure SQL Managed Instance.

Port mana yang harus saya izinkan melalui firewall saya untuk PolyBase?

Tidak ada port tambahan yang diperlukan untuk membuka polyBase itu sendiri, kecuali dalam kasus grup peluasan skala PolyBase. Tanpa grup peluasan skala, layanan PolyBase saja tidak boleh memerlukan aturan firewall apa pun.

Di server Windows, PolyBase akan memanfaatkan port yang digunakan oleh SQL Server di bagian IPAll dari pengaturan TCP/IP di Pengelola Konfigurasi SQL Server. Untuk informasi selengkapnya, lihat Properti TCP/IP. Di server Linux, PolyBase akan memanfaatkan pengaturan network.tcpport . Untuk informasi selengkapnya, lihat Port TCP.

Untuk grup peluasan skala PolyBase melalui beberapa server Windows, lihat informasi port di pertanyaan berikutnya.

Namun, Anda harus mengizinkan port lain untuk komunikasi ke berbagai sumber data eksternal yang digunakan oleh PolyBase. Lihat konfigurasi ODBC, konfigurasi sumber daya Azure, atau dokumentasi sumber data tertentu. Misalnya:

Platform sumber Referensi
Microsoft SQL Server Port yang Digunakan Oleh SQL Server
Hortonworks HDP Mengelola HDFS
Cloudera CDH Port yang Digunakan oleh Komponen CDH

Port apa yang digunakan untuk grup peluasan skala PolyBase?

Secara default, layanan pergerakan data PolyBase terhubung ke simpul kepala grup peluasan skala melalui berbagai port dari TCP 16450-16460, biasanya menggunakan 16450-16453, ditambah port 17001. Port ini hanya digunakan ketika grup peluasan skala PolyBase dikonfigurasi dan harus diizinkan melalui firewall server. Penyiapan SQL Server harus secara otomatis membuat aturan firewall lokal yang memungkinkan port ini setelah penginstalan fitur. Untuk informasi selengkapnya, lihat Mengonfigurasi grup peluasan skala PolyBase di Windows.

Catatan

Grup peluasan skala Microsoft SQL Server PolyBase akan dihentikan. Fungsionalitas grup peluasan skala akan dihapus dari produk di SQL Server 2022 (16.x).

PolyBase dalam Kluster Big Data vs. PolyBase dalam instans mandiri

Untuk informasi selengkapnya tentang koneksi menggunakan konektor generik ODBC, kunjungi panduan Cara mengonfigurasi jenis generik ODBC.

Tabel berikut menyoroti fitur PolyBase yang tersedia di instalasi mandiri SQL Server 2019 (15.x) dan kluster big data SQL Server 2019 (15.x):

Fitur Kluster Big Data Instans berdiri sendiri
Membuat sumber data eksternal untuk SQL Server, Oracle, Teradata, dan Mongo DB X X
Membuat sumber data eksternal menggunakan Driver ODBC pihak ketiga yang kompatibel X
Membuat sumber data eksternal untuk sumber data HADOOP X X
Membuat sumber data eksternal untuk Azure Blob Storage X X
Membuat tabel eksternal pada kumpulan data SQL Server X
Membuat tabel eksternal pada kumpulan penyimpanan SQL Server X
Eksekusi kueri peluasan skala X X (hanya Windows)

Penting

Add-on Kluster Big Data Microsoft SQL Server 2019 akan dihentikan. Dukungan untuk SQL Server 2019 Kluster Big Data akan berakhir pada 28 Februari 2025. Semua pengguna SQL Server 2019 yang ada dengan Jaminan Perangkat Lunak akan didukung sepenuhnya pada platform dan perangkat lunak akan terus dipertahankan melalui pembaruan kumulatif SQL Server hingga saat itu. Untuk informasi selengkapnya, lihat posting blog pengumuman dan Opsi big data di platform Microsoft SQL Server.