Tugas Analitik Azure Synapse

Berlaku untuk: Integration Runtime SSIS SQL Server di Azure Data Factory

Tugas Azure Synapse Analytics memungkinkan paket SSIS menyalin data tabular ke kumpulan SQL khusus Azure Synapse Analytics dari sistem file atau Azure Blob Storage. Tugas ini memanfaatkan PolyBase untuk meningkatkan performa, seperti yang dijelaskan dalam artikel Azure Synapse Pola dan Strategi Pemuatan Analitik. Format file data sumber yang saat ini didukung adalah teks yang dibatasi dalam pengodean UTF8. Saat menyalin dari sistem file, data pertama-tama akan diunggah ke Azure Blob Storage untuk penahapan, lalu ke kumpulan SQL khusus. Oleh karena itu, akun Azure Blob Storage diperlukan.

Catatan

Pengelola koneksi Azure Storage dengan jenis layanan Data Lake Gen2 tidak didukung.

Untuk menggunakan Azure Data Lake Gen2 untuk penahapan atau sumber, Anda dapat tersambung melalui pengelola koneksi Azure Storage dengan jenis Azure Blob Storage.

Tugas analitik Azure Synapse adalah komponen dari Paket Fitur SQL Server Integration Services (SSIS) untuk Azure.

Untuk menambahkan Tugas Azure Synapse Analytics, seret-letakkan dari SSIS Toolbox ke kanvas perancang, dan klik dua kali atau klik kanan dan klik Edit untuk melihat kotak dialog editor tugas.

Pada halaman Umum , konfigurasikan properti berikut ini.

SourceType menentukan jenis penyimpanan data sumber. Pilih salah satu jenis berikut:

  • Filesystem: Data sumber berada dalam sistem file lokal.
  • BlobStorage: Data sumber berada di Azure Blob Storage.

Berikut ini adalah properti untuk setiap jenis sumber.

FileSystem

Bidang Deskripsi
LocalDirectory Menentukan direktori lokal yang berisi file data yang akan diunggah.
Secara rekursif Menentukan apakah akan mencari subdirektori secara rekursif.
FileName Menentukan filter nama untuk memilih file dengan pola nama tertentu. Misalnya MySheet*.xsl* akan menyertakan file seperti MySheet001.xsl dan MySheetABC.xslx.
RowDelimiter Menentukan karakter yang menandai akhir setiap baris.
Pembatas Kolom Menentukan satu atau beberapa karakter yang menandai akhir setiap kolom. Misalnya | (pipa), \t (tab), ' (tanda kutip tunggal), " (tanda kutip ganda), dan 0x5c (garis miring terbelakang).
IsFirstRowHeader Menentukan apakah baris pertama di setiap file data berisi nama kolom, bukan data aktual.
AzureStorageConnection Menentukan pengelola koneksi Azure Storage.
BlobContainer Menentukan nama kontainer blob tempat data lokal akan diunggah dan disampaikan ke kumpulan SQL khusus Azure Synapse Analytics melalui PolyBase. Kontainer baru akan dibuat jika tidak ada.
BlobDirectory Menentukan direktori blob (struktur hierarkis virtual) tempat data lokal akan diunggah dan disampaikan ke kumpulan SQL khusus Azure Synapse Analytics melalui PolyBase.
RetainFiles Menentukan apakah akan menyimpan file yang diunggah ke Azure Storage.
CompressionType Menentukan format kompresi yang akan digunakan saat mengunggah file ke Azure Storage. Sumber lokal tidak terpengaruh.
Tingkat Pemadatan Menentukan tingkat pemadatan yang akan digunakan untuk format pemadatan.
SqlPoolConnection Menentukan pengelola koneksi ADO.NET untuk kumpulan SQL khusus Azure Synapse Analytics.
TableName Menentukan nama tabel tujuan. Pilih nama tabel yang sudah ada, atau buat yang baru dengan memilih <Tabel Baru ...>.
TableDistribution Menentukan metode distribusi untuk tabel baru. Berlaku jika nama tabel baru ditentukan untuk TableName.
HashColumnName Menentukan kolom yang digunakan untuk distribusi tabel hash. Berlaku jika HASH ditentukan untuk TableDistribution.

BlobStorage

Bidang Deskripsi
AzureStorageConnection Menentukan pengelola koneksi Azure Storage.
BlobContainer Menentukan nama kontainer blob tempat data sumber berada.
BlobDirectory Menentukan direktori blob (struktur hierarki virtual) tempat data sumber berada.
RowDelimiter Menentukan karakter yang menandai akhir setiap baris.
Pembatas Kolom Menentukan satu atau beberapa karakter yang menandai akhir setiap kolom. Misalnya | (pipa), \t (tab), ' (tanda kutip tunggal), " (tanda kutip ganda), dan 0x5c (garis miring terbelakang).
CompressionType Menentukan format kompresi yang digunakan untuk data sumber.
SqlPoolConnection Menentukan pengelola koneksi ADO.NET untuk kumpulan SQL khusus Azure Synapse Analytics.
TableName Menentukan nama tabel tujuan. Pilih nama tabel yang sudah ada, atau buat yang baru dengan memilih <Tabel Baru ...>.
TableDistribution Menentukan metode distribusi untuk tabel baru. Berlaku jika nama tabel baru ditentukan untuk TableName.
HashColumnName Menentukan kolom yang digunakan untuk distribusi tabel hash. Berlaku jika HASH ditentukan untuk TableDistribution.

Anda akan melihat halaman Pemetaan yang berbeda tergantung pada apakah Anda menyalin ke tabel baru atau ke tabel yang sudah ada. Dalam kasus sebelumnya, konfigurasikan kolom sumber mana yang akan dipetakan dan nama yang sesuai dalam tabel tujuan yang akan dibuat. Dalam kasus terakhir, konfigurasikan hubungan pemetaan antara kolom sumber dan tujuan.

Pada halaman Kolom , konfigurasikan properti jenis data untuk setiap kolom sumber.

Halaman T-SQL menunjukkan T-SQL yang digunakan untuk memuat data dari Azure Blob Storage ke kumpulan SQL khusus. T-SQL secara otomatis dihasilkan dari konfigurasi di halaman lain, dan akan dijalankan sebagai bagian dari eksekusi tugas. Anda dapat memilih untuk mengedit T-SQL yang dihasilkan secara manual untuk memenuhi kebutuhan khusus Anda dengan mengklik tombol Edit . Anda dapat kembali ke yang dibuat secara otomatis nanti dengan mengklik tombol Reset .