Tugas Analitik Azure Synapse
Berlaku untuk: Integration Runtime SSIS SQL Server di Azure Data Factory
Tugas Azure Synapse Analytics memungkinkan paket SSIS menyalin data tabular ke kumpulan SQL khusus Azure Synapse Analytics dari sistem file atau Azure Blob Storage. Tugas ini memanfaatkan PolyBase untuk meningkatkan performa, seperti yang dijelaskan dalam artikel Azure Synapse Pola dan Strategi Pemuatan Analitik. Format file data sumber yang saat ini didukung adalah teks yang dibatasi dalam pengodean UTF8. Saat menyalin dari sistem file, data pertama-tama akan diunggah ke Azure Blob Storage untuk penahapan, lalu ke kumpulan SQL khusus. Oleh karena itu, akun Azure Blob Storage diperlukan.
Catatan
Pengelola koneksi Azure Storage dengan jenis layanan Data Lake Gen2 tidak didukung.
Untuk menggunakan Azure Data Lake Gen2 untuk penahapan atau sumber, Anda dapat tersambung melalui pengelola koneksi Azure Storage dengan jenis Azure Blob Storage.
Tugas analitik Azure Synapse adalah komponen dari Paket Fitur SQL Server Integration Services (SSIS) untuk Azure.
Untuk menambahkan Tugas Azure Synapse Analytics, seret-letakkan dari SSIS Toolbox ke kanvas perancang, dan klik dua kali atau klik kanan dan klik Edit untuk melihat kotak dialog editor tugas.
Pada halaman Umum , konfigurasikan properti berikut ini.
SourceType menentukan jenis penyimpanan data sumber. Pilih salah satu jenis berikut:
- Filesystem: Data sumber berada dalam sistem file lokal.
- BlobStorage: Data sumber berada di Azure Blob Storage.
Berikut ini adalah properti untuk setiap jenis sumber.
FileSystem
Bidang | Deskripsi |
---|---|
LocalDirectory | Menentukan direktori lokal yang berisi file data yang akan diunggah. |
Secara rekursif | Menentukan apakah akan mencari subdirektori secara rekursif. |
FileName | Menentukan filter nama untuk memilih file dengan pola nama tertentu. Misalnya MySheet*.xsl* akan menyertakan file seperti MySheet001.xsl dan MySheetABC.xslx. |
RowDelimiter | Menentukan karakter yang menandai akhir setiap baris. |
Pembatas Kolom | Menentukan satu atau beberapa karakter yang menandai akhir setiap kolom. Misalnya | (pipa), \t (tab), ' (tanda kutip tunggal), " (tanda kutip ganda), dan 0x5c (garis miring terbelakang). |
IsFirstRowHeader | Menentukan apakah baris pertama di setiap file data berisi nama kolom, bukan data aktual. |
AzureStorageConnection | Menentukan pengelola koneksi Azure Storage. |
BlobContainer | Menentukan nama kontainer blob tempat data lokal akan diunggah dan disampaikan ke kumpulan SQL khusus Azure Synapse Analytics melalui PolyBase. Kontainer baru akan dibuat jika tidak ada. |
BlobDirectory | Menentukan direktori blob (struktur hierarkis virtual) tempat data lokal akan diunggah dan disampaikan ke kumpulan SQL khusus Azure Synapse Analytics melalui PolyBase. |
RetainFiles | Menentukan apakah akan menyimpan file yang diunggah ke Azure Storage. |
CompressionType | Menentukan format kompresi yang akan digunakan saat mengunggah file ke Azure Storage. Sumber lokal tidak terpengaruh. |
Tingkat Pemadatan | Menentukan tingkat pemadatan yang akan digunakan untuk format pemadatan. |
SqlPoolConnection | Menentukan pengelola koneksi ADO.NET untuk kumpulan SQL khusus Azure Synapse Analytics. |
TableName | Menentukan nama tabel tujuan. Pilih nama tabel yang sudah ada, atau buat yang baru dengan memilih <Tabel Baru ...>. |
TableDistribution | Menentukan metode distribusi untuk tabel baru. Berlaku jika nama tabel baru ditentukan untuk TableName. |
HashColumnName | Menentukan kolom yang digunakan untuk distribusi tabel hash. Berlaku jika HASH ditentukan untuk TableDistribution. |
BlobStorage
Bidang | Deskripsi |
---|---|
AzureStorageConnection | Menentukan pengelola koneksi Azure Storage. |
BlobContainer | Menentukan nama kontainer blob tempat data sumber berada. |
BlobDirectory | Menentukan direktori blob (struktur hierarki virtual) tempat data sumber berada. |
RowDelimiter | Menentukan karakter yang menandai akhir setiap baris. |
Pembatas Kolom | Menentukan satu atau beberapa karakter yang menandai akhir setiap kolom. Misalnya | (pipa), \t (tab), ' (tanda kutip tunggal), " (tanda kutip ganda), dan 0x5c (garis miring terbelakang). |
CompressionType | Menentukan format kompresi yang digunakan untuk data sumber. |
SqlPoolConnection | Menentukan pengelola koneksi ADO.NET untuk kumpulan SQL khusus Azure Synapse Analytics. |
TableName | Menentukan nama tabel tujuan. Pilih nama tabel yang sudah ada, atau buat yang baru dengan memilih <Tabel Baru ...>. |
TableDistribution | Menentukan metode distribusi untuk tabel baru. Berlaku jika nama tabel baru ditentukan untuk TableName. |
HashColumnName | Menentukan kolom yang digunakan untuk distribusi tabel hash. Berlaku jika HASH ditentukan untuk TableDistribution. |
Anda akan melihat halaman Pemetaan yang berbeda tergantung pada apakah Anda menyalin ke tabel baru atau ke tabel yang sudah ada. Dalam kasus sebelumnya, konfigurasikan kolom sumber mana yang akan dipetakan dan nama yang sesuai dalam tabel tujuan yang akan dibuat. Dalam kasus terakhir, konfigurasikan hubungan pemetaan antara kolom sumber dan tujuan.
Pada halaman Kolom , konfigurasikan properti jenis data untuk setiap kolom sumber.
Halaman T-SQL menunjukkan T-SQL yang digunakan untuk memuat data dari Azure Blob Storage ke kumpulan SQL khusus. T-SQL secara otomatis dihasilkan dari konfigurasi di halaman lain, dan akan dijalankan sebagai bagian dari eksekusi tugas. Anda dapat memilih untuk mengedit T-SQL yang dihasilkan secara manual untuk memenuhi kebutuhan khusus Anda dengan mengklik tombol Edit . Anda dapat kembali ke yang dibuat secara otomatis nanti dengan mengklik tombol Reset .
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk