Memuat data ke dalam kumpulan SQL khusus di Azure Synapse Analytics dengan SQL Server Integration Services (SSIS)
Berlaku untuk:analitik Azure Synapse
Buat paket SQL Server Integration Services (SSIS) untuk memuat data ke dalam kumpulan SQL khusus di Azure Synapse Analytics. Anda dapat secara opsional merestrukturisasi, mengubah, dan membersihkan data saat melewati aliran data SSIS.
Artikel ini memperlihatkan kepada Anda cara melakukan hal-hal berikut:
- Buat proyek Integration Services baru di Visual Studio.
- Rancang paket SSIS yang memuat data dari sumber ke tujuan.
- Jalankan paket SSIS untuk memuat data.
Konsep dasar
Paket ini adalah unit dasar pekerjaan di SSIS. Paket terkait dikelompokkan dalam proyek. Anda membuat proyek dan paket desain di Visual Studio dengan SQL Server Data Tools. Proses desain adalah proses visual di mana Anda menyeret dan menghilangkan komponen dari Kotak Alat ke permukaan desain, menghubungkannya, dan mengatur propertinya. Setelah menyelesaikan paket, Anda dapat menjalankannya, dan Anda dapat secara opsional menyebarkannya ke SQL Server atau SQL Database untuk manajemen, pemantauan, dan keamanan yang komprehensif.
Pengantar terperinci tentang SSIS berada di luar cakupan artikel ini. Untuk mempelajari selengkapnya, lihat artikel berikut ini:
Opsi untuk memuat data ke Azure Synapse Analytics dengan SSIS
SQL Server Integration Services (SSIS) adalah sekumpulan alat fleksibel yang menyediakan berbagai opsi untuk menyambungkan, dan memuat data ke dalam, Azure Synapse Analytics.
Metode pilihan, yang memberikan performa terbaik, adalah membuat paket yang menggunakan Azure SQL DW Upload Task untuk memuat data. Tugas ini merangkum informasi sumber dan tujuan. Ini mengasumsikan bahwa data sumber Anda disimpan secara lokal dalam file teks yang dibatasi.
Secara bergantian, Anda dapat membuat paket yang menggunakan tugas Aliran Data yang berisi sumber dan tujuan. Pendekatan ini mendukung berbagai sumber data, termasuk SQL Server dan Azure Synapse Analytics.
Prasyarat
Untuk menelusuri tutorial ini, Anda memerlukan hal-hal berikut:
- SQL Server Integration Services (SSIS). SSIS adalah komponen SQL Server dan memerlukan versi berlisensi, atau versi pengembang atau evaluasi, dari SQL Server. Untuk mendapatkan versi evaluasi SQL Server, lihat Mengevaluasi SQL Server.
- Visual Studio (opsional). Untuk mendapatkan Visual Studio Community Edition gratis, lihat Komunitas Visual Studio. Jika Anda tidak ingin menginstal Visual Studio, Anda hanya dapat menginstal SQL Server Data Tools (SSDT). SSDT menginstal versi Visual Studio dengan fungsionalitas terbatas.
- SQL Server Data Tools untuk Visual Studio (SSDT). Untuk mendapatkan SQL Server Data Tools untuk Visual Studio, lihat Mengunduh SQL Server Data Tools (SSDT).
- Database dan izin Azure Synapse Analytics. Tutorial ini terhubung ke kumpulan SQL khusus di instans Azure Synapse Analytics dan memuat data ke dalamnya. Anda harus memiliki izin untuk menyambungkan, membuat tabel, dan memuat data.
Membuat proyek Integration Services baru
- Luncurkan Visual Studio.
- Pada menu File , pilih Baru | Proyek.
- Menavigasi ke Terinstal | Templat | Kecerdasan Bisnis | Jenis proyek Integration Services .
- Pilih Proyek Layanan Integrasi. Berikan nilai untuk Nama dan Lokasi, lalu pilih OK.
Visual Studio membuka dan membuat proyek Integration Services (SSIS) baru. Kemudian Visual Studio membuka perancang untuk paket SSIS baru tunggal (Package.dtsx) dalam proyek. Anda melihat area layar berikut:
Di sebelah kiri, Kotak Alat komponen SSIS.
Di tengah, permukaan desain, dengan beberapa tab. Anda biasanya menggunakan setidaknya tab Alur Kontrol dan Aliran Data .
Di sebelah kanan, panel Penjelajah Solusi dan Properti.
Opsi 1 - Gunakan tugas Unggah SQL DW
Pendekatan pertama adalah paket yang menggunakan tugas Unggah SQL DW. Tugas ini merangkum informasi sumber dan tujuan. Ini mengasumsikan bahwa data sumber Anda disimpan dalam file teks yang dibatasi, baik secara lokal atau di Azure Blob Storage.
Prasyarat untuk Opsi 1
Untuk melanjutkan tutorial dengan opsi ini, Anda memerlukan hal-hal berikut:
Paket Fitur Microsoft SQL Server Integration Services untuk Azure. Tugas Unggah SQL DW adalah komponen dari Paket Fitur.
Akun Azure Blob Storage. Tugas Unggah SQL DW memuat data dari Azure Blob Storage ke Azure Synapse Analytics. Anda dapat memuat file yang sudah ada di Blob Storage, atau Anda dapat memuat file dari komputer Anda. Jika Anda memilih file di komputer, tugas Unggah SQL DW mengunggahnya ke Blob Storage terlebih dahulu untuk penahapan, lalu memuatnya ke kumpulan SQL khusus Anda.
Menambahkan dan mengonfigurasi SQL DW Upload Task
Seret Tugas Unggah SQL DW dari Kotak Alat ke tengah permukaan desain (pada tab Alur Kontrol ).
Klik dua kali tugas untuk membuka Editor Tugas Unggah SQL DW.
Konfigurasikan tugas dengan bantuan panduan dalam artikel Azure SQL Tugas Unggah DW. Karena tugas ini merangkum informasi sumber dan tujuan, dan pemetaan antara tabel sumber dan tujuan, editor tugas memiliki beberapa halaman pengaturan untuk dikonfigurasi.
Membuat solusi serupa secara manual
Untuk kontrol lebih lanjut, Anda dapat membuat paket yang meniru pekerjaan yang dilakukan oleh tugas Unggah SQL DW secara manual.
Gunakan Tugas Unggah Blob Azure untuk menahapkan data dalam Azure Blob Storage. Untuk mendapatkan tugas Unggahan Blob Azure, unduh Paket Fitur Microsoft SQL Server Integration Services untuk Azure.
Kemudian gunakan tugas SSIS Execute SQL untuk meluncurkan skrip PolyBase yang memuat data ke dalam kumpulan SQL khusus Anda. Untuk contoh yang memuat data dari Azure Blob Storage ke kumpulan SQL khusus (tetapi tidak dengan SSIS), lihat Tutorial: Memuat data ke Azure Synapse Analytics.
Opsi 2 - Menggunakan sumber dan tujuan
Pendekatan kedua adalah paket umum yang menggunakan tugas Aliran Data yang berisi sumber dan tujuan. Pendekatan ini mendukung berbagai sumber data, termasuk SQL Server dan Azure Synapse Analytics.
Tutorial ini menggunakan SQL Server sebagai sumber data. SQL Server berjalan secara lokal atau di komputer virtual Azure.
Untuk menyambungkan ke SQL Server dan ke kumpulan SQL khusus, Anda dapat menggunakan pengelola koneksi dan sumber dan tujuan ADO.NET, atau manajer koneksi dan sumber dan tujuan OLE DB. Tutorial ini menggunakan ADO.NET karena memiliki opsi konfigurasi terkecil. OLE DB dapat memberikan performa yang sedikit lebih baik daripada ADO.NET.
Sebagai pintasan, Anda dapat menggunakan Wizard Impor dan Ekspor SQL Server untuk membuat paket dasar. Kemudian, simpan paket, dan buka di Visual Studio atau SSDT untuk melihat dan menyesuaikannya. Untuk informasi selengkapnya, lihat Mengimpor dan Mengekspor Data dengan Wizard Impor dan Ekspor SQL Server.
Prasyarat untuk Opsi 2
Untuk melanjutkan tutorial dengan opsi ini, Anda memerlukan hal-hal berikut:
Contoh data. Tutorial ini menggunakan data sampel yang disimpan dalam SQL Server dalam database sampel AdventureWorks sebagai data sumber yang akan dimuat ke dalam kumpulan SQL khusus. Untuk mendapatkan database sampel AdventureWorks, lihat Database Sampel AdventureWorks.
Aturan firewall. Anda harus membuat aturan firewall pada kumpulan SQL khusus Anda dengan alamat IP komputer lokal Anda sebelum Anda dapat mengunggah data ke kumpulan SQL khusus.
Membuat aliran data dasar
Seret Tugas Aliran Data dari Kotak Alat ke tengah permukaan desain (pada tab Alur Kontrol ).
Klik dua kali Tugas Aliran Data untuk beralih ke tab Aliran Data.
Dari daftar Sumber Lain di Kotak Alat, seret Sumber ADO.NET ke permukaan desain. Dengan adaptor sumber masih dipilih, ubah namanya menjadi sumber SQL Server di panel Properti.
Dari daftar Tujuan Lain di Kotak Alat, seret Tujuan ADO.NET ke permukaan desain di bawah Sumber ADO.NET. Dengan adaptor tujuan masih dipilih, ubah namanya menjadi tujuan SQL DW di panel Properti .
Mengonfigurasi adaptor sumber
Klik dua kali adaptor sumber untuk membuka Editor Sumber ADO.NET.
Pada tab Pengelola SambunganEditor Sumber ADO.NET, klik tombol Baru di samping daftar pengelola koneksi ADO.NET untuk membuka kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan dan buat pengaturan koneksi untuk database SQL Server tempat tutorial ini memuat data.
Dalam kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan, klik tombol Baru untuk membuka kotak dialog Pengelola Sambungan dan membuat koneksi data baru.
Dalam kotak dialog Pengelola Sambungan, lakukan hal-hal berikut ini.
Untuk Penyedia, pilih Penyedia Data SqlClient.
Untuk Nama server, masukkan nama SQL Server.
Di bagian Masuk ke server , pilih atau masukkan informasi autentikasi.
Di bagian Sambungkan ke database , pilih database sampel AdventureWorks.
Klik Uji Koneksi.
Dalam kotak dialog yang melaporkan hasil pengujian koneksi, klik OK untuk kembali ke kotak dialog Pengelola Sambungan.
Dalam kotak dialog Pengelola Sambungan, klik OK untuk kembali ke kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan.
Dalam kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan, klik OK untuk kembali ke Editor Sumber ADO.NET.
Di Editor Sumber ADO.NET, di Nama tabel atau daftar tampilan , pilih tabel Sales.SalesOrderDetail .
Klik Pratinjau untuk melihat 200 baris data pertama dalam tabel sumber dalam kotak dialog Hasil Kueri Pratinjau .
Dalam kotak dialog Hasil Kueri Pratinjau , klik Tutup untuk kembali ke Editor Sumber ADO.NET.
Di Editor Sumber ADO.NET, klik OK untuk menyelesaikan konfigurasi sumber data.
Menyambungkan adaptor sumber ke adaptor tujuan
Pilih adaptor sumber pada permukaan desain.
Pilih panah biru yang meluas dari adaptor sumber dan seret ke editor tujuan hingga diposisikan ke tempatnya.
Dalam paket SSIS umum, Anda menggunakan sejumlah komponen lain dari Kotak Alat SSIS di antara sumber dan tujuan untuk merestrukturisasi, mengubah, dan membersihkan data Anda saat melewati aliran data SSIS. Untuk menjaga contoh ini sesingkat mungkin, kami menghubungkan sumber langsung ke tujuan.
Mengonfigurasi adaptor tujuan
Klik dua kali adaptor tujuan untuk membuka Editor Tujuan ADO.NET.
Pada tab Pengelola SambunganEditor Tujuan ADO.NET, klik tombol Baru di samping daftar Pengelola koneksi untuk membuka kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan dan buat pengaturan koneksi untuk database Azure Synapse Analytics tempat tutorial ini memuat data.
Dalam kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan, klik tombol Baru untuk membuka kotak dialog Pengelola Sambungan dan membuat koneksi data baru.
Dalam kotak dialog Pengelola Sambungan, lakukan hal-hal berikut ini.
- Untuk Penyedia, pilih Penyedia Data SqlClient.
- Untuk Nama server, masukkan nama kumpulan SQL khusus.
- Di bagian Masuk ke server, pilih Gunakan autentikasi SQL Server dan masukkan informasi autentikasi.
- Di bagian Sambungkan ke database , pilih database kumpulan SQL khusus yang sudah ada.
- Klik Uji Koneksi.
- Dalam kotak dialog yang melaporkan hasil pengujian koneksi, klik OK untuk kembali ke kotak dialog Pengelola Sambungan.
- Dalam kotak dialog Pengelola Sambungan, klik OK untuk kembali ke kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan.
Dalam kotak dialog Konfigurasikan ADO.NET Pengelola Sambungan, klik OK untuk kembali ke Editor Tujuan ADO.NET.
Di Editor Tujuan ADO.NET, klik Baru di samping daftar Gunakan tabel atau tampilan untuk membuka kotak dialog Buat Tabel untuk membuat tabel tujuan baru dengan daftar kolom yang cocok dengan tabel sumber.
Dalam kotak dialog Buat Tabel , lakukan hal-hal berikut ini.
Ubah nama tabel tujuan menjadi SalesOrderDetail.
Hapus kolom rowguid . Jenis data pengidentifikasi unik tidak didukung di kumpulan SQL khusus.
Ubah jenis data kolom LineTotal menjadi uang. Jenis data desimal tidak didukung di kumpulan SQL khusus. Untuk informasi tentang jenis data yang didukung, lihat CREATE TABLE (Azure Synapse Analytics, Parallel Data Warehouse).
Klik OK untuk membuat tabel dan kembali ke Editor Tujuan ADO.NET.
Di Editor Tujuan ADO.NET, pilih tab Pemetaan untuk melihat bagaimana kolom di sumber dipetakan ke kolom di tujuan.
Klik OK untuk menyelesaikan konfigurasi tujuan.
Jalankan paket untuk memuat data
Jalankan paket dengan mengklik tombol Mulai pada toolbar atau dengan memilih salah satu opsi Jalankan pada menu Debug .
Paragraf berikut menjelaskan apa yang Anda lihat jika Anda membuat paket dengan opsi kedua yang dijelaskan dalam artikel ini, yaitu, dengan aliran data yang berisi sumber dan tujuan.
Saat paket mulai berjalan, Anda akan melihat roda berputar kuning untuk menunjukkan aktivitas serta jumlah baris yang diproses sejauh ini.
Setelah paket selesai berjalan, Anda akan melihat tanda centang hijau untuk menunjukkan keberhasilan serta jumlah total baris data yang dimuat dari sumber ke tujuan.
Selamat! Anda berhasil menggunakan SQL Server Integration Services untuk memuat data ke Azure Synapse Analytics.
Langkah berikutnya
Pelajari cara men-debug dan memecahkan masalah paket Anda tepat di lingkungan desain. Mulai di sini: Alat Pemecahan Masalah untuk Pengembangan Paket.
Pelajari cara menyebarkan proyek dan paket SSIS Anda ke Server Layanan Integrasi atau ke lokasi penyimpanan lain. Mulai di sini: Penyebaran Proyek dan Paket.
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk