Hubungkan ke Matillion Data Productivity Cloud

Matillion Data Productivity Cloud adalah alat ETL/ELT yang dibuat khusus untuk platform database cloud termasuk Azure Databricks. Matillion Data Productivity Cloud memiliki UI modern berbasis browser, dengan fungsionalitas ETL/ELT berkemampuan push-down yang kuat.

Anda dapat mengintegrasikan gudang SQL Databricks (sebelumnya titik akhir SQL Databrick) dan kluster Azure Databricks dengan Matillion.

Menyambungkan ke Matillion menggunakan Koneksi Mitra

Di bagian ini, Anda akan menggunakan Koneksi Mitra untuk menyederhanakan proses menyambungkan kluster atau gudang SQL yang ada di ruang kerja Azure Databricks Anda ke Matillion.

Persyaratan

Lihat persyaratan untuk menggunakan Partner Connect.

Langkah-langkah untuk menyambungkan

Untuk menyambungkan ke Matillion menggunakan Koneksi Mitra, ikuti langkah-langkah di bagian ini.

  1. Di bar samping, klik ikon MarketplaceMarketplace.

  2. Diintegrasi Partner Connect, klik Lihat semua.

  3. Klik petak Peta Cloud Produktivitas Data Matillion .

  4. Pilih katalog Azure Databricks yang akan digunakan Matillion untuk menulis dan klik Berikutnya.

  5. Pilih gudang Databricks SQL yang ada untuk digunakan dengan Matillion. Sumber daya komputasi ini digunakan untuk menjalankan alur Anda.

  6. Pilih skema Matillion yang harus digunakan untuk membuat dan mengelola alur data Anda. Klik Tambahkan.

  7. Klik Berikutnya.

  8. Tinjau informasi koneksi Anda dan klik Berikutnya.

  9. Tinjau dan terima syarat dan ketentuan untuk menggunakan Partner Connect dan klik Sambungkan ke Matillion Data Productivity Cloud.

  10. Halaman Matillion Data Productivity Cloud terbuka. Selesaikan instruksi di layar untuk membuat akun uji coba 14 hari atau masuk ke akun Matillion yang sudah ada.

    Matillion mungkin memerlukan waktu beberapa menit untuk membuat infrastruktur yang diperlukan dan terhubung dengan aman ke lingkungan Azure Databricks Anda.

  11. Setelah Matillion menyelesaikan proses penyiapan, Perancang langsung dimuat.

    Catatan

    Jika Anda tidak berada di halaman Perancang, kembali ke Azure Databricks dan masuk ke Matillion lagi.

Mulai menggunakan Matillion

Setelah penyiapan selesai, Anda mendarat di Perancang tempat Anda dapat mulai membangun alur data. Pipeline adalah cara Cloud Produktivitas Data untuk merancang, mengatur, dan menjalankan alur kerja.

Untuk memastikan ruang kerja Azure Databricks Anda tersambung ke Matillion, cari yang berikut ini:

  • Proyek default dengan logo Azure Databricks di kiri atas.
  • Lingkungan Anda diberi nama menggunakan terminologi Azure Databricks.
  • Jika Anda mengklik Skema di kiri atas, panel akan terbuka dan menampilkan skema yang Anda pilih di Azure Databricks, bersama dengan tabel dan tampilan apa pun.

Jelajahi konten Skema untuk mengonfirmasi bahwa Matillion berhasil terhubung ke ruang kerja Databricks Anda.

Setelah Anda memeriksa apakah Anda tersambung ke Azure Databricks, mulailah membuat alur di Matillion:

  • Buat Orchestration Pipeline pertama Anda untuk memindahkan data ke Azure Databricks dari sumber.
  • Buat Alur Transformasi pertama Anda untuk membentuk, membersihkan, dan menyiapkan data yang sudah ada langsung dalam Azure Databricks.
  • Gunakan Visual Designer untuk membangun alur kerja data menggunakan antarmuka kanvas seret dan letakkan.

Langkah berikutnya

Jelajahi satu atau beberapa sumber daya berikut di situs web Matillion: