Bagikan melalui


Menyambungkan ke Replikasi Qlik

Penting

Fitur ini ada di Pratinjau Publik.

Replikasi Qlik membantu Anda menarik data dari berbagai sumber data (Oracle, Microsoft SQL Server, SAP, mainframe, dan lainnya) ke Delta Lake. Pengambilan data perubahan otomatis Replikasi (CDC) membantu Anda menghindari pengangkatan berat mengekstrak data secara manual, mentransfer menggunakan skrip API, memotong, pementasan, dan mengimpor. Qlik Compose mengotomatisasi CDC ke Delta Lake.

Catatan

Untuk informasi tentang Qlik Sense, solusi yang membantu Anda menganalisis data di Delta Lake, lihat Qlik Sense.

Untuk demonstrasi umum Replikasi Replikasi Qlik, tonton video YouTube berikut (14 menit).

Untuk demonstrasi alur data dengan Replikasi Replikasi Qlik, lihat video YouTube berikut (6 menit).

Berikut adalah langkah-langkah untuk menggunakan Stitch dengan Azure Databricks.

Langkah 1: Hasilkan token akses pribadi Databricks

Stitch mengautentikasi dengan Azure Databricks menggunakan token akses pribadi Azure Databricks.

Catatan

Sebagai praktik terbaik keamanan, saat Anda mengautentikasi dengan alat, sistem, skrip, dan aplikasi otomatis, Databricks merekomendasikan agar Anda menggunakan token akses pribadi milik perwakilan layanan, bukan pengguna ruang kerja. Untuk membuat token untuk perwakilan layanan, lihat Mengelola token untuk perwakilan layanan.

Langkah 2: Siapkan kluster untuk mendukung kebutuhan integrasi

Stitch akan menulis data ke jalur Azure Data Lake Storage dan kluster integrasi Azure Databricks akan membaca data dari lokasi tersebut. Oleh karena itu kluster integrasi memerlukan akses aman ke jalur Azure Data Lake Storage.

Akses aman ke jalur Azure Data Lake Storage

Untuk mengamankan akses ke data di Azure Data Lake Storage (ADLS), Anda dapat menggunakan kunci akses akun penyimpanan Azure (disarankan) atau perwakilan layanan ID Microsoft Entra.

Gunakan kunci akses akun penyimpanan Azure

Anda dapat mengonfigurasi kunci akses akun penyimpanan di kluster integrasi sebagai bagian dari konfigurasi Spark. Pastikan bahwa akun penyimpanan memiliki akses ke kontainer ADLS dan sistem file yang digunakan untuk pentahapan data dan kontainer ADLS dan sistem file tempat Anda ingin menulis tabel Delta Lake. Untuk mengonfigurasi kluster integrasi untuk menggunakan kunci, ikuti langkah-langkah dalam Koneksi ke Azure Data Lake Storage Gen2 dan Blob Storage.

Menggunakan perwakilan layanan ID Microsoft Entra

Anda dapat mengonfigurasi perwakilan layanan pada kluster integrasi Azure Databricks sebagai bagian dari konfigurasi Spark. Pastikan bahwa perwakilan layanan memiliki akses ke kontainer ADLS yang digunakan untuk pentahapan data dan kontainer ADLS tempat Anda ingin menulis tabel Delta. Untuk mengonfigurasi kluster integrasi agar menggunakan perwakilan layanan, ikuti langkah-langkah di Mengakses ADLS Gen2 dengan perwakilan layanan.

Tentukan konfigurasi kluster

  1. Atur Mode Kluster ke Standar.

  2. Atur Versi Runtime bahasa umum Databricks ke versi runtime bahasa umum Databricks.

  3. Aktifkan penulisan yang dioptimalkan dan pemadatan otomatis dengan menambahkan properti berikut ke konfigurasi Spark Anda:

    spark.databricks.delta.optimizeWrite.enabled true
    spark.databricks.delta.autoCompact.enabled true
    
  4. Konfigurasikan kluster Anda sesuai dengan kebutuhan integrasi dan penskalaan Anda.

Untuk detail konfigurasi kluster, lihat Referensi konfigurasi komputasi.

Lihat Mendapatkan detail koneksi untuk sumber daya komputasi Azure Databricks untuk langkah-langkah mendapatkan URL JDBC dan jalur HTTP.

Langkah 3: Dapatkan detail sambungan JDBC dan ODBC untuk menyambungkan ke kluster

Untuk menyambungkan kluster Azure Databricks ke Infoworks, Anda memerlukan properti sambungan JDBC/ODBC berikut:

  • URL JDBC
  • Jalur HTTP

Langkah 4: Konfigurasikan Bereplikasi Qlik dengan Azure Databricks

Buka halaman login Stitch dan ikuti petunjuknya.

Sumber Daya Tambahan:

Dukungan