Sambungkan Excel ke Apache Hadoop di Azure HDInsight dengan driver Microsoft Hive ODBC

Solusi Big Data Microsoft mengintegrasikan komponen Microsoft Business Intelligence (BI) dengan kluster Apache Hadoop yang diterapkan di HDInsight. Contohnya adalah kemampuan untuk menghubungkan Excel ke gudang data Apache Hive dari kluster Hadoop. Sambungkan menggunakan Open Database Connectivity (ODBC) Driver Microsoft Apache Hive.

Anda bisa menyambungkan data yang terkait dengan kluster HDInsight dari Excel dengan add-in Microsoft Power Query untuk Excel. Untuk informasi selengkapnya, lihat Menyambungkan Excel ke HDInsight dengan Power Query.

Prasyarat

Sebelum memulai artikel ini, Anda harus memiliki item berikut:

Instal driver ODBC Microsoft Apache Hive

Unduh dan instal Microsoft Apache Hive ODBC Driver. Pilih versi yang cocok dengan versi aplikasi tempat Anda akan menggunakan driver ODBC. Untuk artikel ini, driver digunakan untuk Office Excel.

Membuat sumber data ODBC Apache Hive

Langkah-langkah berikut menunjukkan cara membuat sumber data ODBC Apache Hive.

  1. Dari Windows, navigasikan ke Mulai > Alat Administratif Windows > Sumber Data ODBC (32-bit)/(64-bit). Tindakan ini membuka jendela Administrator Sumber Data ODBC.

    OBDC data source administrator.

  2. Dari tab DSN Pengguna, pilih Tambah untuk membuka jendela Buat Sumber Data Baru.

  3. Pilih Microsoft Apache Hive ODBC Driver, lalu pilih Selesai untuk membuka jendela Penyetelan DSN Microsoft Apache Hive ODBC Driver.

  4. Ketik atau pilih nilai berikut:

    Properti Deskripsi
    Nama Sumber Data Berikan nama ke sumber data Anda
    Host Memasuki HDInsightClusterName.azurehdinsight.net. Contohnya,myHDICluster.azurehdinsight.net. Catatan: HDInsightClusterName-int.azurehdinsight.net didukung selama klien VM di-peer ke jaringan virtual yang sama.
    Port Gunakan 443. (Port ini telah diubah dari 563 menjadi 443.)
    Database Gunakan default.
    Mekanisme Pilih Layanan Windows Azure HDInsight
    Nama Pengguna Masukkan nama pengguna HTTP kluster HDInsight. Nama pengguna default adalah admin.
    Kata sandi Masukkan sandi pengguna kluster Azure HDInsight. Pilih kotak centang Simpan Kata Sandi (Terenkripsi).
  5. Opsional: Pilih Opsi Tingkat Lanjut...

    Parameter Deskripsi
    Gunakan Kueri Asli Ketika dipilih, pengandar ODBC TIDAK mencoba mengubah TSQL menjadi HiveQL. Gunakan opsi ini hanya jika Anda 100% yakin bahwa Anda mengirimkan pernyataan HiveQL murni. Saat menyambungkan ke SQL Server atau Azure SQL Database, Anda harus membiarkannya tidak dicentang.
    Baris yang diambil per blok Saat mengambil sejumlah besar baris data, menyetel parameter ini mungkin diperlukan untuk memastikan kinerja yang optimal.
    Panjang kolom string default, panjang kolom Biner, skala kolom Desimal Panjang dan presisi jenis data dapat memengaruhi cara data dikembalikan. Mereka menyebabkan informasi yang salah dikembalikan karena hilangnya presisi dan pemotongan.

    Advanced DSN configuration options.

  6. Pilih Uji untuk menguji sumber data. Ketika sumber data dikonfigurasi dengan benar, hasil pengujian menunjukkan BERHASIL!

  7. Pilih OK untuk menutup jendela Uji.

  8. Pilih OK untuk menutup jendela Penyetelan DSN Microsoft Hive ODBC Driver.

  9. Pilih OK untuk menutup jendela Administrator Sumber Data ODBC.

Mengimpor data ke Excel dari Microsoft Azure HDInsight

Langkah-langkah berikut ini menjelaskan cara mengimpor data dari tabel Apache Hive ke dalam buku kerja Excel menggunakan sumber data ODBC yang Anda buat di bagian sebelumnya.

  1. Buka buku kerja baru atau yang sudah ada di Excel.

  2. Dari tab Data, navigasikan ke Dapatkan Data>Dari Sumber Data Lain>Dari ODBC untuk meluncurkan jendela Dari ODBC.

    Open Excel data connection wizard.

  3. Dari menu drop-drown, pilih nama sumber data yang Anda buat di bagian terakhir, lalu pilih OK.

  4. Untuk penggunaan pertama, dialog driver ODBC akan terbuka. Pilih Windows dari menu di sebelah kiri. Kemudian pilih Hubungkan untuk membuka jendela Navigator.

  5. Dari Navigator, navigasi ke HIVE>default>hivesampletable, lalu pilih Muat. Diperlukan waktu beberapa detik sebelum data diimpor ke Excel.

    HDInsight Excel Hive ODBC navigator.

Langkah berikutnya

Dalam artikel ini, Anda mempelajari cara menggunakan driver ODBC Microsoft Apache Hive untuk mengambil data dari Layanan HDInsight ke Excel. Demikian pula, Anda dapat mengambil data dari HDInsight Service ke SQL Database. Anda juga dapat mengunggah data ke Layanan HDInsight. Untuk mempelajari selengkapnya, lihat: