Sambungkan Excel ke Apache Hadoop di Azure HDInsight dengan driver Microsoft Hive ODBC
Solusi Big Data Microsoft mengintegrasikan komponen Microsoft Business Intelligence (BI) dengan kluster Apache Hadoop yang diterapkan di HDInsight. Contohnya adalah kemampuan untuk menghubungkan Excel ke gudang data Apache Hive dari kluster Hadoop. Sambungkan menggunakan Open Database Connectivity (ODBC) Driver Microsoft Apache Hive.
Anda bisa menyambungkan data yang terkait dengan kluster HDInsight dari Excel dengan add-in Microsoft Power Query untuk Excel. Untuk informasi selengkapnya, lihat Menyambungkan Excel ke HDInsight dengan Power Query.
Prasyarat
Sebelum memulai artikel ini, Anda harus memiliki item berikut:
- Kluster HDInsight Hadoop. Untuk membuatnya, lihat Mulai menggunakan Microsoft Azure HDInsight.
- Stasiun kerja dengan Office 2010 Professional Plus atau yang lebih baru, atau Excel 2010 atau yang lebih baru.
Instal driver ODBC Microsoft Apache Hive
Unduh dan instal Microsoft Apache Hive ODBC Driver. Pilih versi yang cocok dengan versi aplikasi tempat Anda akan menggunakan driver ODBC. Untuk artikel ini, driver digunakan untuk Office Excel.
Membuat sumber data ODBC Apache Hive
Langkah-langkah berikut menunjukkan cara membuat sumber data ODBC Apache Hive.
Dari Windows, navigasikan ke Mulai > Alat Administratif Windows > Sumber Data ODBC (32-bit)/(64-bit). Tindakan ini membuka jendela Administrator Sumber Data ODBC.
Dari tab DSN Pengguna, pilih Tambah untuk membuka jendela Buat Sumber Data Baru.
Pilih Microsoft Apache Hive ODBC Driver, lalu pilih Selesai untuk membuka jendela Penyetelan DSN Microsoft Apache Hive ODBC Driver.
Ketik atau pilih nilai berikut:
Properti Deskripsi Nama Sumber Data Berikan nama ke sumber data Anda Host Memasuki HDInsightClusterName.azurehdinsight.net
. Contohnya,myHDICluster.azurehdinsight.net
. Catatan:HDInsightClusterName-int.azurehdinsight.net
didukung selama klien VM di-peer ke jaringan virtual yang sama.Port Gunakan 443. (Port ini telah diubah dari 563 menjadi 443.) Database Gunakan default. Mekanisme Pilih Layanan Windows Azure HDInsight Nama Pengguna Masukkan nama pengguna HTTP kluster HDInsight. Nama pengguna default adalah admin
.Kata sandi Masukkan sandi pengguna kluster Azure HDInsight. Pilih kotak centang Simpan Kata Sandi (Terenkripsi). Opsional: Pilih Opsi Tingkat Lanjut...
Parameter Deskripsi Gunakan Kueri Asli Ketika dipilih, pengandar ODBC TIDAK mencoba mengubah TSQL menjadi HiveQL. Gunakan opsi ini hanya jika Anda 100% yakin bahwa Anda mengirimkan pernyataan HiveQL murni. Saat menyambungkan ke SQL Server atau Azure SQL Database, Anda harus membiarkannya tidak dicentang. Baris yang diambil per blok Saat mengambil sejumlah besar baris data, menyetel parameter ini mungkin diperlukan untuk memastikan kinerja yang optimal. Panjang kolom string default, panjang kolom Biner, skala kolom Desimal Panjang dan presisi jenis data dapat memengaruhi cara data dikembalikan. Mereka menyebabkan informasi yang salah dikembalikan karena hilangnya presisi dan pemotongan. Pilih Uji untuk menguji sumber data. Ketika sumber data dikonfigurasi dengan benar, hasil pengujian menunjukkan BERHASIL!
Pilih OK untuk menutup jendela Uji.
Pilih OK untuk menutup jendela Penyetelan DSN Microsoft Hive ODBC Driver.
Pilih OK untuk menutup jendela Administrator Sumber Data ODBC.
Mengimpor data ke Excel dari Microsoft Azure HDInsight
Langkah-langkah berikut ini menjelaskan cara mengimpor data dari tabel Apache Hive ke dalam buku kerja Excel menggunakan sumber data ODBC yang Anda buat di bagian sebelumnya.
Buka buku kerja baru atau yang sudah ada di Excel.
Dari tab Data, navigasikan ke Dapatkan Data>Dari Sumber Data Lain>Dari ODBC untuk meluncurkan jendela Dari ODBC.
Dari menu drop-drown, pilih nama sumber data yang Anda buat di bagian terakhir, lalu pilih OK.
Untuk penggunaan pertama, dialog driver ODBC akan terbuka. Pilih Windows dari menu di sebelah kiri. Kemudian pilih Hubungkan untuk membuka jendela Navigator.
Dari Navigator, navigasi ke HIVE>default>hivesampletable, lalu pilih Muat. Diperlukan waktu beberapa detik sebelum data diimpor ke Excel.
Langkah berikutnya
Dalam artikel ini, Anda mempelajari cara menggunakan driver ODBC Microsoft Apache Hive untuk mengambil data dari Layanan HDInsight ke Excel. Demikian pula, Anda dapat mengambil data dari HDInsight Service ke SQL Database. Anda juga dapat mengunggah data ke Layanan HDInsight. Untuk mempelajari selengkapnya, lihat:
- Memvisualisasikan data Apache Hive dengan Microsoft Power BI di Azure HDInsight.
- Memvisualisasikan data Interactive Query Apache Hive dengan Power BI di Azure HDInsight.
- Menyambungkan Excel ke Apache Hadoop menggunakan Power Query.
- Sambungkan ke Microsoft Azure HDInsight dan jalankan kueri Apache Hive menggunakan Alat Data Lake untuk Visual Studio.