Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Salah satu fitur utama solusi big data Microsoft adalah integrasi komponen kecerdasan bisnis Microsoft (BI) dengan kluster Apache Hadoop di Azure HDInsight. Contoh utama adalah kemampuan untuk menyambungkan Excel ke akun Azure Storage yang berisi data yang terkait dengan kluster Hadoop Anda dengan menggunakan add-in Microsoft Power Query for Excel. Artikel ini membimbing Anda langkah demi langkah tentang cara menyiapkan dan menggunakan Power Query untuk mengambil data yang terkait dengan kluster Hadoop yang dikelola dengan HDInsight.
Prasyarat
- Kluster Apache Hadoop di Microsoft Azure HDInsight. Lihat Mulai menggunakan Microsoft Azure HDInsight di Linux.
- Stasiun kerja yang menjalankan Windows 10, 7, Windows Server 2008 R2, atau sistem operasi yang lebih baru.
- Aplikasi Microsoft 365 untuk perusahaan, Office 2016, Office 2013 Professional Plus, Excel 2013 Standalone, atau Office 2010 Professional Plus.
Menginstal Microsoft Power Query
Power Query dapat mengimpor data yang telah dihasilkan atau yang telah dihasilkan oleh pekerjaan Hadoop yang berjalan pada kluster HDInsight.
Di Excel 2016, Power Query telah diintegrasikan ke dalam pita Data di bawah bagian Get & Transform. Untuk versi Excel yang lebih lama, unduh Microsoft Power Query untuk Excel dari Pusat Unduhan Microsoft dan instal.
Mengimpor data HDInsight ke Excel
Add-in Power Query untuk Excel memudahkan untuk mengimpor data dari kluster HDInsight Anda ke Excel, di mana alat BI seperti PowerPivot dan Power Map dapat digunakan untuk memeriksa, menganalisis, dan menyajikan data.
Luncurkan Excel.
Buat buku kerja kosong baru.
Lakukan langkah-langkah berikut berdasarkan versi Excel:
Excel 2016
Pilih >Data>Dapatkan Data>Dari Azure>Dari Azure HDInsight(HDFS).
Excel 2013/2010
Pilih Power Query>Dari Azure>Dari Microsoft Azure HDInsight.
Nota: Jika Anda tidak melihat menu Power Query, bukaAdd-inOpsi>File>, dan pilih Add-in COM dari kotak Kelola drop-down di bagian bawah halaman. Pilih tombol Buka... dan verifikasi bahwa kotak untuk add-in Power Query untuk Excel telah dicentang.
Nota: Power Query juga memungkinkan Anda mengimpor data dari HDFS dengan memilih Dari Sumber Lain.
Dari dialog Azure HDInsight(HDFS), di kotak teks Nama akun atau URL , masukkan nama akun penyimpanan Azure Blob yang terkait dengan kluster Anda. Kemudian pilih OK. Akun ini dapat menjadi akun penyimpanan default atau akun penyimpanan tertaut. Formatnya adalah
https://StorageAccountName.blob.core.windows.net/.Untuk Kunci Akun, masukkan kunci untuk akun penyimpanan Blob, lalu pilih Sambungkan. (Anda perlu memasukkan informasi akun hanya saat pertama kali mengakses toko ini.)
Di panel Navigator di sebelah kiri Editor Kueri, klik dua kali nama kontainer penyimpanan Blob yang terkait dengan kluster Anda. Secara default, nama kontainer adalah nama yang sama dengan nama kluster.
Temukan HiveSampleData.txt di kolom Nama (jalur folder adalah .. /hive/warehouse/hivesampletable/), lalu pilih Biner di sebelah kiri HiveSampleData.txt. HiveSampleData.txt datang dengan seluruh kluster. Secara opsional, Anda dapat menggunakan file Anda sendiri.
Jika mau, Anda bisa mengganti nama kolom. Saat Anda siap, pilih Tutup & Muat. Data telah dimuat ke buku kerja Anda:
Langkah berikutnya
Dalam artikel ini, Anda mempelajari cara menggunakan Power Query untuk mengambil data dari HDInsight ke Excel. Demikian pula, Anda dapat mengambil data dari HDInsight ke Azure SQL Database. Anda juga dapat mengunggah data ke HDInsight. Untuk mempelajari selengkapnya, lihat artikel berikut ini:
- Memvisualisasikan data Apache Hive dengan Microsoft Power BI di Azure HDInsight.
- Visualisasikan data Interactive Query di Apache Hive dengan Power BI di Azure HDInsight.
- Menggunakan Apache Zeppelin untuk menjalankan kueri Apache Hive di Azure HDInsight.
- Menyambungkan Excel ke HDInsight dengan Microsoft Hive ODBC Driver.
- Sambungkan ke Microsoft Azure HDInsight dan jalankan kueri Apache Hive menggunakan Alat Data Lake untuk Visual Studio.
- Gunakan Azure HDInsight Tool untuk Visual Studio Code.
- Unggah data ke HDInsight.