Mengonfigurasi kebijakan Apache Hive di HDInsight dengan Paket Keamanan Perusahaan
Pelajari cara mengonfigurasi kebijakan Apache Ranger untuk Apache Hive. Pada artikel ini, Anda akan membuat dua kebijakan Ranger untuk membatasi akses ke hivesampletable. Hivesampletable dilengkapi dengan kluster Microsoft Azure HDInsight. Setelah mengonfigurasi kebijakan, Anda akan menggunakan driver Excel dan ODBC untuk menghubungkan ke tabel Apache Hive di Microsoft Azure HDInsight.
Prasyarat
- Kluster Microsoft Azure HDInsight dengan Enterprise Security Package. Lihat Mengonfigurasi kluster Microsoft Azure HDInsight dengan ESP.
- Stasiun kerja dengan aplikasi Microsoft 365 untuk perusahaan, Office 2016, Office 2013 Professional Plus, Excel 2013 Standalone, atau Office 2010 Professional Plus.
Menghubungkan ke Antarmuka Pengguna Admin Apache Ranger
Cara menghubungkan ke Antarmuka Pengguna Admin Ranger
Dari browser, navigasikan ke Antarmuka Pengguna Admin Ranger di
https://CLUSTERNAME.azurehdinsight.net/Ranger/
dengan CLUSTERNAME-nya adalah nama kluster Anda.Catatan
Ranger menggunakan info masuk yang berbeda dari kluster Apache Hadoop. Untuk mencegah browser menggunakan info masuk Hadoop yang disimpan dalam cache, gunakan jendela browser InPrivate baru untuk menghubungkan ke Antarmuka Pengguna Admin Ranger.
Masuk menggunakan nama pengguna dan kata sandi domain administrator kluster:
Saat ini, Ranger hanya bekerja dengan Yarn dan Apache Hive.
Membuat pengguna domain
Lihat Membuat kluster Microsoft Azure HDInsight dengan ESP, untuk informasi tentang cara membuat hiveruser1 dan hiveuser2. Anda menggunakan dua akun pengguna di artikel ini.
Membuat kebijakan Ranger
Di bagian ini, Anda akan membuat dua kebijakan Ranger untuk mengakses hivesampletable. Anda akan memberikan izin pilih pada kumpulan kolom yang berbeda. Kedua pengguna dibuat menggunakan Membuat kluster Microsoft Azure HDInsight dengan ESP. Di bagian berikutnya, Anda akan menguji dua kebijakan tersebut di Excel.
Cara membuat kebijakan Ranger
Buka Antarmuka Pengguna Admin Ranger. Lihat Menghubungkan ke Antarmuka Pengguna Admin Ranger.
Pilih CLUSTERNAME_Hive, di bawah Apache Hive. Anda akan melihat dua kebijakan pra-konfigurasi.
Pilih Tambahkan Kebijakan Baru, lalu masukkan nilai berikut:
Properti Nilai Nama Kebijakan read-hivesampletable-all Database Apache Hive default tabel hivesampletable Kolom Apache Hive * Pilih Pengguna hiveuser1 Izin pilih .
Catatan
Jika pengguna domain tidak diisi di Pilih Pengguna, tunggu beberapa saat sampai Ranger melakukan sinkronisasi dengan Azure Active Directory.
Pilih Tambahkan untuk menyimpan kebijakan.
Ulangi dua langkah terakhir untuk membuat kebijakan lain dengan properti berikut ini:
Properti Nilai Nama Kebijakan read-hivesampletable-devicemake Database Apache Hive default tabel hivesampletable Kolom Apache Hive clientid, devicemake Pilih Pengguna hiveuser2 Izin pilih
Membuat sumber data ODBC Apache Hive
Instruksi dapat ditemukan di Membuat sumber data ODBC Apache Hive.
Properti | Deskripsi |
---|---|
Nama Sumber Data | Memberi nama untuk sumber data |
Host | Masukkan CLUSTERNAME.azurehdinsight.net. Misalnya, myHDICluster.azurehdinsight.net |
Port | Gunakan 443. (Port ini telah diubah dari 563 menjadi 443.) |
Database | Gunakan Default. |
Jenis Server Apache Hive | Pilih Apache Hive Server 2 |
Mekanisme | Pilih Layanan Microsoft Azure HDInsight |
Jalur HTTP | Biarkan kosong. |
Nama Pengguna | Masukkan hiveuser1@contoso158.onmicrosoft.com. Perbarui nama domain jika nama domain-nya berbeda. |
Kata sandi | Masukkan kata sandi untuk hiveuser1. |
Pastikan untuk mengeklik Uji sebelum menyimpan sumber data.
Mengimpor data ke Excel dari Microsoft Azure HDInsight
Di bagian terakhir, Anda telah mengonfigurasi dua kebijakan. hiveuser1 memiliki izin pilih pada semua kolom, dan hiveuser2 memiliki izin pilih pada dua kolom. Di bagian ini, Anda akan meniru dua pengguna untuk mengimpor data ke Excel.
Buka buku kerja baru atau yang sudah ada di Excel.
Dari tab Data, navigasikan ke Dapatkan Data>Dari Sumber Data Lain>Dari ODBC untuk meluncurkan jendela Dari ODBC.
Dari daftar tarik-turun, pilih nama sumber data yang Anda buat di bagian terakhir lalu pilih OK.
Untuk penggunaan pertama, dialog driver ODBC akan terbuka. Pilih Windows dari menu di sebelah kiri. Kemudian pilih Hubungkan untuk membuka jendela Navigator.
Tunggu hingga dialog Pilih Database dan Tabel terbuka. Ini dapat memakan waktu beberapa detik.
Pilih hivesampletable, lalu pilih Berikutnya.
Pilih Selesai.
Dalam dialog Impor Data, Anda dapat mengubah atau menentukan kueri. Untuk melakukannya, pilih Properti. Ini dapat memakan waktu beberapa detik.
Pilih tab Definisi. Teks perintahnya adalah:
SELECT * FROM "HIVE"."default"."hivesampletable"`
Berdasarkan kebijakan Ranger yang Anda tentukan, hiveuser1 memiliki izin pilih di semua kolom. Jadi kueri ini berfungsi dengan info masuk hiveuser1, tetapi kueri ini tidak berfungsi dengan info masuk hiveuser2.
Pilih OK untuk menutup dialog Properti Koneksi.
Pilih OK untuk menutup dialog Impor Data.
Masukkan kembali kata sandi untuk hiveuser1, lalu klik OK. Diperlukan waktu beberapa detik sebelum data diimpor ke Excel. Setelah selesai, Anda akan melihat 11 kolom data.
Untuk menguji kebijakan kedua (read-hivesampletable-devicemake), Anda telah membuat di bagian terakhir
Tambahkan lembar baru di Excel.
Ikuti prosedur terakhir untuk mengimpor data. Satu-satunya perubahan yang Anda buat adalah menggunakan info masuk hiveuser2, bukan info masuk hiveuser1. Ini gagal karena hiveuser2 hanya memiliki izin untuk melihat dua kolom. Anda akan mendapatkan kesalahan berikut:
[Microsoft][HiveODBC] (35) Error from Hive: error code: '40000' error message: 'Error while compiling statement: FAILED: HiveAccessControlException Permission denied: user [hiveuser2] does not have [SELECT] privilege on [default/hivesampletable/clientid,country ...]'.
Ikuti prosedur yang sama untuk mengimpor data. Kali ini, gunakan info masuk hiveuser2 dan ubah juga pernyataan pilih dari:
SELECT * FROM "HIVE"."default"."hivesampletable"
ke:
SELECT clientid, devicemake FROM "HIVE"."default"."hivesampletable"
Setelah selesai, Anda akan melihat dua kolom data yang diimpor.
Langkah berikutnya
- Untuk mengonfigurasi kluster Microsoft Azure HDInsight dengan Enterprise Security Package, lihat Mengonfigurasi kluster Microsoft Azure HDInsight dengan ESP.
- Untuk mengelola kluster Microsoft Azure HDInsight dengan ESP, lihat Mengelola kluster Microsoft Azure HDInsight dengan ESP.
- Untuk menjalankan kueri Apache Hive menggunakan SSH di kluster Microsoft Azure HDInsight dengan ESP, lihat Menggunakan SSH dengan Microsoft Azure HDInsight.
- Untuk Menghubungkan Apache Hive menggunakan Hive JDBC, lihat Menghubungkan ke Apache Hive di Microsoft Azure HDInsight menggunakan driver Hive JDBC
- Untuk menghubungkan Excel ke Hadoop menggunakan Hive ODBC, lihat Menghubungkan Excel ke Apache Hadoop dengan drive Microsoft Hive ODBC
- Untuk menghubungkan Excel ke Hadoop menggunakan Power Query, lihat Menghubungkan Excel ke Apache Hadoop dengan menggunakan Power Query