Mengonfigurasi kebijakan Apache Hive di HDInsight dengan Paket Keamanan Perusahaan

Pelajari cara mengonfigurasi kebijakan Apache Ranger untuk Apache Hive. Pada artikel ini, Anda akan membuat dua kebijakan Ranger untuk membatasi akses ke hivesampletable. Hivesampletable dilengkapi dengan kluster Microsoft Azure HDInsight. Setelah mengonfigurasi kebijakan, Anda akan menggunakan driver Excel dan ODBC untuk menghubungkan ke tabel Apache Hive di Microsoft Azure HDInsight.

Prasyarat

  • Kluster Microsoft Azure HDInsight dengan Enterprise Security Package. Lihat Mengonfigurasi kluster Microsoft Azure HDInsight dengan ESP.
  • Stasiun kerja dengan aplikasi Microsoft 365 untuk perusahaan, Office 2016, Office 2013 Professional Plus, Excel 2013 Standalone, atau Office 2010 Professional Plus.

Menghubungkan ke Antarmuka Pengguna Admin Apache Ranger

Cara menghubungkan ke Antarmuka Pengguna Admin Ranger

  1. Dari browser, navigasikan ke Antarmuka Pengguna Admin Ranger di https://CLUSTERNAME.azurehdinsight.net/Ranger/ dengan CLUSTERNAME-nya adalah nama kluster Anda.

    Catatan

    Ranger menggunakan info masuk yang berbeda dari kluster Apache Hadoop. Untuk mencegah browser menggunakan info masuk Hadoop yang disimpan dalam cache, gunakan jendela browser InPrivate baru untuk menghubungkan ke Antarmuka Pengguna Admin Ranger.

  2. Masuk menggunakan nama pengguna dan kata sandi domain administrator kluster:

    HDInsight ESP Ranger home page

    Saat ini, Ranger hanya bekerja dengan Yarn dan Apache Hive.

Membuat pengguna domain

Lihat Membuat kluster Microsoft Azure HDInsight dengan ESP, untuk informasi tentang cara membuat hiveruser1 dan hiveuser2. Anda menggunakan dua akun pengguna di artikel ini.

Membuat kebijakan Ranger

Di bagian ini, Anda akan membuat dua kebijakan Ranger untuk mengakses hivesampletable. Anda akan memberikan izin pilih pada kumpulan kolom yang berbeda. Kedua pengguna dibuat menggunakan Membuat kluster Microsoft Azure HDInsight dengan ESP. Di bagian berikutnya, Anda akan menguji dua kebijakan tersebut di Excel.

Cara membuat kebijakan Ranger

  1. Buka Antarmuka Pengguna Admin Ranger. Lihat Menghubungkan ke Antarmuka Pengguna Admin Ranger.

  2. Pilih CLUSTERNAME_Hive, di bawah Apache Hive. Anda akan melihat dua kebijakan pra-konfigurasi.

  3. Pilih Tambahkan Kebijakan Baru, lalu masukkan nilai berikut:

    Properti Nilai
    Nama Kebijakan read-hivesampletable-all
    Database Apache Hive default
    tabel hivesampletable
    Kolom Apache Hive *
    Pilih Pengguna hiveuser1
    Izin pilih

    HDInsight ESP Ranger Hive policies configure .

    Catatan

    Jika pengguna domain tidak diisi di Pilih Pengguna, tunggu beberapa saat sampai Ranger melakukan sinkronisasi dengan Azure Active Directory.

  4. Pilih Tambahkan untuk menyimpan kebijakan.

  5. Ulangi dua langkah terakhir untuk membuat kebijakan lain dengan properti berikut ini:

    Properti Nilai
    Nama Kebijakan read-hivesampletable-devicemake
    Database Apache Hive default
    tabel hivesampletable
    Kolom Apache Hive clientid, devicemake
    Pilih Pengguna hiveuser2
    Izin pilih

Membuat sumber data ODBC Apache Hive

Instruksi dapat ditemukan di Membuat sumber data ODBC Apache Hive.

Properti Deskripsi
Nama Sumber Data Memberi nama untuk sumber data
Host Masukkan CLUSTERNAME.azurehdinsight.net. Misalnya, myHDICluster.azurehdinsight.net
Port Gunakan 443. (Port ini telah diubah dari 563 menjadi 443.)
Database Gunakan Default.
Jenis Server Apache Hive Pilih Apache Hive Server 2
Mekanisme Pilih Layanan Microsoft Azure HDInsight
Jalur HTTP Biarkan kosong.
Nama Pengguna Masukkan hiveuser1@contoso158.onmicrosoft.com. Perbarui nama domain jika nama domain-nya berbeda.
Kata sandi Masukkan kata sandi untuk hiveuser1.

Pastikan untuk mengeklik Uji sebelum menyimpan sumber data.

Mengimpor data ke Excel dari Microsoft Azure HDInsight

Di bagian terakhir, Anda telah mengonfigurasi dua kebijakan. hiveuser1 memiliki izin pilih pada semua kolom, dan hiveuser2 memiliki izin pilih pada dua kolom. Di bagian ini, Anda akan meniru dua pengguna untuk mengimpor data ke Excel.

  1. Buka buku kerja baru atau yang sudah ada di Excel.

  2. Dari tab Data, navigasikan ke Dapatkan Data>Dari Sumber Data Lain>Dari ODBC untuk meluncurkan jendela Dari ODBC.

    Open data connection wizard

  3. Dari daftar tarik-turun, pilih nama sumber data yang Anda buat di bagian terakhir lalu pilih OK.

  4. Untuk penggunaan pertama, dialog driver ODBC akan terbuka. Pilih Windows dari menu di sebelah kiri. Kemudian pilih Hubungkan untuk membuka jendela Navigator.

  5. Tunggu hingga dialog Pilih Database dan Tabel terbuka. Ini dapat memakan waktu beberapa detik.

  6. Pilih hivesampletable, lalu pilih Berikutnya.

  7. Pilih Selesai.

  8. Dalam dialog Impor Data, Anda dapat mengubah atau menentukan kueri. Untuk melakukannya, pilih Properti. Ini dapat memakan waktu beberapa detik.

  9. Pilih tab Definisi. Teks perintahnya adalah:

    SELECT * FROM "HIVE"."default"."hivesampletable"`
    

    Berdasarkan kebijakan Ranger yang Anda tentukan, hiveuser1 memiliki izin pilih di semua kolom. Jadi kueri ini berfungsi dengan info masuk hiveuser1, tetapi kueri ini tidak berfungsi dengan info masuk hiveuser2.

  10. Pilih OK untuk menutup dialog Properti Koneksi.

  11. Pilih OK untuk menutup dialog Impor Data.

  12. Masukkan kembali kata sandi untuk hiveuser1, lalu klik OK. Diperlukan waktu beberapa detik sebelum data diimpor ke Excel. Setelah selesai, Anda akan melihat 11 kolom data.

Untuk menguji kebijakan kedua (read-hivesampletable-devicemake), Anda telah membuat di bagian terakhir

  1. Tambahkan lembar baru di Excel.

  2. Ikuti prosedur terakhir untuk mengimpor data. Satu-satunya perubahan yang Anda buat adalah menggunakan info masuk hiveuser2, bukan info masuk hiveuser1. Ini gagal karena hiveuser2 hanya memiliki izin untuk melihat dua kolom. Anda akan mendapatkan kesalahan berikut:

    [Microsoft][HiveODBC] (35) Error from Hive: error code: '40000' error message: 'Error while compiling statement: FAILED: HiveAccessControlException Permission denied: user [hiveuser2] does not have [SELECT] privilege on [default/hivesampletable/clientid,country ...]'.
    
  3. Ikuti prosedur yang sama untuk mengimpor data. Kali ini, gunakan info masuk hiveuser2 dan ubah juga pernyataan pilih dari:

    SELECT * FROM "HIVE"."default"."hivesampletable"
    

    ke:

    SELECT clientid, devicemake FROM "HIVE"."default"."hivesampletable"
    

    Setelah selesai, Anda akan melihat dua kolom data yang diimpor.

Langkah berikutnya