Konfigurieren von Apache Hive-Richtlinien in HDInsight mit dem Enterprise-Sicherheitspaket

Artikel
05/22/2024

In diesem Artikel erfahren Sie, wie Sie Apache Ranger-Richtlinien für Apache Hive konfigurieren. Hierzu werden zwei Ranger-Richtlinien erstellt, um den Zugriff auf hivesampletable einzuschränken. hivesampletable enthält HDInsight-Cluster. Nachdem Sie die Richtlinien konfiguriert haben, stellen Sie unter Verwendung von Excel und des ODBC-Treibers (Open Database Connectivity) eine Verbindung mit Hive-Tabellen in HDInsight her.

Voraussetzungen

Ein HDInsight-Cluster mit Enterprise-Sicherheitspaket (ESP). Weitere Informationen finden Sie unter Konfigurieren von HDInsight-Clustern für die Microsoft Entra-Integration mit dem Enterprise-Sicherheitspaket.
Eine Arbeitsstation mit Microsoft 365 Apps for Enterprise, Office 2016, Office 2013 Professional Plus, Excel 2013 Standalone oder Office 2010 Professional Plus.

Herstellen einer Verbindung mit der Administratorbenutzeroberfläche von Apache Ranger

So stellen Sie eine Verbindung mit der Administratorbenutzeroberfläche von Ranger her:

Navigieren Sie in einem Browser zur Administratoroberfläche von Ranger: https://CLUSTERNAME.azurehdinsight.net/Ranger/. (CLUSTERNAME entspricht hierbei dem Namen Ihres Clusters.)

Hinweis

Ranger verwendet andere Anmeldeinformationen als der Apache Hadoop-Cluster. Stellen Sie die Verbindung mit der Administratoroberfläche von Ranger in einem neuen InPrivate-Browserfenster her, um zu verhindern, dass der Browser zwischengespeicherte Hadoop-Anmeldeinformationen verwendet.
Melden Sie sich mit dem Domänenbenutzernamen und -kennwort des Clusteradministrators an:

Ranger kann derzeit nur mit Yarn und Hive verwendet werden.

Erstellen von Domänenbenutzern

Informationen zum Erstellen von hiveruser1 und hiveuser2 finden Sie unter Erstellen eines HDInsight-Clusters mit ESP. Diese beiden Benutzerkonten werden in diesem Artikel verwendet.

Erstellen von Ranger-Richtlinien

In diesem Abschnitt werden zwei Ranger-Richtlinien für den Zugriff auf hivesampletable erstellt. Sie erteilen für bestimmte Spaltengruppen die Berechtigung „Auswählen“. Beide Benutzer wurden wie unter Erstellen eines HDInsight-Clusters mit ESP beschrieben erstellt. Im nächsten Abschnitt werden die beiden Richtlinien in Excel getestet.

So erstellen Sie Ranger-Richtlinien:

Öffnen Sie die Ranger-Administratoroberfläche. Weitere Informationen finden Sie im vorherigen Abschnitt Herstellen einer Verbindung mit der Apache Ranger-Administratoroberfläche.
Wählen Sie unter Hive die Zeichenfolge CLUSTERNAME_Hive aus. Es werden zwei vorkonfigurierte Richtlinien angezeigt.
Wählen Sie Neue Richtlinie hinzufügen aus, und geben Sie die folgenden Werte ein:

Eigenschaft Wert

Richtlinienname read-hivesampletable-all

Hive-Datenbank default

table hivesampletable

Hive-Spalte *

Benutzer auswählen hiveuser1

Berechtigungen select

.

Hinweis

Sollte unter Benutzer auswählen kein Domänenbenutzer vorhanden sein, warten Sie kurz, bis Ranger mit Microsoft Entra ID synchronisiert wurde.
Wählen Sie Hinzufügen aus, um die Richtlinie zu speichern.

Eigenschaft	Wert
Richtlinienname	read-hivesampletable-all
Hive-Datenbank	default
table	hivesampletable
Hive-Spalte	*
Benutzer auswählen	hiveuser1
Berechtigungen	select

Wiederholen Sie die letzten beiden Schritte, um eine weitere Richtlinie mit folgenden Eigenschaften zu erstellen:

Eigenschaft	Wert
Richtlinienname	read-hivesampletable-devicemake
Hive-Datenbank	default
table	hivesampletable
Hive-Spalte	clientid, devicemake
Benutzer auswählen	hiveuser2
Berechtigungen	select

Erstellen einer Hive ODBC-Datenquelle

Eine Anleitung zum Erstellen einer Hive ODBC-Datenquelle finden Sie unter Erstellen einer Hive ODBC-Datenquelle.

Eigenschaft	BESCHREIBUNG
Datenquellenname	Geben Sie einen Namen für Ihre Datenquelle an.
Host	Geben Sie CLUSTERNAME.azurehdinsight.net ein. Verwenden Sie beispielsweise myHDICluster.azurehdinsight.net.
Port	Verwenden Sie 443. (Dieser Port hat sich von 563 in 443 geändert.)
Datenbank	Verwenden Sie Standard.
Hive-Servertyp	Wählen Sie Hive Server 2 aus.
Mechanismus	Wählen Sie Azure-HDInsight-Dienst aus.
HTTP-Pfad	Lassen Sie dieses Feld leer.
Benutzername	Geben Sie `hiveuser1@contoso158.onmicrosoft.com` ein. Aktualisieren Sie den Domänennamen, falls er abweicht.
Kennwort	Geben Sie das Kennwort für `hiveuser1` ein.

Wählen Sie Testen aus, bevor Sie die Datenquelle speichern.

Importieren von Daten aus HDInsight in Excel

Im letzten Abschnitt wurden zwei Richtlinien konfiguriert: hiveuser1 verfügt über die Auswahlberechtigung für alle Spalten, hiveuser2 über die Auswahlberechtigung für zwei Spalten. In diesem Abschnitt nehmen Sie die Identität der beiden Benutzer an, um Daten in Excel zu importieren.

Öffnen Sie eine neue oder bereits vorhandene Arbeitsmappe in Excel.
Navigieren Sie auf der Registerkarte Daten zu Daten abrufen>Aus anderen Quellen>Aus ODBC, um das Fenster Aus ODBC zu öffnen.
Wählen Sie in der Auswahlliste den im letzten Abschnitt erstellten Datenquellennamen und anschließend OK aus.
Bei der ersten Verwendung wird das Dialogfeld ODBC-Treiber geöffnet. Wählen Sie im Menü auf der linken Seite die Option Windows. Wählen Sie anschließend Verbinden, um das Fenster Navigator zu öffnen.
Warten Sie, bis das Select Database and Table Dialogfeld geöffnet ist. Dieser Schritt kann einige Zeit dauern.
Wählen Sie hivesampletable>Weiter aus.
Wählen Sie Fertig stellenaus.
Im Dialog Daten importieren können Sie die Abfrage ändern oder spezifizieren. Wählen Sie dazu Eigenschaften aus. Dieser Schritt kann einige Zeit dauern.
Wählen Sie die Registerkarte Definition aus. Befehlstext:
```
SELECT * FROM "HIVE"."default"."hivesampletable"`
```
Gemäß den definierten Ranger-Richtlinien verfügt hiveuser1 über die Auswahlberechtigung für alle Spalten. Diese Abfrage kann daher mit den Anmeldeinformationen für hiveuser1 verwendet werden, nicht aber mit den Anmeldeinformationen für hiveuser2.
Wählen Sie OK aus, um das Dialogfeld Verbindungseigenschaften zu schließen.
Wählen Sie OK aus, um das Dialogfeld Daten importieren zu schließen.
Geben Sie das Kennwort für hiveuser1 erneut ein, und wählen Sie anschließend OK aus. Es dauert ein paar Sekunden, bis die Daten in Excel importiert werden. Nach Abschluss des Vorgangs werden elf Datenspalten angezeigt.

So testen Sie die zweite Richtlinie (read-hivesampletable-devicemake), die Sie im vorherigen Abschnitt erstellt haben

Fügen Sie in Excel ein neues Arbeitsblatt ein.
Führen Sie das letzte Verfahren durch, um die Daten zu importieren. Die einzige Änderung besteht in der Verwendung der Anmeldeinformationen für hiveuser2 anstelle der Anmeldeinformationen für hiveuser1. Diese Aktion ist nicht erfolgreich, da hiveuser2 nur zum Anzeigen von zwei Spalten berechtigt ist. Sie erhalten den folgenden Fehler:
```
[Microsoft][HiveODBC] (35) Error from Hive: error code: '40000' error message: 'Error while compiling statement: FAILED: HiveAccessControlException Permission denied: user [hiveuser2] does not have [SELECT] privilege on [default/hivesampletable/clientid,country ...]'.
```
Führen Sie das gleiche Datenimportverfahren durch. Verwenden Sie diesmal die Anmeldeinformationen von hiveuser2, und ändern Sie auch die select-Anweisung:
```
SELECT * FROM "HIVE"."default"."hivesampletable"
```
In:
```
SELECT clientid, devicemake FROM "HIVE"."default"."hivesampletable"
```
Nach Abschluss des Vorgangs werden zwei Spalten mit importierten Daten angezeigt.

Nächste Schritte

Informationen zum Konfigurieren eines HDInsight-Clusters mit ESP finden Sie unter Konfigurieren von HDInsight-Clustern für die Microsoft Entra-Integration mit dem Enterprise-Sicherheitspaket.
Informationen zum Verwalten eines HDInsight-Clusters mit ESP finden Sie unter Verwalten von HDInsight-Clustern mit dem Enterprise-Sicherheitspaket.
Informationen zum Ausführen von Hive-Abfragen per Secure Shell (SSH) für HDInsight-Cluster mit ESP finden Sie unter In die Authentifizierungsdomäne eingebundenes HDInsight.
Informationen zum Verbinden von Hive unter Verwendung von Hive Java Database Connectivity (JDBC) finden Sie unter Abfragen von Apache Hive über den JDBC-Treiber in HDInsight.
Informationen zum Verbinden von Excel mit Hadoop unter Verwendung von Hive ODBC finden Sie unter Verbinden von Excel mit Apache Hadoop in Azure HDInsight mithilfe des Microsoft Hive ODBC-Treibers.
Informationen zum Verbinden von Excel mit Hadoop unter Verwendung von Power Query finden Sie unter Verbinden von Excel mit Apache Hadoop mithilfe von Power Query.

Freigeben über