你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

使用企业安全性套餐为 HDInsight 中的 Spark SQL 配置 Apache Ranger 策略

本文介绍了如何在 HDInsight 中使用企业安全性套餐为 Spark SQL 配置 Apache Ranger 策略。

在本文中，学习如何：

先决条件

在浏览器中，使用 URL https://ClusterName.azurehdinsight.net/Ranger/连接到 Ranger 管理用户界面。

将ClusterName更改为 Spark 群集的名称。
使用 Microsoft Entra 管理员凭据登录。 Microsoft Entra 管理员凭据与 HDInsight 群集凭据或 Linux HDInsight 节点安全外壳 (SSH) 凭据不同。

若要了解如何创建 sparkuser 域用户，请参阅创建具有 ESP 的 HDInsight 群集。在生产场景中，域用户来自 Microsoft Entra 租户。

在此部分中，需要创建两个 Ranger 策略：

以下示例演示了如何创建策略来屏蔽列：

输入以下值：

打开 Zeppelin 笔记本，并运行以下命令来验证策略：

     %sql
     select clientId, deviceMake from hivesampletable;

注意

默认情况下，Hive 和 Spark SQL 的策略在 Ranger 中很常见。

以下场景探讨了使用新的 Ranger 数据库和现有 Ranger 数据库创建 HDInsight 5.1 Spark 群集的准则。

使用新的 Ranger 数据库创建群集时，将在 Ranger 数据库的 Hadoop SQL 服务中使用名称hive_and_spark创建包含 Hive 和 Spark 的 Ranger 策略的相关 Ranger 存储库。

如果编辑策略，它们将同时应用于 Hive 和 Spark。

请考虑以下几点：

使用现有的 Ranger 数据库创建 HDI 5.1 群集时，会在此数据库上再次新建 Ranger 存储库，新群集的名称采用此格式：hive_and_spark。

假设你已经在 Hadoop SQL 服务中的现有 Ranger 数据库上使用oldclustername_hive名称在 Ranger 存储库中定义了策略。你想要在新的 HDInsight 5.1 Spark 群集中共享相同的策略。要实现此目标，请使用以下步骤。

注意

拥有 Ambari 管理员权限的用户可以执行配置更新。

从新的 HDInsight 5.1 群集打开 Ambari UI。
转到Spark3服务，然后转到配置。
打开高级 ranger-spark-security配置。

或者，还可以使用 SSH 在 /etc/spark3/conf 中打开此配置。

编辑两个配置（ranger.plugin.spark.service.name和ranger.plugin.spark.policy.cache.dir）以指向旧策略存储库oldclustername_hive，然后保存配置。

Ambari：

XML 文件：
从 Ambari 重启 Ranger 和 Spark 服务。
打开 Ranger 管理员 UI，然后单击 HADOOP SQL 服务下的“编辑”按钮。
对于 oldclustername_hive 服务，请在 policy.download.auth.users 和 tag.download.auth.users 列表中添加 rangersparklookup 用户，然后单击“保存”。