Общие сведения о хранилище кластера

Внимание

Эта функция в настоящее время доступна для предварительного ознакомления. Дополнительные условия использования для предварительных версий Microsoft Azure включают более юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в статье Azure HDInsight в предварительной версии AKS. Для вопросов или предложений функций отправьте запрос на AskHDInsight с подробными сведениями и следуйте за нами для получения дополнительных обновлений в сообществе Azure HDInsight.

Azure HDInsight в AKS может легко интегрироваться с служба хранилища Azure, что является решением для хранения общего назначения, которое хорошо работает со многими другими службами Azure. Azure Data Lake Storage 2-го поколения (ADLS 2-го поколения) — это файловая система по умолчанию для кластеров.

Учетная запись хранения может использоваться в качестве расположения по умолчанию для данных, журналов кластера и других выходных данных, создаваемых во время операции кластера. Он также может быть хранилищем по умолчанию для каталога Hive, зависящее от типа кластера.

Общие сведения об Azure Data Lake Storage 2-го поколения см. в этой статье.

Управляемые удостоверения для безопасного доступа к файлам

Azure HDInsight в AKS использует управляемые удостоверения (MSI) для защиты доступа к файлам в Azure Data Lake Storage 2-го поколения. Управляемое удостоверение — это функция идентификатора Microsoft Entra, который предоставляет службам Azure набор автоматически управляемых учетных данных. Эти учетные данные можно использовать для аутентификации в любой службе, которая поддерживает аутентификацию Active Directory. Кроме того, управляемые удостоверения не требуют хранения учетных данных в файлах кода или конфигурации.

В Azure HDInsight в AKS после выбора управляемого удостоверения и хранилища во время создания кластера управляемое удостоверение может легко работать с хранилищем для управления данными, если служба хранилища роль владельца данных BLOB-объектов назначается назначаемой пользователем MSI.

В следующей таблице описаны поддерживаемые параметры хранения для Azure HDInsight в AKS (общедоступная предварительная версия):

Тип кластера Поддерживаемые служба хранилища Connection Роль в служба хранилища
Trino, Apache Flink и Apache Spark ADLS 2-го поколения Управляемое удостоверение, назначаемое пользователем кластера (MSI) Назначаемая пользователем MSI должна иметь служба хранилища роль владельца данных BLOB-объектов в учетной записи хранения.

Примечание.

Чтобы предоставить общий доступ к учетной записи хранения в нескольких кластерах, можно просто назначить соответствующий назначаемый пользователем кластер MSI "служба хранилища владелец данных BLOB-объектов" в общей учетной записи хранения. Узнайте, как назначить роль.

После этого можно использовать полный путь к хранилищу abfs:// для доступа к данным через приложения.

Дополнительные сведения см. в статье об управляемых удостоверениях для ресурсов Azure.
Узнайте, как создать учетную запись ADLS 2-го поколения.

Архитектура хранилища AKS в Azure HDInsight

На следующей схеме представлено абстрактное представление архитектуры Azure HDInsight в архитектуре AKS служба хранилища Azure.

Снимок экрана: архитектура хранилища.

Управление хранилищем

В настоящее время Azure HDInsight в AKS не поддерживает учетные записи хранения с включенным обратимым удалением, убедитесь, что вы отключите обратимое удаление для учетной записи хранения.

Снимок экрана: пользовательский интерфейс портала для обратимого удаления.