Общие сведения о хранилище кластера
Внимание
Эта функция в настоящее время доступна для предварительного ознакомления. Дополнительные условия использования для предварительных версий Microsoft Azure включают более юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в статье Azure HDInsight в предварительной версии AKS. Для вопросов или предложений функций отправьте запрос на AskHDInsight с подробными сведениями и следуйте за нами для получения дополнительных обновлений в сообществе Azure HDInsight.
Azure HDInsight в AKS может легко интегрироваться с служба хранилища Azure, что является решением для хранения общего назначения, которое хорошо работает со многими другими службами Azure. Azure Data Lake Storage 2-го поколения (ADLS 2-го поколения) — это файловая система по умолчанию для кластеров.
Учетная запись хранения может использоваться в качестве расположения по умолчанию для данных, журналов кластера и других выходных данных, создаваемых во время операции кластера. Он также может быть хранилищем по умолчанию для каталога Hive, зависящее от типа кластера.
Общие сведения об Azure Data Lake Storage 2-го поколения см. в этой статье.
Управляемые удостоверения для безопасного доступа к файлам
Azure HDInsight в AKS использует управляемые удостоверения (MSI) для защиты доступа к файлам в Azure Data Lake Storage 2-го поколения. Управляемое удостоверение — это функция идентификатора Microsoft Entra, который предоставляет службам Azure набор автоматически управляемых учетных данных. Эти учетные данные можно использовать для аутентификации в любой службе, которая поддерживает аутентификацию Active Directory. Кроме того, управляемые удостоверения не требуют хранения учетных данных в файлах кода или конфигурации.
В Azure HDInsight в AKS после выбора управляемого удостоверения и хранилища во время создания кластера управляемое удостоверение может легко работать с хранилищем для управления данными, если служба хранилища роль владельца данных BLOB-объектов назначается назначаемой пользователем MSI.
В следующей таблице описаны поддерживаемые параметры хранения для Azure HDInsight в AKS (общедоступная предварительная версия):
Тип кластера | Поддерживаемые служба хранилища | Connection | Роль в служба хранилища |
---|---|---|---|
Trino, Apache Flink и Apache Spark | ADLS 2-го поколения | Управляемое удостоверение, назначаемое пользователем кластера (MSI) | Назначаемая пользователем MSI должна иметь служба хранилища роль владельца данных BLOB-объектов в учетной записи хранения. |
Примечание.
Чтобы предоставить общий доступ к учетной записи хранения в нескольких кластерах, можно просто назначить соответствующий назначаемый пользователем кластер MSI "служба хранилища владелец данных BLOB-объектов" в общей учетной записи хранения. Узнайте, как назначить роль.
После этого можно использовать полный путь к хранилищу abfs://
для доступа к данным через приложения.
Дополнительные сведения см. в статье об управляемых удостоверениях для ресурсов Azure.
Узнайте, как создать учетную запись ADLS 2-го поколения.
Архитектура хранилища AKS в Azure HDInsight
На следующей схеме представлено абстрактное представление архитектуры Azure HDInsight в архитектуре AKS служба хранилища Azure.
Управление хранилищем
В настоящее время Azure HDInsight в AKS не поддерживает учетные записи хранения с включенным обратимым удалением, убедитесь, что вы отключите обратимое удаление для учетной записи хранения.