Краткое руководство. Интерактивное обработка данных с помощью Apache Spark в Машинное обучение Azure

Для обработки интерактивных Машинное обучение Azure обработки данных записной книжки Машинное обучение Azure интеграция с Azure Synapse Analytics обеспечивает простой доступ к платформе Apache Spark. Этот доступ позволяет Машинное обучение Azure интерактивные данные записной книжки.

В этом кратком руководстве описано, как выполнять интерактивные обработки данных с помощью Машинное обучение Azure бессерверных вычислений Spark, учетной записи хранения Azure Data Lake служба хранилища (ADLS) 2-го поколения и сквозного руководства пользователя.

Необходимые компоненты

Хранение учетных данных учетной записи хранения Azure в качестве секретов в Azure Key Vault

Для хранения учетных данных учетной записи хранения Azure в качестве секретов в Azure Key Vault с помощью пользовательского интерфейса портал Azure:

  1. Перейдите в Azure Key Vault в портал Azure

  2. Выбор секретов на левой панели

  3. Выберите + Создать или импортировать.

    Снимок экрана: вкладка

  4. На экране "Создание секрета" введите имя для создаваемого секрета.

  5. Перейдите к учетной записи Хранилище BLOB-объектов Azure в портал Azure, как показано на этом рисунке:

    Снимок экрана: ключ доступа Azure и экран строка подключения значений.

  6. Выбор ключей доступа на панели слева на странице "Учетная запись Хранилище BLOB-объектов Azure"

  7. Нажмите кнопку "Показать рядом с ключом 1", а затем скопируйте в буфер обмена , чтобы получить ключ доступа к учетной записи хранения

    Примечание.

    Выбор соответствующих параметров для копирования

    • Маркеры подписанного URL-адреса контейнера хранилища BLOB-объектов Azure
    • Учетные данные субъекта-службы учетной записи хранения Azure Data Lake служба хранилища (ADLS) 2-го поколения
      • идентификатор клиента
      • идентификатор клиента и
      • secret

    в соответствующих пользовательских интерфейсах при создании секретов Azure Key Vault для них

  8. Вернитесь к экрану "Создание секрета"

  9. В текстовом поле "Секретное значение" введите учетные данные ключа доступа для учетной записи хранения Azure, скопированной в буфер обмена на предыдущем шаге.

  10. Нажмите кнопку Создать

    Снимок экрана: экран создания секрета Azure.

Совет

Клиентская библиотека секретов Azure CLI и Azure Key Vault для Python также могут создавать секреты Azure Key Vault.

Добавление назначений ролей в учетные записи хранения Azure

Перед началом интерактивной обработки данных необходимо убедиться, что пути входных и выходных данных доступны. Во-первых, для

  • Удостоверение пользователя сеанса Notebooks, вошедшего в систему пользователя

    or

  • субъект-служба

назначьте роли читателя и служба хранилища ролей чтения данных BLOB-объектов идентификатору пользователя, вошедшего в систему. Однако в некоторых сценариях может потребоваться записать входящие данные обратно в учетную запись хранения Azure. Роли чтения и служба хранилища чтения данных BLOB-объектов предоставляют доступ только для чтения к удостоверению пользователя или субъекту-службе. Чтобы включить доступ на чтение и запись, назначьте участнику и служба хранилища роли участника данных BLOB-объектов удостоверению пользователя или субъекту-службе. Чтобы назначить соответствующие роли удостоверению пользователя, выполните следующие действия.

  1. Откройте microsoft портал Azure

  2. Поиск и выбор службы учетных записей служба хранилища

    Развернутый снимок экрана, на котором показан поиск и выбор служб служба хранилища учетных записей в Microsoft портал Azure.

  3. На странице учетных записей служба хранилища выберите учетную запись хранения Azure Data Lake служба хранилища (ADLS) 2-го поколения из списка. Откроется страница с обзором учетной записи хранения

    Развернутый снимок экрана, на котором показан выбор учетной записи хранения azure Data Lake служба хранилища (ADLS) 2-го поколения служба хранилища.

  4. Выберите контроль доступа (IAM) на левой панели

  5. Добавить назначение ролей

    Снимок экрана: экран ключей доступа Azure.

  6. Поиск и выбор роли служба хранилища участник данных BLOB-объектов

  7. Выберите Далее

    Снимок экрана: экран добавления ролей Azure.

  8. Выбор пользователя, группы или субъекта-службы

  9. Выбор и выбор элементов

  10. Поиск удостоверения пользователя под кнопкой "Выбрать"

  11. Выберите удостоверение пользователя из списка, чтобы оно отображалось в разделе "Выбранные члены"

  12. Выберите соответствующее удостоверение пользователя

  13. Выберите Далее

    Снимок экрана, на котором показана вкладка

  14. Выбор проверки и назначения

    Снимок экрана: просмотр экрана назначения ролей и вкладка

  15. Повторите шаги 2–13 для назначения роли участника

После назначения удостоверений пользователя данные в учетной записи хранения Azure должны стать доступными.

Примечание.

Если подключенный пул Synapse Spark указывает на пул Synapse Spark в рабочей области Azure Synapse, которая связана с ней, необходимо настроить управляемую частную конечную точку в учетной записи хранения, чтобы обеспечить доступ к данным.

Обеспечение доступа к ресурсам для заданий Spark

Для доступа к данным и другим ресурсам задания Spark могут использовать управляемое удостоверение или сквозное руководство пользователя. В следующей таблице приведены различные механизмы доступа к ресурсам при использовании Машинное обучение Azure бессерверных вычислений Spark и присоединенного пула Synapse Spark.

Пул Spark Поддерживаемые удостоверения Удостоверение по умолчанию
Бессерверные вычисления Spark Удостоверение пользователя, назначаемое пользователем управляемое удостоверение, присоединенное к рабочей области Удостоверение пользователя
Присоединенный пул Synapse Spark Удостоверение пользователя, назначаемое пользователем управляемое удостоверение, присоединенное к подключенному пулу Synapse Spark, назначаемое системой управляемое удостоверение подключенного пула Synapse Spark Назначаемое системой управляемое удостоверение подключенного пула Synapse Spark

Если код интерфейса командной строки или пакета SDK определяет возможность использования управляемого удостоверения, Машинное обучение Azure бессерверные вычисления Spark используют управляемое удостоверение, назначаемое пользователем, подключенное к рабочей области. Управляемое удостоверение, назначаемое пользователем, можно подключить к существующей рабочей области Машинное обучение Azure с помощью интерфейса командной строки Машинное обучение Azure версии 2 или с ARMClientпомощью.

Следующие шаги