Создание рабочей области Synapse
Из этого учебника вы узнаете, как создать рабочую область Synapse, выделенный пул SQL и бессерверный пул Apache Spark.
Предварительные требования
Чтобы выполнить все действия, описанные в этом учебнике, потребуется доступ к группе ресурсов, которой назначена роль Владелец. Создайте рабочую область Synapse в этой группе ресурсов.
Создание рабочей области Synapse на портале Azure
Начало процесса
- Откройте портал Azure, в строке поиска введите Synapse, но не нажимайте ВВОД.
- В поисковых результатах в разделе Службы выберите Azure Synapse Analytics.
- Щелкните Создать, чтобы создать рабочую область.
Вкладка "Основные сведения", раздел "Сведения о проекте"
Заполните следующие поля:
- Подписка: выберите любую подписку.
- Группа ресурсов: укажите любую группу ресурсов.
- Управляемая группа ресурсов: оставьте это поле пустым.
Вкладка "Основные сведения", раздел "Сведения о рабочей области"
Заполните следующие поля:
- Имя рабочей области: выберите любое глобально уникальное имя. В этом учебнике используется имя myworkspace.
- Регион. Выберите регион, в котором вы разместили свои клиентские приложения/службы (например, виртуальная машина Azure, Power BI, служба анализа Azure) и хранилища, содержащие данные (например, хранилище озера данных Azure, аналитическое хранилище Azure Cosmos DB).
Примечание
Рабочая область, не связанная с клиентскими приложениями или хранилищем, может являться основной причиной множества проблем с производительностью. Если ваши данные или клиенты размещены в нескольких регионах, вы можете создавать отдельные рабочие области в разных регионах, размещенные вместе с вашими данными и клиентами.
В разделе Выбор Data Lake Storage 2-го поколения:
- В разделе Имя учетной записи выберите Создать новую и присвойте новой учетной записи хранения имя contosolake или аналогичное имя, так как оно должно быть уникальным.
- В разделе Имя файловой системы выберите Создать новую и присвойте файловой системе имя users. Будет создан контейнер хранилища с именем users. В рабочей области эта учетная запись хранения будет использоваться как основная для таблиц и журналов приложений Spark.
- Установите флажок, позволяющий назначить себе роль "Участник для данных BLOB-объектов хранилища" в учетной записи Data Lake Storage 2-го поколения.
Завершение процесса
Выберите команду Просмотреть и создать>Создать. Рабочая область будет готова через несколько минут.
Примечание
Сведения о том, как использовать функции рабочей области из существующего выделенного пула SQL (ранее — Хранилище данных SQL), см. здесь.
Открытие Synapse Studio
После создания рабочей области Azure Synapse можно открыть Synapse Studio двумя способами:
Откройте рабочую область Synapse на портале Azure и в ее разделе Обзор выберите элемент Открыть в поле Open Synapse Studio (Открыть Synapse Studio).
Перейдите по адресу
https://web.azuresynapse.net
и войдите в рабочую область.
Примечание
Для входа в рабочую область существует два метода выбора учетной записи. Один для подписки Azure, а другой для ручного ввода. При наличии роли Azure Synapse или ролей более высокого уровня вы можете использовать оба способа входа в рабочую область. Если у вас нет связанных ролей Azure и вам назначили роль RBAC в Synapse, ручной ввод является единственным способом входа в рабочую область. Дополнительные сведения о RBAC в Synapse см. в разделе Что такое управление доступом на основе ролей в Synapse (RBAC)?.
Размещение данных примера в основной учетной записи хранения
Мы будем использовать небольшой набор данных из 100 000 строк данных о такси Нью-Йорка для многих примеров в этом руководстве по началу работы. Мы начнем с его размещения в основной учетной записи хранения, созданной вами для рабочей области.
- Скачайте набор данных NYC Taxi - green trip на свой компьютер. Перейдите к исходному расположению набора данных по приведенной выше ссылке, выберите конкретный год и скачайте записи о поездках на такси green в формате Parquet.
- Переименуйте скачанный файл в NYCTripSmall.parquet.
- В Synapse Studio перейдите в центр данных.
- Выберите Связано.
- В категории Azure Data Lake Storage 2-го поколения вы увидите элемент с именем, например myworkspace (Primary - contosolake) .
- Выберите контейнер с именем users (Primary) .
- Щелкните Отправить и выберите скачанный вами файл
NYCTripSmall.parquet
.
После загрузки файла Parquet он доступен через два эквивалентных URI:
https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet
abfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet
В контексте примеров, приведенных в данном руководстве, не забудьте заменить contosolake в пользовательском интерфейсе именем основной учетной записи хранения, которую вы выбрали для своей рабочей области.