你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

快速入门:使用 Azure CLI 创建 Azure Synapse 工作区

Azure CLI 是 Azure 的命令行体验,用于管理 Azure 资源。 可以在浏览器中将它与 Azure Cloud Shell 配合使用。 也可将它安装在 macOS、Linux 或 Windows 上,然后从命令行运行它。

本快速入门介绍如何使用 Azure CLI 创建 Synapse 工作区。

如果没有 Azure 订阅,请在开始之前创建一个 Azure 免费帐户

先决条件

  • 下载并安装 jq,它是一种灵活的轻量级命令行 JSON 处理器

  • Azure Data Lake Storage Gen2 存储帐户

    重要

    Azure Synapse 工作区需要能够读取所选 ADLS Gen2 帐户以及向其写入内容。 此外,对于作为主存储帐户链接的任何存储帐户,在创建存储帐户时必须已启用“分层命名空间”,如创建存储帐户页面上所述。

使用 Azure CLI 创建 Azure Synapse 工作区

  1. 定义创建 Azure Synapse 工作区资源所必需的环境变量。

    环境变量名称 说明
    StorageAccountName 现有 ADLS Gen2 存储帐户的名称。
    StorageAccountResourceGroup 现有 ADLS Gen2 存储帐户资源组的名称。
    FileShareName 现有存储文件系统的名称。
    SynapseResourceGroup 为 Azure Synapse 资源组选择新名称。
    区域 选择其中一个 Azure 区域
    SynapseWorkspaceName 为新的 Azure Synapse 工作区选择唯一名称。
    SqlUser 为新用户名选择一个值。
    SqlPassword 选择安全密码。
  2. 创建资源组作为 Azure Synapse 工作区的容器:

    az group create --name $SynapseResourceGroup --location $Region
    
  3. 创建 Azure Synapse 工作区:

    az synapse workspace create \
      --name $SynapseWorkspaceName \
      --resource-group $SynapseResourceGroup \
      --storage-account $StorageAccountName \
      --file-system $FileShareName \
      --sql-admin-login-user $SqlUser \
      --sql-admin-login-password $SqlPassword \
      --location $Region
    
  4. 获取 Azure Synapse 工作区的 Web 和开发 URL:

    WorkspaceWeb=$(az synapse workspace show --name $SynapseWorkspaceName --resource-group $SynapseResourceGroup | jq -r '.connectivityEndpoints | .web')
    
    WorkspaceDev=$(az synapse workspace show --name $SynapseWorkspaceName --resource-group $SynapseResourceGroup | jq -r '.connectivityEndpoints | .dev')
    
  5. 创建防火墙规则以允许你从自己的计算机访问 Azure Synapse 工作区:

    ClientIP=$(curl -sb -H "Accept: application/json" "$WorkspaceDev" | jq -r '.message')
    ClientIP=${ClientIP##'Client Ip address : '}
    echo "Creating a firewall rule to enable access for IP address: $ClientIP"
    
    az synapse workspace firewall-rule create --end-ip-address $ClientIP --start-ip-address $ClientIP --name "Allow Client IP" --resource-group $SynapseResourceGroup --workspace-name $SynapseWorkspaceName
    
  6. 打开环境变量 WorkspaceWeb 中存储的 Azure Synapse 工作区 Web URL 地址以访问工作区:

    echo "Open your Azure Synapse Workspace Web URL in the browser: $WorkspaceWeb"
    

    Azure Synapse workspace web

  7. 部署完成后,需要额外的权限。

  • 在 Azure 门户中,将工作区的其他用户分配到工作区中的“参与者”角色。 有关详细步骤,请参阅使用 Azure 门户分配 Azure 角色
  • 使用 Synapse Studio 为其他用户分配相应的 Synapse RBAC 角色
  • Azure 存储帐户的所有者角色的成员必须将“存储 Blob 数据参与者”角色分配给 Azure Synapse 工作区 MSI 和其他用户。

清理资源

执行以下步骤,删除 Azure Synapse 工作区。

警告

如果删除 Azure Synapse 工作区,将一并删除分析引擎,还将删除存储在包含的 SQL 池和工作区元数据所在的数据库中的数据。 删除后,该工作区将无法再连接到 SQL 或 Apache Spark 终结点。 将删除所有代码项目(查询、笔记本、作业定义和管道)。

删除工作区不会影响链接到工作区的 Data Lake Store Gen2 中的数据。

如果要删除 Azure Synapse 工作区,请完成以下命令:

az synapse workspace delete --name $SynapseWorkspaceName --resource-group $SynapseResourceGroup

后续步骤

接下来,可以创建 SQL 池创建 Apache Spark 池,开始分析和探究你的数据。