Azure Databricks 入门
如果不熟悉 Azure Databricks,可以从这里开始。 本部分包括有关基本帐户设置的说明、Databricks 工作区 UI 导览,以及与 Azure Databricks 上的探索性数据分析和 ETL 相关的一些基本教程。
有关联机培训资源的信息,请参阅获取免费的 Databricks 培训。
Databricks 建议使用 Azure 门户部署第一个 Azure Databricks 工作区。 也可使用以下选项之一部署 Azure Databricks:
备注
创建 Azure Databricks 工作区时,可以选择“试用版(高级 - 14天免费 DBU)”定价层,让工作区访问免费的高级 Azure Databricks DBU 14 天。
- 必须具有不是免费试用版订阅的 Azure 订阅。 如果你有免费帐户,请完成以下步骤:
- 转到个人资料并将订阅更改为“即用即付”。 请参阅 Azure 免费帐户。
- 移除支出限制。
- 对你所在区域中的 vCPU 请求增加配额。
- 登录 Azure 门户。
若要创建 Azure Databricks 工作区,必须具有以下项之一:
具有订阅级别的 Azure“参与者”或“所有者”角色的用户。
具有具有以下权限列表的自定义角色定义的用户:
Microsoft.Databricks/workspaces/*
Microsoft.Resources/subscriptions/resourceGroups/read
Microsoft.Resources/subscriptions/resourceGroups/write
Microsoft.Databricks/accessConnectors/*
Microsoft.Compute/register/action
Microsoft.ManagedIdentity/register/action
Microsoft.Storage/register/action
Microsoft.Network/register/action
Microsoft.Resources/deployments/validate/action
Microsoft.Resources/deployments/write
Microsoft.Resources/deployments/read
备注
如果订阅中已注册这些提供程序,则不需要
Microsoft.Compute/register/action
、Microsoft.ManagedIdentity/register/action
、Microsoft.Storage/register/action
、Microsoft.Network/register/action
权限。 请参阅注册资源提供程序。
在 Azure 门户中,选择“创建资源”“分析”>“Azure Databricks”。
在“Azure Databricks 服务”下,提供所需的值以创建 Databricks 工作区。
Property 说明 工作区名称 提供 Databricks 工作区的名称 订阅 从下拉列表中选择自己的 Azure 订阅。 资源组 指定是要创建新的资源组还是使用现有的资源组。 资源组是用于保存 Azure 解决方案相关资源的容器。 有关详细信息,请参阅 Azure 资源组概述。 位置 选择“美国西部 2” 。 有关其他可用区域,请参阅各区域推出的 Azure 服务。 定价层 在“标准”、“高级”和“试用”之间进行选择。 有关这些层的详细信息,请参阅 Databricks 价格页。 选择“查看 + 创建”,然后选择“创建” 。 创建工作区需要几分钟时间。 创建工作区时,可以在“通知”中查看部署状态。 完成此过程后,你的用户帐户将自动添加为工作区的管理员用户。
备注
当工作区部署失败时,仍然会在失败状态下创建工作区。 删除失败的工作区,并创建一个解决部署错误的新工作区。 删除失败的工作区时,托管资源组和任何成功部署的资源也将被删除。
后续步骤取决于是要继续设置帐户组织和安全性,还是要开始构建数据管道:
将 Databricks 工作区连接到外部数据源。 请参阅连接到数据源。
将数据输入工作区。 请参阅将数据引入 Azure Databricks 湖屋。
将数据载入 Databricks SQL 中的工作区。 请参阅 在 Databricks SQL 中使用流式处理表加载数据。
了解如何管理对工作区中数据的访问。 请参阅什么是 Unity Catalog?。
了解如何管理对工作区对象的访问,如笔记本、计算、仪表板和查询。 请参阅访问控制列表。
如果你对设置 Azure Databricks 有任何疑问并需要获取实时帮助,请发送电子邮件至 onboarding-help@databricks.com。
如果你的组织没有订阅 Azure Databricks 支持,或者你不是贵公司支持订阅的授权联系人,可以在 Azure Databricks 办公时间或从 Azure Databricks 社区获取许可问题的答案。
如果需要其他帮助,请注册每周实时演示,以便向 Azure Databricks 专家一起提问,并和专家一起进行练习。 也可参阅这个有关管理和维护环境的最佳做法的博客系列。