本文介绍如何从交互式笔记本、计划作业和作业 API 连接到 AI 运行时。
交互式(笔记本)
这是使用 AI 运行时的主要方法。 连接笔记本并配置环境:
- 在笔记本中,单击顶部的 “连接 ”下拉菜单,然后选择 “无服务器 GPU”。
- 单击
打开 “环境 ”侧面板。
- 从“加速器”字段中选择 A10 或 H100。
- 为默认环境选择“无”,或者从“基础环境”字段中为 AI 环境选择“AIv4”。
- 单击“ 应用 ”,然后 确认 要将 AI 运行时应用到笔记本环境。
注释
计算连接将在非活动状态持续60分钟后自动终止。
小窍门
对于不需要 GPU 的操作(例如克隆 Git 存储库、转换数据格式或探索性数据分析),请将笔记本附加到 CPU 群集以保留 GPU 资源。
作业(计划)
可以将使用无服务器 GPU 的笔记本调度为定期作业。 有关更多详细信息,请参阅 “创建和管理计划笔记本作业 ”。
打开要使用的笔记本后:
- 选择右上角的 “计划 ”按钮。
- 选择 “添加计划”。
- 使用作业名称、计划和计算填充“新建计划”窗体。
- 选择 创建。
还可以从 作业和管道 UI 创建和计划作业。 有关分步指南,请参阅 “创建新作业 ”。
注释
无法在无服务器的 GPU 调度作业中使用 “环境” 面板添加依赖。 必须在笔记本中以编程方式安装依赖项(例如)。 %pip install 不支持自动恢复 — 如果作业由于包不兼容而失败,则必须手动修复并重新运行。 对于可能超过 7 天最大运行时长的工作负载,请实现手动检查点以便恢复。
作业 API 和 Databricks 资产捆绑包
可以使用 Databricks 作业 API 或 Databricks 资产捆绑包以编程方式创建和管理 AI 运行时作业。 在作业或捆绑定义中将计算类型配置为无服务器 GPU,以自动执行部署管道。
以下示例演示无服务器 GPU 作业上 AI 运行时的 Databricks 资产捆绑包配置:
resources:
jobs:
sample_job:
name: sample_job_h100
trigger:
periodic:
interval: 1
unit: DAYS
parameters:
- name: catalog
default: ${var.catalog}
- name: schema
default: ${var.schema}
environments:
- environment_key: default
spec:
environment_version: '4'
tasks:
- task_key: notebook_task
notebook_task:
notebook_path: /Workspace/Users/your_email/your_notebook
environment_key: default
compute:
hardware_accelerator: GPU_8xH100