Azure Databricks上的机器学习

在Azure Databricks上生成、部署和管理机器学习应用程序。集成平台将整个 ML 生命周期从数据准备到生产监视统一。

正在寻找生成式 AI 和 AI 智能体？请参阅在 Azure Databricks 上构建 AI 代理。

开始

请尝试快速入门、对模型进行 vibe 编码，并使用笔记本。

指南	Description
入门：在 Databricks 上构建第一个机器学习模型	使用 scikit-learn 生成和部署简单的分类模型。
使用 Genie Code 进行数据科学	使用 AI 代理浏览数据、生成模型和迭代。
Databricks 笔记本	支持 Python、R、Scala 和 SQL 的协作开发环境。
概念：Azure Databricks上的数据科学和机器学习	了解Azure Databricks数据科学和机器学习背后的核心概念。

进行特征工程、创建机器学习模型并跟踪实验。

Feature	Description
特征存储库	执行功能工程，管理 Unity 目录中的功能，并在生产环境中提供功能。
模型训练示例	探索使用常用库训练经典 ML 模型的端到端示例。
用于 ML 的 Databricks Runtime	使用 scikit-learn、XGBoost、MLflow 和其他 ML 库预先配置的群集，以及对深度学习框架的支持。
MLflow 跟踪	跟踪试验、比较模型性能以及管理完整的模型开发生命周期。

使用托管计算和内置框架开发深度学习模型。

Feature	Description
AI 运行时	使用无服务器 GPU 计算进行自定义深度学习训练和推理工作负载。
分布式训练示例	探索使用 Ray、TorchDistributor 和 DeepSpeed 的分布式深度学习示例。
DL 最佳做法	了解框架选择、数据加载、分布式缩放和管理深度学习模型生命周期。
Databricks 上的 Ray	使用分布式计算缩放 ML 工作负荷，以便进行大规模模型训练和推理。

使用可缩放的终结点将模型部署到生产环境，以便进行实时、流式处理或批处理推理。

Feature	Description
模型服务	使用自动缩放和 GPU 支持将自定义模型和 LLM 部署为 REST 终结点。
AI 网关	使用使用情况跟踪、有效负载日志记录和安全控制来管理和监视对Azure Databricks上提供的模型的访问。
批处理推理	为大型数据集的批处理和流式推理和预测部署模型。
基础模型 API	访问和查询 Databricks 托管的最先进的 GenAI 模型。

通过全面的监视和治理工具确保模型质量、数据完整性和合规性。

Feature	Description
Unity 目录	使用统一的访问控制、世系跟踪和发现来管理数据、功能、模型和函数。
MLflow 模型管理	管理从试验和模型到评估和部署的完整 ML 生命周期。
异常情况检测	在目录级别监视数据新鲜度和完整性。
数据分析	使用自动警报和根本原因分析监视数据质量、模型性能和预测偏差。

使用自动化工作流、CI/CD 集成和可用于生产的管道，以扩展机器学习操作。

Feature	Description
Unity Catalog 中的模型	使用 Unity 目录中的模型注册表进行集中治理，并管理模型生命周期，包括部署。
Lakeflow 作业	为 ML 管道生成自动化工作流。
声明式自动化包	将 Azure Databricks 基础设施作为代码进行管理，以支持 CI/CD，包括机器学习训练和部署。
MLOps 工作流	通过自动化训练、测试和部署管道了解端到端 MLOps。

此页面是否有帮助？