本文档的目的
本学习指南汇总了评估实验室中介绍的主题,还提供其他资源帮助你进行准备。 请注意,凭据详细信息页上的学习路径可能包含比“执行的任务”还要多的模块,以提供一致的学习体验。
任务概览
引入和加载数据
在湖屋中引入数据
将 Lakehouse 数据加载到笔记本中
将数据转换为数据帧
支持模块:
在笔记本中探索数据
通过显示数据帧来探索数据
通过运行统计信息来探索数据
通过生成可视化效果来探索数据
支持模块:
准备和转换数据
聚合数据
识别和解决缺失的数据
识别和删除重复数据
执行独热编码
规范化和缩放数据
支持模块:
训练和评估模型
将数据集拆分为训练集、验证集和测试集
使用 Scikit-learn 训练模型
使用 SynapseML 训练模型
评估模型的回归和分类指标
支持模块:
跟踪模型和试验
创建试验
使用 MLflow 跟踪模型指标、参数和项目
使用 MLflow 检索试验运行及其指标
支持模块:
根据模型生成预测
使用 PREDICT 函数为模型评分
将模型预测结果写入湖屋
使用 MLflow 在 Microsoft Fabric 中保存和注册 ML 模型
支持模块: