在 Microsoft Fabric 中使用端到端 AI 示例
Microsoft Fabric 中的 Synapse 数据科学服务型软件 (SaaS),可以帮助机器学习专业人员在单个分析平台中轻松地构建、部署和操作其机器学习模型,同时与其他关键角色协作。 本文介绍了 Synapse 数据科学体验的功能,以及机器学习模型如何解决常见业务问题。
安装 Python 库
某些端到端人工智能示例需要在进行机器学习模型开发或临时数据分析时需要使用其他库。 可以选择以下方式之一,为 Apache Spark 会话快速安装这些库。
使用内联安装功能进行安装
使用笔记本中的 Python 内联安装功能(例如 %pip
或 %conda
)安装新库。 此选项仅在当前笔记本中安装库,而不在工作区中安装。 使用此代码安装库。 将 <library name>
替换为库的名称:imblearn
或 wordcloud
。
# Use pip to install libraries
%pip install <library name>
# Use conda to install libraries
%conda install <library name>
设置工作区的默认库
要使库可用于工作区中的任何笔记本,可以使用 Fabric 环境实现此目的。 可以创建一个环境并在其中安装库,然后“工作区管理员”可以将该环境作为默认环境附加到工作区。 有关将环境设置为工作区默认值的详细信息,请参阅管理员设置工作区的默认库。
重要
不再支持在工作区设置中进行库管理。 可以按照“将工作区库和 Spark 属性迁移到默认环境”中的说明,将现有的工作区库迁移到环境并将其附加为工作区默认值。
按照教程创建机器学习模型
这些教程提供了常见方案的端到端示例。
客户流失
构建一个模型来预测银行客户的流失率。 流失率,也称为耗损率,是指客户停止与银行开展业务的比率。
请按照预测客户流失教程进行操作。
建议
一家线上书店希望靠提供定制推荐来增加销售额。 使用客户书籍评分数据,可以开发和部署推荐模型以进行预测。
请按照训练零售推荐模型教程进行操作。
欺诈检测
随着未经授权的交易增加,实时检测信用卡欺诈可以帮助金融机构为客户提供更快的解决周转时间。 检测模型包括预处理、训练、模型存储和推理。 训练部分回顾了实现多个模型和方法,这些模型和方法解决了不平衡示例以及误报与漏报之间的权衡等挑战。
请按照欺诈检测教程进行操作。
预测
使用纽约市历史房地产销售数据和 Facebook Prophet 构建一个时序模型,其中包含趋势和季节性信息,以预测未来周期中的销售情况。
请按照时序预测教程进行操作。
文本分类
在 Spark 中使用 word2vec 和线性回归模型应用文本分类,根据书籍元数据预测大英图书馆中的某本书是小说还是非小说。
请按照文本分类教程进行操作。
提升模型
使用增益模型估计某些医学治疗对个人行为造成的因果影响。 了解这些模块中的四个核心领域:
- 数据处理模块:提取特征、处理和标签。
- 训练模块:使用经典机器学习模型(例如 LightGBM)预测干预和未干预时个人行为的差异。
- 预测模块:调用增益模型,根据测试数据进行预测。
- 评估模块:评估提升模型对测试数据的影响。
请按照医学治疗的因果影响教程进行操作。
预测性维护
根据历史数据(如温度和转速)训练多个模型来主动预测机械故障。 然后,确定最适合预测未来故障的模型。
按照预测性维护教程进行操作。
销售预测
预测超市中各类产品的未来销量。 根据历史数据训练模型以执行此操作。
按照销售预测教程进行操作。