在本教程中,你将使用 Genie Code 直接在 Databricks 笔记本中运行端到端客户分段。 从原始市场营销活动数据集开始,Genie Code 从单个提示开始处理数据分析、特征工程、K 手段聚类分析和角色生成。
要求
- 启用 Genie Code 的 Databricks 工作区。
- 为帐户和工作区启用了合作伙伴支持的 AI 功能。 请参阅 合作伙伴支持的 AI 功能。
- 已启用 Genie Code Agent 模式预览。 请参阅 Manage Azure Databricks 预览版。
步骤 1:获取数据集
在本教程中,你将使用市场营销活动数据集。
- 从 Kaggle 下载 市场营销活动数据集 。
- 单击“
>添加”或“上传数据”。 - 单击“ 创建或修改表”。
- 单击 浏览 或拖放下载的文件到放置区域。
- 在 Unity 目录中选择目标目录和架构。
- (可选)编辑表名。
- 单击“创建表”。
步骤 2:打开笔记本
- 在边栏中,单击“ 新建 ”,然后选择 “笔记本”。
- 请将笔记本命名为市场营销活动数据。
- 将笔记本连接到计算资源,或使用无服务器计算资源。
步骤 3:在代理模式下启动 Genie Code
代理模式下的 Genie Code 可以自主规划和运行多步骤任务 — 它读取单元格输出、修复错误,并根据结果调整其方法。
- 在笔记本的右上角,单击
打开“Genie Code”窗格。
- 在 Genie Code 窗格底部的模式选择器中,选择 “代理”。
步骤 4:提交分段提示
细分分析通常由具有类似购买模式的客户聚类分析。 例如,细分市场可能基于收入、人口统计或特定购买行为。 一种常见方法是 K-means 聚类分析,这种技术自动将类似客户分组到不同的细分市场,称为“群集”。
输入以下提示,然后按 Enter 或单击“
Help me cluster my customers from my marketing campaign to profile them. I want to identify interesting segments that may be useful for marketing purposes.
Genie Code 将提示分解为步骤并运行它们:
- 了解上下文 - Genie Code 读取提示和笔记本的当前状态。
- 查找相关数据 - Genie Code 在 Unity 目录中搜索相关数据资产,并加载它们进行分析。
- 生成并运行代码 — Genie Code 按照标准数据科学工作流编辑笔记本单元格:导入库、预处理数据、训练模型以及可视化结果。
- 汇总结果 - Genie Code 对找到的结果进行了纯语言摘要。
Genie Code 在运行代码之前请求你的批准。 查看每个步骤,然后单击“ 允许”。 还可以 在此线程中选择“允许 ”以批准当前对话中的所有步骤,或 始终允许 跳过将来的审批提示。
步骤 5:查看结果
Genie Code 完成后,在 Genie Code 窗格中查看生成的笔记本单元格和摘要。 摘要描述了每个已识别的客户细分市场,包括人口特征、购买行为以及有关如何参与每个组的建议。
例如,Genie Code 可能会识别 高级忠诚者 (高收入、频繁购买者)和 讨价还价者 (价格敏感、促销驱动)等细分市场。
步骤 6:使用后续提示进行优化
使用后续提示深入了解分析:
Are there any other clustering techniques we should consider?What happens if we increase the number of clusters?Filter to customers who have made a purchase in the last 90 days.
每个后续提示都基于以前的结果生成,而无需重新开始。