剧集

使用开发人员工具和 AI 简化数据分析和可视化 |Python 数据科学日

替换为 Nitya Narasimhan

在大型语言模型和生成 AI 的新时代,拥有数据分析和可视化技能越来越重要。 但是,非 Python 开发人员如何快速掌握实现项目目标所需的工具和最佳做法,而无需获得多年的 Python 或数据科学经验? 这是适当的开发人员工具,通过一点点 AI 帮助可以提供帮助。

在此演讲中,我们将从识别开源数据集到在 25 分钟内分析它以获取见解并可视化相关结果,只需使用 GitHub 帐户和 OpenAI 终结点即可。 在此过程中,我们将介绍一系列开发人员工具,使你的旅程更加轻松:

  • 打开数据集:从 Kaggle、Hugging Face 或 Azure“分析”
  • Data Wrangler:要“清理”数据 - Visual Studio Code 中的扩展
  • Jupyter Notebook:到“记录”过程 - 用于可转移学习
  • GitHub Codespaces:到“预生成”环境 - 一致重复使用
  • GitHub Copilot:若要使用 AI 帮助进行重点学习,请“解释/修复”代码
  • Microsoft LIDA:“建议/生成”可视化目标 - 用于通过 AI 帮助生成直觉

演讲附带了一个关联的存储库,你可以分叉,然后替换为自己的数据集,以便在以后自行扩展或试验。 在演讲结束时,你应该了解如何从发现数据集到获取有关数据集的一些视觉见解,以及通过一些 AI 帮助使用现有工具。

章节

  • 00:00 - 使用开发人员工具和 AI 简化数据分析和可视化
  • 00:29 - 遵循
  • 00:54 - 简介 - 数据分析挑战和目标
  • 04:44 - GitHub Codespaces - 可重用环境
  • 08:32 - Jupyter Notebook - 使其可重现
  • 11:18 - GitHub Copilot - AI 辅助学习
  • 14:43 - Visual Studio Code - 生产力扩展
  • 15:39 - 打开数据集 - 数据整理器
  • 19:15 - 共鸣 AI 工具包 - 公平性模型调试
  • 21:13 - Project LIDA - AI 辅助的直觉和可视化
  • 25:24 - Azure AI Studio - 范式转移到 LLM Ops
  • 25:47 - 摘要 - 问题和后续步骤

连接

  • Nitya Narasimhan |Twitter/X: @nitya

开发人员
Python