面向数据科学的 Python 简介
自 1991 年发布以来,Python 已不仅仅是一种流行的通用编程语言。 它还是面向数据科学的一种超前的计算机语言。 本 Learn 模块使用 Python 和 Visual Studio Code 的 Python 扩展来说明数据科学工具和资源。
注意
本 Learn 模块中的几个示例均来自 Python 文档。 经过编辑和修改,Python.org 介绍性教程和 Python 3 文档中的示例被展示出来。 Python 软件基础(PSF)的原始材料根据 Python 3.8.3 的 PSF 许可协议在此处使用:
此 Python 简介是为 Python 版本 3.6.7 编写的,但通常也适用于其他 Python 3.x 版本。
本 Learn 模块广泛使用了在 Visual Studio Code 中运行的 Jupyter Notebook。 Visual Studio Code 在 macOS、Linux 和 Windows 上运行。 在该 Learn 模块中,请使用 Python 扩展和集成的 Jupyter Notebook 在 Visual Studio Code 中试用 Python 代码。
设置你的环境
建议你设置自己的环境,以便可在整个 Learn 模块中跟进并有效学习。
若要设置环境:
- 下载并安装 Visual Studio Code。 此工具免费,适用于 Windows、Mac 和 Linux。 选择适合你的平台的稳定版本。
- 下载并安装 适用于 Visual Studio Code 的 Python 扩展。 此步骤要求你先安装受支持的 Python 版本。
- 在 Visual Studio Code 中激活 Anaconda 环境,以便可以运行 Jupyter Notebook。
- 在 Visual Studio Code 中设置数据科学环境,以便可以使用 NumPy 和 pandas 库。
测试环境
你已使用 Visual Studio Code、Python、Anaconda 以及 NumPy 和 Pandas 库成功设置了环境。 现在,你可在 Visual Studio Code 中运行 Jupyter Notebook。
- 克隆 Reactor 存储库,并在 Visual Studio Code 中打开 Learn/Intro-Python-Data-Science 文件夹。
- 运行 Test-Setup-Config.ipynb 文件,确保已准备好继续完成本 Learn 模块。
关于本 Learn 模块
在浏览本 Learn 模块时,请试用代码。 请使用你克隆用于此目的的文件。
Jupyter Notebook 分成多个单元格。 每个单元都包含使用 Markdown 标记语言编写的文本或用于写入和执行计算机代码的空间。 由于所有代码都在代码单元内,因此你可内联运行每个代码单元,而不是使用单独的 Python 交互式窗口。
注意
本 Learn 模块要求你逐个运行代码单元。 完成这些模块后,请将代码片段复制到 Visual Studio Code 中的 Jupyter Notebook 中,并一次运行一个单元。
注释
此笔记本中的许多示例都包含注释。 在 Python 中,注释以哈希字符 (#) 开头,并扩展到实际行的末尾。 注释可能出现在行的开头或空格/代码的后面,但不会在字符串文本中。 字符串文本中的哈希字符只是一个哈希字符。 由于注释在这里用于阐释代码,而且并非由 Python 进行解释,因此在示例中键入时可省略它们。 例如:
# This is the first comment
spam = 1 # and this is the second comment
# ... and now a third!
text = "# This isn't a comment because it's inside quotation marks."
print(text)
输出为:
# This isn't a comment because it's inside quotation marks.
亲自试一试
在 Visual Studio Code 中打开 Python.ipynb 文件。 然后,将前面的代码示例复制粘贴到 Python 代码单元中。 运行代码,你应会获得与上一部分所示相同的输出。
Python 是一种解释语言,这意味着你可以交互方式使用解释器来获取即时结果。 例如,你可将 Python 解释器用作简单的计算器:键入表达式,立即就能看到输出。
如何查看结果? Python 解释器在此笔记本中运行。 若要运行单元中的代码,请选择窗口顶部的“运行单元”,或按 Ctrl+Enter。
在 Visual Studio Code 中的 Python.ipynb 文件中,将以下代码输入 Python 单元。 (本模块稍后将介绍 Python 代码的语法含义。)
print("Hello, world.")
运行该单元。 输出应为:
Hello, world.
学习目标
在本模块中,你将:
- 了解 Python 语法的基础知识
- 了解 Python 基本类型、变量和表达式
- 试用 Python 字符串、列表、元组和字典的函数
- 了解 Python 控制流和函数
- 了解高级列表推导式
- 了解如何将其他 Python 库导入笔记本
先决条件
- 无
提示
本模块中有几个单元包含“提示”功能,你可以选择该功能来显示练习题的答案。 此功能在 Google Chrome 和最新的基于 Chromium 的 Microsoft Edge 浏览器中的使用效果最佳。 在其他浏览器中,可能不会隐藏答案。