练习 - 考虑其他要包括的数据

已完成

我们在本模块中选择的数据是尽可能简化了的数据。 尽管在 2020 年 5 月 30 日 SpaceX Dragon 发射前后的几日并没有火箭发射,但这并不意味着火箭发射会因为那几天的天气原因被推迟。 因此,对于那几天,在 Launched 列中填入 N 并不准确。

这些模块将指导你完成用于解决在太空探索过程中面临的问题的实用步骤。 但你也必然会发现自己的方法。 最终的目标是激发你去创造、构思,将我们理解的事务和我们全体对我们的世界和外太空的认知推向极限。

下面是继续学习和数据之旅的一些方法:

  • 进一步探索数据:查找有关每次发射的文章和报告。 发射前是否有要求注意天气的通知? 在这些日期前后是否存在令人担忧的天气状况?
  • 探索缺少的天气数据:NASA 选择不发射火箭的日期的天气如何? 除了个别日期,NASA 是否还避开了某些季节? 这些季节容易出现什么样的天气状况?
  • 探索缺少的发射数据:你能否找到因天气原因而推迟的发射的相关数据? 是否有来自其他国家/地区的发射数据可纳入考量?
  • 探索其他数据操作:能否用更好的值来填充缺失的数据?
  • 决定所需的数据:如果你能联系到 NASA 的行业专家并能获取数据源,你认为在作出发射或推迟决策时最重要的是什么? 如果你可向专家提问,你会询问哪些问题?
  • 评估类似问题:是否有可用于帮助填充此数据的类似问题? 例如,由于该地区的天气而导致的飞机延误是否也是一个指标?

成为数据科学家并不是要具备完整的数据集并对它应用算法。 而是从一个杂乱且可能出错的地方开始,以迭代的方式展开学习。 本学习路径结束后,你将了解有关火箭发射的一些信息。 有了这项新知识,你可回到此模块作出更明智的决策。