查看火箭发射数据,掌握相关信息
使用足够多的数据来训练机器学习模型以避免出错。 如果没有足够的数据,机器学习模型可能会过于笼统。
例如,如果你只使用温度数据训练机器学习模型,则你可能不会发现降水更重要,也没法发现降水并不总是与美国佛罗里达州的低温天气相关。 这样的话,该模型可能会指示在温度适宜但降水较多的日期发射火箭是安全的,但这并不安全。
收集数据
在任何数据科学或机器学习解决方案中,第一步都是收集和理解数据。 在此学习路径中,我们从 NOAA 和 Weather Underground 收集了已公开提供的 NASA 火箭发射日期的天气数据,它们来自 NASA 任务清单维基百科页面。 然后,我们将这些数据编译到了一个 Excel 文件中。
选择此 Excel 文件链接可下载该文件。 本模块中的练习将用到该文件。
Excel 文件中包含各载人发射和无人发射日期的天气数据。 我们还添加了发射前后两天的数据,查看是否存在任何有趣的模式。 下面是来自 Excel 文件的屏幕截图。
缺少数据
Excel 文件包含大量有关每次发射的数据。 但是,当你开始浏览此数据时,你可能会发现一个重大问题。 只有一行表示本应发生但由于天气原因而被推迟了的火箭发射:
第 294 行 - Space X Dragon - 2020 年 5 月 27 日
尝试发射但因天气原因而被推迟的每次发射的列表不像成功发射列表那样容易发现。 在宣布预期发射日期之前所考虑但移动的日期也不容易发现。
行业专家
美国空军第 45 航空联队有一项任务:“利用天气来确保安全进入上空和太空。”再考虑到 NASA 的想法,选择存在天气担忧的日期的可能性很小。 为了确保更改发射日程安排的次数最少,气象和飞行行业专家会考虑气候变化、天气模式和现有数据。
你可前往 NASA 发射日程安排开始自行探索此问题。 即使没有机器学习,也请查看卡纳维拉尔角的预测天气模式。 看看能否确定为什么选择的是该日期/时间而不是提前或延后一周。
发现更多数据
此学习路径的目标是带领你踏上天气及其与发射之间的关系的奇妙之旅。 建议你发现更多的数据来改进你自己的机器学习模型。 这也是数据科学之旅的一部分!
你认为你可通过哪些内容来发现之前因天气原因而被迫推迟的发射? 新闻文章? 存档?