Prozkoumání dat o startech raket za účelem porozumění
Modely strojového učení jsou vytrénovány pomocí dostatečného množství dat, aby nedělaly chyby. Bez dostatečného množství dat by model strojového učení mohl být příliš obecný.
Pokud jste třeba model strojového učení vytrénovali pouze pomocí dat o teplotě, nemusíte vůbec zjistit, že srážky jsou mnohem důležitější a že na Floridě (ve Spojených státech) nemusí vždy korelovat s nižšími teplotami. Pokud k tomu dojde, model může znamenat, že je bezpečné spustit raketu v den, který má dobrou teplotu, ale příliš mnoho srážek, což by bylo nebezpečné.
Shromažďování dat
Prvním krokem jakéhokoli řešení datové vědy nebo strojového učení je shromáždit data a pochopit je. Pro tento studijní program jsme shromáždili veřejně dostupná data o počasí z NOAA a Weather Underground pro data startů raket NASA ze seznamu misí NASA Wikipedia. Potom jsme tato data zkompilovali do excelového souboru.
Vyberte tento odkaz na excelový soubor a stáhněte si ho. Použijeme ho pro cvičení v tomto modulu.
Excelové soubory obsahují data o počasí pro dny jednotlivých posádek a nevytvořených startů. Přidali jsme také data pro dva dny kolem startů, abychom zjistili, jestli nedošlo k nějakým vzorům, které by mohly být zajímavé. Tady je snímek obrazovky z excelového souboru.
Chybějící data
Excelový soubor obsahuje rozsáhlá data o každém startu. Když ale začnete zkoumat tato data, může dojít k významnému problému. Pouze jeden řádek představuje start rakety, který se měl stát, ale byl nasdílený kvůli obavám z počasí:
Řádek 294 – Space X Dragon – 27. května 2020
Seznam každého pokusu o start, který byl ale nasdílený kvůli počasí, není tak snadno zjistitelný jako seznam úspěšných startů. Data, která byla považována za považovaná, ale přesunutá před oznámením očekávaného data zahájení, nejsou snadno zjistitelná.
Odborníci na danou problematiku
45. space wing leteckého sil USA má jednu misi: "Zneužívejte počasí k zajištění bezpečného přístupu k vzduchu a vesmíru.". V kombinaci s mozky v NASA je pravděpodobnost výběru data, které bude ovlivněno obavami o počasí, malé. Aby se zajistilo co nejmenší počet změn plánu startu, odborníci na počasí a let zváží změny klimatu, vzorce počasí a stávající data.
Tomuto problému se můžete začít věnovat sami, když se podíváte na rozvrh startů NASA. I bez strojového učení se podívejte na předpovězené vzorce počasí v Cape Canaveral. Zjistěte, jestli jste zjistili, proč bylo vybrané určité datum a čas před nebo po jednom týdnu.
Vyhledání dalších dat
Cílem tohoto studijního programu je postrčit vás při studiu počasí a jeho souvislostí se starty raket. Doporučujeme vám, abyste zjistili další data a vylepšili si vlastní model strojového učení. Je to součást cesty k datové vědě.
Co si myslíte, že byste mohli použít ke zjištění startů, které byly zpožděny z důvodu počasí? Články v novinách? Archivy?