Ética em ciência de dados e machine learning

Concluído

É importante entender que a ética desempenha uma função em cada parte do ciclo de vida de ciência de dados. Você deve considerar a ética das suas decisões em cada etapa. Ela começa com a sua pergunta central e passa pela disponibilidade do seu modelo.

No exemplo dos frutos silvestres, você descobriu que um dado significativo estava ausente dos conjuntos de dados de treinamento e de teste. Você não conhecia nada sobre framboesas vermelhas nem que havia seis tipos de frutos silvestres em vez de apenas cinco. Embora o assunto da identificação de frutos silvestres possa parecer trivial, o fenômeno representa um problema muito maior. Além da segurança no lançamento de foguetes, a ausência desses dados pode distorcer os resultados e, até mesmo, ser fatal. Por exemplo, você sabia que homens e mulheres apresentam sintomas de ataque cardíaco amplamente diferentes? Em estudos recentes sobre saúde, grandes populações foram omitidas da coleta inicial de dados, o que afetou os modelos de sintomas de ataques cardíacos que eram usados nos serviços de saúde.

Ética e segurança no lançamento de foguetes

O conhecimento e a experiência de cientistas e colaboradores da NASA ajudam a garantir a maior probabilidade de lançamento seguro e bem-sucedido de um foguete. Talvez você não tenha acesso aos mesmos recursos, mas pode tentar ser o mais ético possível com os dados limitados que estão à sua disposição.

Nos demais módulos deste roteiro de aprendizagem, você vai explorar como os dados meteorológicos disponíveis publicamente podem ajudar você a entender como seria um dia de lançamento bem-sucedido. O conjunto de dados com o qual você trabalhará contém informações sobre 64 lançamentos de foguete tripulados e não tripulados. Com esses dados, você pode examinar o clima nesses 64 dias de lançamento para tentar entender com precisão como o clima precisa estar para apoiar um lançamento bem-sucedido.

O conjunto de dados que você usará contém apenas um lançamento de foguete malsucedido que foi cancelado devido ao clima. Pense no exemplo de framboesa vermelha. Se você não tiver uma representação completa dos dados, não saberá quando procurar novas categorias. Com o exemplo dos frutos silvestres, você não sabia que há seis tipos de frutos e não identificou as framboesas vermelhas. Os dados da NASA não mostram datas de lançamento adiadas.

Os problemas de ciência de dados exigem rigor e iteração. A cada novo nível de conhecimento que obtemos de nossos dados, descobrimos quais outros dados podem estar ausentes, que novas perguntas fazer e como podemos priorizar os dados para produzir compreensões mais precisas do mundo ao nosso redor.

A análise que considera apenas um exemplo de fatores negativos não é o tipo de dados usado pela NASA quando há vidas reais em risco. Mais dados e conhecimento no assunto seriam necessários antes que devessem ser usados para qualquer tipo de tomada de decisão real. No entanto, o conjunto de dados com o qual você trabalhará nos próximos módulos do roteiro de aprendizagem fornece uma introdução ao tipo de análise que pode ser usado como ponto de partida.