Die Rolle der Ethik bei Data Science und maschinellem Lernen

Abgeschlossen

Es ist wichtig zu verstehen, dass Ethik in jedem Teil des Data-Science-Lebenszyklus eine Rolle spielt. Bedenken Sie in jedem Schritt die ethischen Aspekte Ihrer Entscheidungen. Dies beginnt mit ihrer Kernfrage und endet mit der Verfügbarkeit Ihres Modells.

Im Beerenbeispiel haben Sie festgestellt, dass ein wichtiger Teil der Daten in den Trainings- und Testdatasets nicht enthalten war. Sie wussten nichts von Nutka-Himbeeren oder dass es sechs Arten von Beeren gibt anstatt nur fünf. Obwohl das Thema der Beerenidentifizierung trivial erscheinen mag, stellt das Phänomen ein viel größeres Problem dar. Abgesehen von der Sicherheit beim Raketenstart kann das Fehlen dieser Daten die Ergebnisse verfälschen und sogar lebensbedrohlich sein. Wussten Sie beispielsweise, dass sich die Symptome für Herzinfarkte bei Männern und Frauen deutlich unterscheiden? In neueren Gesundheitsstudien wurden große Bevölkerungsgruppen bei der anfänglichen Datenerfassung ausgelassen, was sich auf Modelle für Herzinfarktsymptome auswirkte, die in der Gesundheitsversorgung verwendet wurden.

Ethik und Sicherheit beim Raketenstart

Das Wissen und die Erfahrung der Wissenschaftler und Mitarbeiter der NASA sorgen für die größtmögliche Wahrscheinlichkeit eines sicheren und erfolgreichen Raketenstarts. Sie haben möglicherweise keinen Zugriff auf dieselben Ressourcen, können aber auch mit den begrenzten verfügbaren Daten versuchen, so ethisch wie möglich zu handeln.

In den restlichen Modulen dieses Lernpfads erfahren Sie, wie Sie mit öffentlich verfügbaren Wetterdaten herausfinden können, wie ein erfolgreicher Starttag aussieht. Der Datensatz, mit dem Sie arbeiten werden, enthält Informationen zu 64 bemannten und unbemannten Raketenstarts. Mit diesen Daten können Sie sich das Wetter an diesen 64 Starttagen ansehen und versuchen, eine genaue Vorstellung davon zu bekommen, wie das Wetter sein muss, um einen erfolgreichen Start zu unterstützen.

Das Dataset, das Sie verwenden, enthält jedoch nur einen „nicht erfolgreichen“ Raketenstart, der aufgrund des Wetters verschoben wurde. Denken Sie an das Beispiel der Nutka-Himbeere. Wenn Sie nicht über eine komplette Darstellung der Daten verfügen, wissen Sie nicht, wann Sie nach neuen Kategorien suchen müssen. Bei dem Beerenbeispiel übersehen Sie, dass es sechs Beerenarten gibt, und Sie haben die Nutka-Himbeere nicht identifiziert. Bei den Daten der NASA fehlen Ihnen verschobene Startdaten.

Data Science-Probleme erfordern Präzision und Iterationen. Mit jeder neuen Erkenntnis, die wir aus unseren Daten gewinnen, erfahren wir, welche anderen Daten möglicherweise fehlen, welche neuen Fragen gestellt werden müssen und wie die Daten priorisiert werden sollten, um genauere Erkenntnisse über unsere Welt zu erlangen.

Eine Analyse, die nur ein Beispiel für negative Faktoren berücksichtigt, ist nicht die Art von Daten, die die NASA verwenden würde, wenn echte Leben in Gefahr sind. Für eine echte Entscheidungsfindung wären mehr Daten und Fachkenntnisse erforderlich. Der Datensatz, mit dem Sie in den nächsten Modulen des Lernpfads arbeiten werden, bietet jedoch eine Einführung in die Art der Analyse, die als Ausgangspunkt verwendet werden kann.