Auswählen der richtigen Bilder zum Trainieren der KI

Abgeschlossen

Nun folgt ein schwieriger Teil. Er ist schwierig, da wir Menschen uns an dieser Stelle einige Gedanken machen müssen. Wir müssen die richtigen Bilder von unserem Objekt auswählen. Wie in der letzten Lerneinheit bereits erwähnt, sollten alle Bilder das Objekt enthalten, jedoch in den folgenden Punkten Unterschiede aufweisen:

  • Kamerawinkel
  • Beleuchtung
  • Hintergrund
  • Visueller Stil
  • Einzelne Objekte/Gruppen von Objekten
  • Größe
  • Typ (wenn dies auf Ihr Objekt zutrifft)

Für dieses Modul werden beispielhaft Bilder von Bungee aus dem Film Die bunte Seite des Monds verwendet. Sie wählen Ihre eigenen Bilder aus. Wenn Sie möchten, können Sie sogar selbst Fotos machen. Machen Sie ungefähr 30 Fotos von Ihrem Lieblingshaustier oder -kuscheltier. Berücksichtigen Sie dabei alle in der vorstehenden Liste aufgeführten Punkte.

Darüber hinaus sollten Sie beim Fotografieren oder Suchen der Bilder Folgendes berücksichtigen:

  • Sie sollten in einem der folgenden Formate vorliegen: JPG, PNG, BMP oder GIF.
  • Sie sollten nicht größer als 6 MB sein.
  • Die kürzeste Seite sollte über eine Mindestlänge von 256 Pixeln verfügen.

Sie müssen auch eine Reihe von Bildern suchen oder aufnehmen, die Sie zum Testen Ihrer KI verwenden möchten. Diese Vorhersagebilder sollten nicht zum Trainieren des Custom Vision-Diensts verwendet werden. Diese Bilder sollten dieselben Kriterien erfüllen, bis auf die Tatsache, dass Vorhersagebilder nicht größer als 4 MB sein sollten.

Nehmen Sie sich Zeit bei der Suche nach Bildern und beim Fotografieren. Seien Sie kreativ! Nehmen Sie einige Fotos mit transparentem Hintergrund auf, einige mit nur dem Objekt aus verschiedenen Winkeln und einige, auf denen das Objekt klein ist. Dies ist Ihre Chance, dem Dienst das beizubringen, was er für Sie erkennen soll.

Ethik bei der Bilderkennung

An dieser Stelle des Moduls ist es sinnvoll, kurz auf ethische Aspekte einzugehen. Wie bei jeder Technologie sollten ethische Überlegungen bei den Lösungen, die Sie erstellen, immer eine wichtige Rolle spielen. Auch wenn Sie nur ein Experiment durchführen oder etwas ausprobieren, sollten Sie sich Gedanken über die Folgen Ihres Tuns sowie dessen mögliche Auswirkungen auf andere machen.

Denken Sie daran: Fei Fei hat eine Rakete gebaut und ist zum Mond geflogen, um zu versuchen, ihre Familie näher zusammenzubringen.

Image that shows Fei Fei sitting at the dinner table with her family during the Moon Festival.

Stellen Sie beim Auswählen von Bildern sicher, dass diese repräsentativ für das Objekt sind. Vermeiden Sie dabei Vorurteile, und seien Sie inklusiv. Ethisches und inklusives Computing bedeutet nicht, dass Sie eine Lösung für jede mögliche Version eines Problems finden müssen. Es geht dabei vielmehr darum, das Problem, das Sie lösen, angemessen darzustellen.

Hier sehen Sie ein Beispiel:

Stellen Sie sich vor, Sie haben sich entschieden, den Custom Vision-Dienst so zu trainieren, dass er Gebäudeeingänge erkennt, damit Sie diese Informationen von einer Kamera, die Fotos von Geschäften mit Eingang zur Straße hin macht, einer Karte hinzufügen können. Die Bilder, die Sie dabei verwendet haben, verfügten über Treppen, Rampen und ebenerdige Eingänge. Wenn Sie dann mit dieser trainierten KI Vorhersagen für einen neuen Teil der Stadt erstellen und diese der Karte automatisch als benutzbare Eingänge hinzufügen, wäre diese Aussage nicht für jeden zutreffend. Sie könnten Ihren Benutzern Informationen bereitstellen, denen zufolge ein Geschäft über einen Eingang zur Straße hin betreten werden kann. Ein Benutzer, der eine Rampe benötigt, könnte dann jedoch einen Eingang vorfinden, der nur über eine Treppe verfügt.

In diesem Fall könnten Sie genau dasselbe Modell erstellen, aber sicherstellen, dass in Ihrer Karten-App ordnungsgemäß vermerkt ist, dass bei Treppen nicht garantiert wird, dass auch eine Rampe vorhanden ist. Oder noch besser: Da Rampen bereits Teil Ihres Trainingsdatasets waren, können Sie ein Tag für Rampen erstellen und es den Benutzern ermöglichen, die Arten von Eingängen anzugeben, die sie verwenden möchten und können.

Nehmen Sie sich, bevor Sie mit diesem Modul fortfahren, einige Minuten Zeit, um über die Fotos nachzudenken, die Sie machen möchten und für die eine nicht menschliche und nicht empathische KI Entscheidungen für Sie treffen soll. Stellen Sie sich die Worst-Case-Szenarios vor, und entscheiden Sie, wie Sie diese berücksichtigen möchten. Auch wenn es sich bei dieser Aktivität nur um ein „einfaches Experiment“ handelt, führen ein achtsames Vorgehen und das Berücksichtigen dieser ethischen Vorgehensweisen dazu, dass Sie diese ganz selbstverständlich miteinbeziehen, wenn Sie an etwas arbeiten, das erhebliche Auswirkungen auf das Leben Ihrer Mitmenschen haben könnte.