Bilderkennungs-KI

Bilderkennungs-KI ist bereits in vielen Bereichen fest etabliert: Wenn man Dokumente online einreicht, wird der Text darauf oft automatisch erkannt und entschlüsselt. Wenn du ein Bild in die Bildersuche bei google hineinziehst, erkennt sie das Bild und zeigt dir ähnliche Bilder oder woher dieses stammt. Selbstfahrende Autos erfassen mit ihrer Kamera die Umgebung, werten die Bilder aus und passen die Fahrweise entsprechend an.

Google hat eine "Teachable Machine" programmiert, mit der du selbst ebenfalls eine Bilderkennung erstellen kannst. Hier kannst du zunächst einmal ein Beispiel anschauen, das ich damit gemacht habe, mit dieser Bilderkennung kann man die Blätter von sechs verschiedenen Laubbäumen unterscheiden:

Eine Bilderkennungs-KI selbst zu erstellen und in ein lauffähiges Programm in dieser Art einzubetten ist gar nicht so schwierig. Dieser Film zeigt die notwendigen Schritte:

Hier die Anleitung in schriftlicher Form: 

 

(1) Suche dazu nach Dingen, die sortierbar sind wie z.B. verschiedene Blätter von Bäumen, oder ein Sortiment an Schrauben. 

(2) Gehe hier zur Techable Machine und trainiere sie mit diesen Objekten wie folgt:

  • Bennene "Class 1" in dein erstes zu erkennendes Objekt um (z.B. Ahorn wenn du  Blätter erkennen möchtest oder die genaue Schraubenbezeichnung)
  • Drücke auf "Webcam", halte das Beispiel in verschiedenen Abständen, Ausrichtungen und Positionen vor die Kamera und drücke dabei auf "Zum Aufnehmen halten". Die Bilderkennung funktioniert gut, wenn man etwa 1000 Bilder zusammengestellt hat.
  • Verfahre dementsprechend mit weiteren Elementen, benenne also "Class 2" um, erfasse dort Bilder und so weiter.
  • Gehe anschließend auf "Modell trainieren". Dabei wird das Neuronale Netz mit deinen Bildbeispielen trainiert. Das dauert ein paar Minuten und du musst den Computer in dieser Zeit in Ruhe lassen. 
  • Anschließend kannst du das Ergebnis direkt testen
  • Das trainierte Modell exportierst du schließlich, dazu hast du zwei Möglichkeiten: entweder du lädst eine ZIP-Datei herunter oder du lädst das Modell bei google hoch. Im letzteren Fall bekommst du einen URL-Link.
  • Das Modell bettest du z.B. in ein p5js-Projekt ein. Dazu findest du fertige Vorlagen auf derselben Seite, due du einfach anklicken kannst. Lege dir am besten bei p5js einen Account an dann kannst du dein Projekt dort abspeichern.
  • Du musst lediglich an 1-2 Stellen Veränderungen vornehmen: 1. In der sketch.js-Datei veränderst du den URL-Link 2. In der HTML-Datei veränderst du den erklärenden Text unten.