Wie funktioniert automatische Bilderkennung?

Manch einer hat es vielleicht schon einmal ausprobiert. Typisch für viele Apps zum Online-Shopping ist heutzutage die Funktion, Objekte zu scannen und dann ähnliche Artikel angezeigt zu bekommen. Das nennt sich automatische Bilderkennung und funktioniert durch maschinelles Lernen, insbesondere Deep Learning. Dazu haben wir schon einen ausführlichen Artikel für euch verfasst. Aber nicht nur beim Online-Shopping findet automatische Bilderkennung mittlerweile Anwendung. Auch in der Medizin, Mikrobiologie und sogar auf eurem Smartphone hat sie schon ihren Einsatz. Wie das genau funktioniert, erfahrt ihr in diesem Artikel.

Wie funktioniert automatische Bilderkennung?

Ziel der künstlichen Intelligenz ist es, Maschinen zu entwickeln, die sich verhalten, als verfügten sie über Intelligenz.“ (John McCarthy, 1955)

Automatische Bilderkennung findet statt durch maschinelles Lernen, insbesondere Deep Learning. Aber was ist das eigentlich? Maschinelles Lernen stammt aus dem Gebiet der künstlichen Intelligenz. Es bedeutet, dass eine Maschine, anhand von Beispieldaten, lernt, Muster zu erkennen. Diese Muster werden dann auf neue, unbekannte Daten angewendet. Der Prozess dahin ist mit vielen verstrickten Daten und Formeln verbunden und benötigt eine lange Phase des Lernens, um letzten Endes korrekte Ergebnisse erzielen zu können.

Künstliche Neuronale Netze

Künstliche Neuronale Netze bilden den Schlüssel zum Deep Learning. Sie ahmen vereinfacht die Struktur unseres Gehirns nach. Dieses künstliche Gehirn versucht Muster in Daten zu erkennen und daraus Schlüsse zu ziehen – bei Bildern beispielsweise, was darauf zu sehen ist.

Dafür braucht es oft nicht einmal alle Bildinformationen, sondern beispielsweise nur den Grauwert jedes einzelnen Bildpunktes. Dieser Wert gibt die Helligkeit des Pixels wieder. Jeder Pixel hat einen Grauwert zwischen Null und Eins. Diese Grauwerte der Pixels können beispielsweise den Input für die erste Schicht des Neuronalen Netzes bilden.

Die Künstliche Intelligenz lernt durch eine große Menge Daten, Muster in diesen Grauwerten zu erkennen, die auf ein bestimmtes Motiv immer wieder zutreffen. Diese Muster sind meist die Kanten – also dort, wo es starke Unterschiede in der Helligkeit benachbarter Pixel gibt.

Das geschieht alles über mehrere Schichten des Künstlichen Neuronalen Netzes. Durch ständige Selbstüberprüfung verfeinert die KI ihre Erkennung der richtigen Muster und wird zunehmend besser, zum richtigen Ergebnis zu kommen.

Dabei misst die Künstliche Intelligenz jedem möglichen Ergebnis anhand dieser Muster eine Wahrscheinlichkeit zu. Das Ergebnis mit der höchsten Wahrscheinlichkeit wird als Lösung angenommen. 

Mehr über Neuronale Netze, Deep Learning und wie ihr es sogar selbst programmieren könnt, erfahrt ihr übrigens mit diesem Buch von Rheinwerk Computing. (Provisionslink)

Beispiel: Hund oder Katze?

Das klingt jetzt alles sehr theoretisch. In der Praxis sieht das zum Beispiel so aus: Man programmiert eine KI mit den Daten vieler verschiedener Bilder von Hunden und Katzen. Diese müssen vorab mit Information getaggt sein. Es ist also wichtig, dass die KI weiß, um was es sich handelt. Am besten eignen sich dafür Beispielbilder, die sich nicht so sehr ähneln, also verschiedene Perspektiven des Objektes bieten. Das kann sich auf alles Mögliche beziehen: unterschiedliche Lichtverhältnisse, diverse Hintergründe, Tiere aus anderen Blickwinkeln, etc. Sobald dieser erste Prozess des Lernens abgeschlossen ist, können die Testrunden beginnen. Dabei nimmt man eines dieser Bilder, diesmal jedoch nicht mit Informationen getaggt, und lässt es wieder durch das vorher beschriebene Neuronale Netz laufen.

Die Maschine versucht nun, anhand der Grauwerte, Muster innerhalb des Bildes zu erkennen und so den richtigen Output zu generieren. Die KI hat in diesem Beispiel die Wahl zwischen Katze und Hund, ein anderes Ergebnis kann demnach nicht erzielt werden. Der Output gibt also an, mit welcher Wahrscheinlichkeit es sich jeweils um eins der beiden Tiere handelt. 

Auch eine KI macht Fehler in der automatischen Bilderkennung

Allerdings ist auch eine künstliche Intelligenz nicht ganz fehlerfrei. Würde man jetzt beispielsweise das Bild eines Kaninchens als Input nehmen, bekäme man als Antwort trotzdem entweder den Hund oder die Katze. Dies sind eben die einzigen beiden Objekte, die die KI bislang kennt. Um die Generierung des Outputs also genauer und umfangreicher zu gestalten, muss man vorher ein noch größeres Daten-Set mit mehr Objekten einpflegen.

Außerdem kann die Maschine mit ihrer Antwort auch mal falsch liegen. Manchmal nimmt man also das Bild eines Hundes und die KI erkennt es als Katze. Das ist vergleichbar mit einem Menschen, der vielleicht in der Dunkelheit draußen nicht erkennt, welches Tier er in der Ferne erblickt. Vor allem am Anfang des Lernprozesses können solche Fehler häufiger vorkommen. Aber je öfter man die Vorgänge wiederholt, desto intelligenter wird die KI und desto treffsicherer ist auch das Ergebnis. 

Das Künstliche Neuronale Netzwerk lernt nämlich dazu. Merkt es das sie bei Bildern mit einem bestimmten Datenmuster öfter falsch liegt, räumt sie diesem Muster weniger Relevanz ein und schaut nach Merkmalen die offenbar eher für einen Hund oder eine Katze sprechen. Oft spielen ja auch mehrere Merkmale eine Rolle. Der Mensch erkennt zwar meist zumindest Hund oder Katze, muss sich aber auch genauer mit den Unterschieden auskennen, um die genaue Hunderasse zu bestimmen. Diese Erfahrung muss auch die KI erst einmal sammeln.

Wo wird automatische Bilderkennung angewendet?

E-Commerce

Künstliche Intelligenz, insbesondere auch die automatische Bilderkennung, findet sich bereits in vielen Anwendungsbereichen im Alltag wieder. Oft verwenden Unternehmen dieses Tool auch im E-Commerce, um beispielsweise Kunden die Suche nach bestimmten Objekten zu erleichtern. Beispielsweise nutzen Online-Verkaufsplattformen die Bilderkennung als Tool in deren Apps. Damit müssen Kunden im Suchfeld nicht aufwendig nach dem gewünschten Artikel suchen. Stattdessen können sie einfach ein Bild davon machen und bekommen dann blitzschnell eine Vielzahl an Alternativen präsentiert. Andere App-Hersteller nutzen das zum Beispiel sogar zur Erkennung von Pflanzen, damit diese bei euch zuhause richtig gepflegt werden können. Welche das sind und wie sie euch mit euren Pflanzen helfen, könnt ihr hier nachlesen.

Medizin

In der Medizin und Medizintechnik kann künstliche Intelligenz sogar Fachärzte bei der Diagnose oder Behandlung eines Patienten unterstützen. Automatische Bilderkennung findet man vor allem in der Radiologie. Beispielsweise werden MRT-Scans nach Tumoren untersucht und dann als gut- oder bösartig klassifiziert. Aber auch in der Kardiologie können durch spezielle Verfahren zum Aufnehmen der Herzkammern die Behandlung vereinfachen und beschleunigen. Das soll Versorgungsengpässen entgegenwirken. Selbst eine Corona-Diagnose lässt sich dank einer Bildverarbeitung besser diagnostizieren. Computertomographie-Scans sind eine Alternative zu den sonst üblichen PCR-Tests. Die KI kann Auffälligkeiten in den Scans herausfiltern und die Infektion als Ganzes präziser einschätzen. Das unterstützt Mediziner bei der Beurteilung, wie bei der Versorgung weiter vorgegangen wird und beschleunigt zudem den gesamten Prozess.

Zellbiologie

Sogar in der Zellbiologie nimmt man sich mittlerweile automatisierte Bildverarbeitungsmethoden als Messtechnik zu Hilfe. Mithilfe des Deep Learnings können Stammzellen bei der Zellkultivierung über Mikroskop-Bilder erkannt und Fehler klassifiziert werden. Diese Methode soll vor allem schneller, genauer, aber auch resistenter gegen äußere Einflüsse sein. Das Fraunhofer Institut für Produktionstechnologie beispielsweise hat dieses Verfahren der automatisierten Bildverarbeitung in der Zellbiologie schon fest in ihr Repertoire aufgegriffen.

Euer Smartphone

Wusstet ihr, dass selbst euer Smartphone höchstwahrscheinlich schon künstliche Intelligenz benutzt? Wenn ihr mal in eure Bildergalerie geschaut habt, ist euch das vielleicht schon aufgefallen. Euer Handy erkennt Personen und platziert Fotos mit dieser Person in ein Album. So einfach kann automatische Bilderkennung funktionieren. Nicht wenige App-Hersteller machen sich dieses Feature zu Nutzen. Verspielte Filter fürs Gesicht findet man mittlerweile auf allen möglichen Plattformen für soziale Medien. 

Natürlich gibt es noch so viel mehr Anwendungsbereiche, in denen Deep Learning und automatische Bilderkennung schon eingesetzt werden. Künstliche Intelligenz ist also schon lange kein Begriff der Zukunft mehr, sondern in mancher Form ein alltägliches Tool. Die Nutzung solcher Methoden steigert sich kontinuierlich und ist zu einem festen Bestandteil in vielen Branchen, wie dem E-Commerce oder der Medizin, geworden. 


Image by zapp2photo via Adobe Stock

Catharina Osterkamp

ist passionierte Gamerin, wenn es sich um die Sims oder Animal Crossing handelt. Sie arbeitet in der Netzpiloten-Redaktion und im Bereich Marketing. danach widmet sie sich gerne dem exzessiven Online-Shopping oder plant ihr neuestes Projekt zum erfolgreichen Prokrastinieren von Uni-Sachen.


Artikel per E-Mail verschicken
Schlagwörter: ,