Curiosity Learning – die neugierige KI

Künstliche Intelligenz wird durch die stetige Entwicklung und neue Methoden immer menschlicher. Ein neuer Ansatz ist das Curiosity Learning, bei dem KI-Systeme nun auch neugierig werden. Die Curiosity Learning Methode befindet sich im Bereich des Reinforcement Learning (bestärkendens Lernen) und ermöglicht der Maschine selbstständiger zu werden. Das Ziel ist dabei, dass die Maschine eine unbekannte Aufgabe möglichst effizient bewältigt.

KI wird immer menschlicher

Reinforcement Learning

Das Reinforcement Learning ist eine beliebte Machine-Learing Methode bei dem die Künstliche Intelligenz eine Belohnung bekommt, wenn sie etwas richtig macht. Gleichzeitig bekommt sie bei Fehlern negatives Feedback. Durch ein Trial-and-Error Verfahren ermittelt das System anhand des Feedbacks passende Aktionen zu den entsprechenden Situationen. Anhand dessen kann die Maschine dann eine Strategie entwickeln, mit der die Belohnungen maximiert werden können. Im Gegensatz zu anderen Methoden werden beim Reinforcement Learning allerdings vorab keine Daten benötigt. Diese Daten generiert die KI stattdessen in einer Simulationsumgebung durch das Trial-and-Error Verfahren. Das Reinforcement Learning funktioniert allerdings nur, wenn es in einer Umgebung mit Belohnungen und Feedback ist. Wenn dies fehlt, was in der realen Welt häufig der Fall ist, weiß die Maschine nicht, ob sie in die richtige Richtung geht.

Curiosity Learning

Im Gegensatz zum Reinforcement Learning, was hauptsächlich auf extrinsischer Motivation beruht, kommt beim Curiosity Learning auch intrinsische Motivation zum Einatz. Dies eignet sich besonders für Fälle in denen es kein Feedback von außen gibt, da man selbst die Belohnung erzeugt. Die Neugier oder intrinsische Motivation der Maschine ist also eine Art Belohnung, die sie selbst erzeugt, um mehr über ihre Umwelt zu erfahren. Die Software wird dementsprechend dazu bewegt Erkenntnisse zu erlangen, die noch nicht im Speicher vorliegen und somit neue unbekannte Bereiche zu erforschen und ihr Spektrum zu erweitern. Dadurch entwickelt sich die Software immer weiter weg von einer starren Maschine und handelt immer mehr wie ein Lebewesen. Zusätzlich werden Erkenntnisse aus Psychologie und Neurobiologie eingesetzt, um die Handlungen der Maschinen immer menschenähnlicher zu machen.

Die zusätzliche Neugier erweitert dabei das Reinforcement Learning und ermöglicht somit auch das Lösen von Aufgaben ohne externes Feedback. Curiosity Learning ist allerdings noch nicht perfekt, da die künstliche Neugier zur Zeit noch Grenzen aufweist, die sie von der menschlichen Neugier unterscheiden. So lernt das System zwar die relevanten Dinge, aber es gibt keine Garantie, das es Recht hat. Deshalb kann auch die neugierige KI Entscheidungen treffen, die sie in die falsche Richtung lenken, weshalb sie diese Aufgabe nicht lösen kann.

Curiosity Learning in Spielen

Schon seit längerer Zeit werden Algorithmen eingesetzt, die selbstständig Spiele spielen und häufig auch besser als ihre menschlichen Gegenüber sind. Dies begrenzte sich aber meist auf ältere und simple Spiele. Bei diesen Spielen, wie z.B. GO, ist es relativ einfach ein Belohnungssystem einzubauen, was der Software Feedback gibt. Viele komplexere Spiele beinhalten aber keine direkten Belohnungen, weshalb hier das Curiosity Learning neue Möglichkeiten bietet. Die KI lernt dieses Spiel dann ähnlich wie ein Kleinkind, das ein Modell erstellt von dem, was es weiß, und den Rest durch experimentieren herausfindet. Diese komplexen Spiele ähneln der realen Welt, da beide nur begrenzt Feedback geben und somit auf intrinsische Motivation angewiesen sind.

Potenzielle Einsatzgebiete

Die neugierige KI bietet natürlich nicht nur Einsatzgebiete im Bereich Videospiele, sondern auch zahlreiche Anwendungsfelder in der realen Welt. Das grundsätzliche Problem in vielen dieser Bereichen ist nämlich die Notwendigkeit einer Maschine, die von selbst herausfindet, wie sie ihre Aufgabe optimal lösen kann. Mögliche Einsatzgebiete sind z.B. das automatisierte Putzen und Aufräumen im Haushalt, das Bewegen und Verteilen von Lagerbeständen in der Logistik, das Bewegen von Fahrzeugen durch schweres Gelände, sowie das Finden von hilfsbedürftigen Menschen.

Quellen:

https://www.spektrum.de/news/intelligent-und-neugierig/1536223
https://ai.googleblog.com/2018/10/curiosity-and-procrastination-in.html
https://towardsdatascience.com/curiosity-driven-learning-made-easy-part-i-d3e5a2263359

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert