Der Lerneffekt selbst wird erzielt durch Belohnen bei Wohl- und Bestrafen
bei Fehlverhalten. Verhält sich der Roboter richtig, so kann man ihn
belohnen, indem man ihm Energie zuführt. Das geschieht, indem man die Hände
auf die Plexiglashalbkugel legt. Sichtbar gemacht wird die Energiezufuhr
dadurch, dass die Kugel umso heller leuchtet, je länger man die Hände darauf
verweilen lässt.
Durch "Bestrafen", d.h. Druck auf die linke oder rechte Seite bzw. die
Hinterseite wird dem Roboter vermittelt, ob er den letzten Befehl richtig
ausgeführt hat. Konsequenterweise wird die Kugel bei jedem Bestrafen dunkler. Das Belohnungs-
und Bestrafungsverhalten des Spielers wirkt sich auf das Lernverhalten des
Roboters aus. Die Schläge werden über einen
Drucksensor abgenommen, der die Stärke des Signals an einen Rechner im
Inneren der Plexiglaskugel weiterleitet. Dort wird entsprechend ein
Parameter des neuronalen Netzes, genannt Lernschrittweite geregelt. Dieser
bewirkt bei kleinen Werten ein langsames, aber stabiles Lernen, bei hohen
Werten ein schnelleres, aber unsichereres Ergebnis. Wenn man also zu stark
prügelt, kann es sein, dass man genau das Gegenteil, also ein störrisches
Verhalten erreicht. Ist man dagegen zu nachgiebig, wird der Roboter
übermütig und tut was er will. Vorsicht, der Roboter kann auch zu Tode
geprügelt werden!