Der Lerneffekt selbst wird erzielt durch Belohnen bei Wohl- und Bestrafen bei Fehlverhalten. Verhält sich der Roboter richtig, so kann man ihn belohnen, indem man ihm Energie zuführt. Das geschieht, indem man die Hände auf die Plexiglashalbkugel legt. Sichtbar gemacht wird die Energiezufuhr dadurch, dass die Kugel umso heller leuchtet, je länger man die Hände darauf verweilen lässt.
Durch "Bestrafen", d.h. Druck auf die linke oder rechte Seite bzw. die Hinterseite wird dem Roboter vermittelt, ob er den letzten Befehl richtig ausgeführt hat. Konsequenterweise wird die Kugel bei jedem Bestrafen dunkler. Das Belohnungs- und Bestrafungsverhalten des Spielers wirkt sich auf das Lernverhalten des Roboters aus. Die Schläge werden über einen Drucksensor abgenommen, der die Stärke des Signals an einen Rechner im Inneren der Plexiglaskugel weiterleitet. Dort wird entsprechend ein Parameter des neuronalen Netzes, genannt Lernschrittweite geregelt. Dieser bewirkt bei kleinen Werten ein langsames, aber stabiles Lernen, bei hohen Werten ein schnelleres, aber unsichereres Ergebnis. Wenn man also zu stark prügelt, kann es sein, dass man genau das Gegenteil, also ein störrisches Verhalten erreicht. Ist man dagegen zu nachgiebig, wird der Roboter übermütig und tut was er will. Vorsicht, der Roboter kann auch zu Tode geprügelt werden!