NewIn: Majid Khadiv
Wie Roboter lernen, Entscheidungen zu treffen
„Automan“ heißt das Ziel, das Majid Khadiv anpeilt. Der sogenannte Autonomous Humanoid Robot soll seine Umwelt wahrnehmen, auf Änderungen reagieren und selbstständig Entscheidungen treffen und umsetzen. „Mein Ziel ist es, Roboter mithilfe von maschinellem Lernen zu befähigen, Menschen langweilige oder gefährliche Aufgaben abzunehmen“, sagt der Professor für AI Planning Khadiv. Seit September 2023 forscht und lehrt er an der TUM und ist Mitglieddes Munich Institute of Robotics and Machine Intelligence.
Zum Einsatz kommen soll der humanoide Roboter später vor allem dort, wo es für Menschen zu gefährlich wird oder bei repetitiven, einfachen und langweiligen Aufgaben. Brände löschen, Reparaturen an Strommasten erledigen oder in der Fabrik einfache Handgriffe machen lassen: Das werden nach Ansicht von Prof. Majid Khadiv die Aufgaben sein, in denen humanoide Roboter Einsatz kommen.
Roboter für gefährliche und wenig anspruchsvolle Arbeiten
Gar nicht so einfach, erklärt der Wissenschaftler am Beispiel einer scheinbaren Routinetätigkeit. „Wenn ich einen Menschen bitte, mein Büro aufzuräumen, sind nach dem Mittagessen lose Blätter aufgelesen, Kartons rausgebracht und der Tisch abgewischt“, sagt Prof. Khadiv. Doch was für einen Menschen einfach ist, kann für einen Roboter sehr komplex sein: Er muss herausfinden, wie er das Blatt greift, wo er es hinlegt; abschätzen, wie schwer der Karton ist; entscheiden, ob er ihn kurz absetzen sollte, bevor er die Tür aufmacht, ob er besser zwei Mal geht statt alles in einem Zug zu erledigen. „Ein Blatt aufzulesen ist für einen Roboter extrem schwierig, dafür fällt es ihm leicht, Schach zu spielen“, so der Wissenschaftler. „Beim Menschen ist es genau umgekehrt.“
Deshalb soll Prof. Khadivs Roboter Automan im ersten Schritt von Menschen verschiedene Fertigkeiten lernen, indem der eingesetzte Algorithmus von Videos aus dem Internet lernt: Je mehr Daten zur Verfügung stehen, umso besser versteht der Algorithmus, wie Menschen sich bewegen und kann diese Erkenntnis auf die Physis des Roboters und die dazugehörige Steuerung anpassen. Verkörperte Künstliche Intelligenz nennen das die Forschenden. Diese Art von maschinellem Lernen fehlt bislang den meisten Robotersystemen.
Drei Jahre bis zum Treppensteigen
Majid Khadiv ist optimistisch, das zu ändern. Schon bei seinen bisherigen Forschungsstationen hat er kniffelige Aufgaben gelöst. Mit seiner Doktorarbeit an der Universität von Teheran in seinem Heimatland Iran stieg Khadiv in die Forschungen des humanoiden Roboters Surena ein. Und das bedeutete erst einmal eine lange Suche nach der richtigen Lösung. „Es dauerte ein ganzes Jahr, bis Surena laufen konnte und drei Jahre, ehe er Treppen steigen konnte“, so Khadiv.
2018 wechselte er als wissenschaftlicher Mitarbeiter ans Max-Planck-Institut für Intelligente Systeme in Tübingen. Hier benötigten die Forschenden immerhin „nur“ sechs Monate, bis ihr zweibeiniger Roboter Bolt schließlich laufen konnte. Die Phasen der Frustration, in der wenig so funktioniert, wie man sich das erhofft hatte, gehören für Khadiv inzwischen zur Forschung dazu. Doch hat er auch diesen „magischen Moment“ kennengelernt, wenn es plötzlich doch funktioniert. „Wunderschön“ sei es gewesen, als Bolt schließlich zum ersten Mal lief. Für Khadiv ist klar: „Wenn Du etwas lang genug probierst und daran glaubst, wird es irgendwann auch klappen.“
Die folgenden Videos zeigen Experimente mit dem Zweibeiner Bolt und Vierbeiner Solo:
- Zum ersten Mal schafft es der zweibeiniger Roboter Bolt zu Laufen, ohne Hinzufallen. Zum Video
- Experimente mit Robotern erfordern eine gewisse Frustrationstoleranz. Wie das Beispiel der vierbeinigen Roboters Solo zeigt, ist er in der Lage, dazuzulernen und schafft letztlich den Sprung auf eine erhöhte Plattform. Zum Video
- Das Video zeigt, wie der vierbeinige Roboter mithilfe von Reinforcement Learning in der Lage ist, sich an neue Randbedingungen (anderer Untergrund, Stöße von der Seite) anzupassen. Zum Video
- Der humanoide Roboter Surena hat Laufen gelernt (Jahr 2015). Mit dabei: Majid Khadiv. Zum Video
Technische Universität München
Corporate Communications Center
- Andreas Schmitz
- presse @tum.de
- Teamwebsite
Kontakte zum Artikel:
Prof. Majid Khadiv
Professor für AI Planning in Dynamic Environments
Technische Universität München (TUM)
majid.khadiv@tum.de