Werden große Sprachmodelle die Robotik revolutionieren?
Die wichtigsten Erkenntnisse
- Covariant verwendet LLMs, um Robotern mehr Flexibilität bei der Entscheidungsfindung in Echtzeit zu verleihen.
- Die herkömmliche Roboterprogrammierung hat ihre Grenzen, aber der Ansatz von Covariant bietet Anpassungsfähigkeit für komplexe Aufgaben.
- Amazon stellte die Gründer von Covariant ein und signalisierte damit das Potenzial der KI-gesteuerten Robotik für die globale Logistik.
- Die Technologie könnte die Handhabung der Artikelsortierung durch Roboter und die Logistikabläufe von Unternehmen wie Amazon revolutionieren.
- Die Schnittstelle zwischen KI und Robotik wird industrielle Abläufe auf globaler Ebene verändern.
Hans Moravec, Lehrbeauftragter am Robotics Institute der Carnegie Mellon University, schrieb im Jahr 1988: „Es ist vergleichsweise einfach, Computer in Intelligenztests oder beim Damespiel auf das Niveau eines Erwachsenen zu bringen, jedoch schwierig bis unmöglich, ihnen die Fähigkeiten eines Einjährigen in Bezug auf Wahrnehmung und Mobilität zu vermitteln.“
Ein anderer Denkansatz bezieht sich auf das Autofahren. In den USA erwerben Schüler im Alter von etwa 16 Jahren im folgenden Sommer, in der Regel zwischen dem zweiten und dritten High-School-Jahr, üblicherweise einen „Lernführerschein“. Im Laufe des Sommers absolviert der Fahrschüler an der Seite eines lizenzierten Fahrers eine bestimmte Anzahl von Fahrstunden und Kilometern. In den meisten Fällen reicht dies aus, um die „Fahrprüfung“ abzulegen, die jeweils in den einzelnen Bundesstaaten durchgeführt wird.
Auf der anderen Seite gibt es autonome Fahrsysteme, die in vielen Fällen in Simulationen mit der Erfahrung von Milliarden von gefahrenen Kilometern trainiert werden. Diese Systeme, die bereits Milliarden von Kilometern virtuell zurückgelegt haben, genießen nicht das nötige Vertrauen, um auf der ganzen Welt eingesetzt zu werden.
Es gibt zahlreiche Beispiele wie dieses, in denen immer deutlicher wird, dass die Lernmethoden von Menschen und von Computersystemen völlig unterschiedlich sind.
Der Fall von Covariant
Covariant Robotics hat eine großartige Website, auf der verschiedene Videos von Robotersystemen zu sehen sind, die unterschiedliche Aufgaben erfüllen. Wir weisen Anleger gerne darauf hin, weil es eine einfache Möglichkeit ist, zu zeigen, was wir für einen sehr wichtigen, zentralen Punkt halten:
- Die „alte Methode“, ein Robotersystem zu betreiben, besteht darin, dass man dem System genau vorgibt, was es tun soll. Das Positive daran ist, dass das System völlig deterministisch ist – der Roboter wird nie etwas Unerwartetes tun. Das Problem dabei ist, dass der Roboter die Aufgabe nicht erfüllen kann, wenn sie nicht explizit programmiert ist.
- Die „neue Methode“, ein Robotersystem zu betreiben, besteht darin, ein großes Sprachmodell (LLM) auf eine Aufgabe zu richten und dem System ein Gesamtziel zu geben. Ein Beispiel wäre das Sortieren verschiedener Artikel in einem Container. Anstatt jedes mögliche Szenario zu programmieren und zu versuchen, jede einzelne Kombination von Artikeln in einem Container zu berücksichtigen, könnte das System die Artikelsortierung aus einem Container auf der Basis bestimmter Grundprinzipien optimieren. Der Vorteil ist natürlich Flexibilität. Das Risiko besteht aber darin, dass es schwierig sein könnte, zu verstehen, was der Roboter tun wird – was unter Umständen eine gefährliche Situation schafft, wenn sich zum Beispiel Menschen in der Nähe des Roboters aufhalten.
Darin liegt unseres Erachtens die Stärke dessen, was die Videos auf der Website von Covariant zeigen. Das System koppelt das Steuerungssystem des Roboters mit einer natürlichsprachlichen Schnittstelle, sodass bei den verschiedenen Versuchen des Systems, eine Aufgabe zu erfüllen, Text auf einem Bildschirm angezeigt wird und erklärt, was der Roboter gerade versucht.
Besonders aussagekräftig ist das Video mit dem Greifsystem, das hauptsächlich auf Saugkraft basiert und versucht, Sockenpaare aufzuheben und zu sortieren. Wenn man sich die übliche Verpackung von Socken vorstellt, befindet sich in der Mitte ein glattes, haftendes, papierartiges Band, über das die Stoffsocken oben und unten herausragen.
Amazon stellt die Gründer von Covariant ein1
Amazon ist eines der beeindruckendsten Beispiele für Logistikmanagement, das wir je im globalen Handel erlebt haben. Es kann viele verschiedene Artikel in nur einem Tag oder schneller an fast jeden Ort der Welt liefern. Es ist ein unglaublicher Betrieb.
Intuitiv würden Roboter zu diesen Bemühungen beitragen, da sie unermüdlich rund um die Uhr und an 365 Tagen im Jahr arbeiten können. Ein wesentlicher Bestandteil der Anforderungen ist jedoch die Möglichkeit, nahezu alle Arten von Artikeln zu greifen und entsprechend zu sortieren. Denken Sie an die Worte von Hans Moravec: Ein System zu entwickeln und zu programmieren, das jedes beliebige Objekt korrekt handhaben kann, ist weitaus schwieriger, als es scheint.
Als wir einen Artikel in WIRED entdeckten, der besagte, dass Amazon die Gründer von Covariant einstellt und dessen Technologie lizenziert, waren wir begeistert. Die Website von Covariant war schon immer spannend. Wenn wir jedoch in den kommenden Jahren die Geschichte erzählen können, wie Robotertechnologie, die sich mit LLMs vernetzt, den Logistikbetrieb von Amazon antreibt, wird diese Geschichte im Grunde selbsterklärend, was das Leistungspotenzial der Kombination aus Robotik und KI angeht. Es ist noch recht früh, aber Robotik ist ein Thema, das wir genau im Auge behalten werden.
Quelle
1 Knight, Will. „This Could Be the Start of Amazon’s Next Robot Revolution.“ WIRED. 4. September 2024.