Will large language models change robotics FR

Les grands modèles de langage transformeront-ils la robotique ?

13 nov. 2024

Global Head of Research, WisdomTree

À retenir

Covariant utilise les LLM pour conférer aux robots plus de flexibilité dans la prise de décisions en temps réel.
Contrairement à une programmation robotique traditionnelle limitée, l’approche de Covariant permet une adaptabilité face à des tâches complexes.
Amazon a recruté les fondateurs de Covariant, ce qui témoigne du potentiel de la robotique pilotée par l’IA dans le domaine de la logistique mondiale.
Cette technologie pourrait révolutionner la manière dont les robots gèrent le tri des articles et les opérations logistiques pour des entreprises telles qu’Amazon.
L’intersection entre l’IA et la robotique pourrait transformer les opérations industrielles à l’échelle mondiale.

Hans Moravec, membre adjoint du corps professoral de l’Institut de robotique de l’Université Carnegie Mellon, a écrit en 1988 : « Il est relativement facile de faire en sorte que les ordinateurs réalisent des performances du niveau d’un adulte lors de tests d’intelligence ou au jeu de dames. En revanche, il est difficile voire impossible de leur conférer les compétences d’un enfant d’un an en matière de perception et de mobilité ».

Pour illustrer ce point, nous pouvons également prendre l’exemple de la conduite d’un véhicule. Aux États-Unis, il est courant pour un lycéen d’environ 16 ans d’obtenir un « permis d’apprentissage » durant l’été, généralement entre la deuxième année et la troisième année de lycée. Au cours de l’été, aux côtés d’un conducteur agréé, le lycéen accumule un certain nombre d’heures et de kilomètres d’expérience de conduite. Dans la plupart des cas, cela suffit pour réussir l’ « épreuve de conduite » qui est administrée au niveau des États.

D’un autre côté, il existe des systèmes de conduite autonome qui ont été formés, dans de nombreux cas en simulation, ce qui équivaut à plusieurs milliards de kilomètres parcourus. Pourtant forts d’une expérience virtuelle de plusieurs milliards de kilomètres, ces systèmes ne sont pas considérés comme suffisamment fiables pour pouvoir être déployés à travers le monde.

De nombreux cas comme celui-ci existent, qui illustrent de plus en plus clairement que la manière dont les humains apprennent est totalement différente de celle dont les systèmes informatiques apprennent.

Le cas de Covariant

Covariant Robotics dispose d’un excellent site Web, sur lequel il est possible de visionner différentes vidéos de systèmes robotiques effectuant diverses tâches. Nous aimons le souligner auprès des investisseurs, car cela illustre de manière simple un aspect que nous considérons extrêmement important :

L’« ancienne approche » d’exécution d’un système robotique consiste à programmer ce système pour qu’il accomplisse précisément une tâche. L’avantage de cette approche est que le système est entièrement déterministe, c’est-à-dire qu’un robot n’effectuera jamais quelque chose d’inattendu. L’inconvénient en revanche est que si la tâche ne peut pas être explicitement programmée, le robot ne sera pas en capacité de l’accomplir.

La « nouvelle approche » d’exécution d’un système robotique consiste à guider un grand modèle de langage (LLM) vers une tâche, et à indiquer au système un objectif global. Il peut s’agir par exemple de trier différents éléments dans un conteneur. Au lieu de programmer tous les scénarios possibles et de chercher à prendre en compte toutes les combinaisons potentielles d’éléments dans un conteneur, le système pourrait optimiser le tri des éléments du conteneur sur la base d’un ensemble de principes fondamentaux. L’avantage d’une telle approche réside bien entendu dans la flexibilité acquise, mais le risque est qu’il peut être difficile de comprendre ce que le robot va faire, créant ainsi un ensemble de circonstances potentiellement dangereuses si, par exemple, des personnes sont placées à proximité du robot.

De notre point de vue, les vidéos du site Web de Covariant illustrent formidablement cette question. Le système associe les commandes du robot à une interface en langage naturel, de sorte que lorsque le dispositif effectue différentes tentatives pour accomplir une tâche, l’écran affiche un texte expliquant ce que le robot est sur le point d’essayer.

La vidéo qui fait apparaître le système de préhension, principalement basé sur des tentatives d’aspiration pour ramasser et trier des paires de chaussettes, est particulièrement fascinante. Si l’on imagine comment les chaussettes sont le plus souvent emballées, on trouve généralement une surface lisse et adhésive en matériau de type papier au centre, avec le tissu des chaussettes qui dépasse à chaque extrémité.

En tant que personnes vivant dans le monde réel, nous savons ce qui risque de se produire si le système tente de ramasser les chaussettes en aspirant la partie en tissu : il ne sera pas possible d’obtenir une étanchéité suffisante pour que l’aspiration fonctionne. Il est plus facile pour le système de se concentrer sur la partie lisse de l’emballage en papier, soit, bien souvent, l’étiquette.

Le système de Covariant vous permet de visualiser le texte du système robotique pendant qu’il résout ce problème en temps réel.

Amazon recrute les fondateurs de Covariant¹

Amazon constitue l’un des plus formidables cas d’étude de la gestion logistique que nous ayons jamais observés dans le domaine du commerce mondial. L’entreprise est capable de livrer de nombreux articles différents dans un délai d’une journée, voire moins, vers quasiment n’importe quelle destination à travers le monde. C’est une véritable prouesse opérationnelle.

Si l’on raisonne intuitivement, les robots pourraient contribuer à cet effort, puisqu’ils peuvent fonctionner sans relâche, 24 heures sur 24, 7 jours sur 7, 365 jours par an. Or, pour cela, il est notamment nécessaire qu’ils puissent attraper et trier correctement quasiment tous les types d’articles. Rappelez-vous ce que souligne Hans Moravec : développer et programmer un système capable de gérer correctement n’importe quel objet est beaucoup plus difficile qu’il n’y paraît.

Lorsque nous avons découvert dans une publication de WIRED qu’Amazon recrutait les fondateurs de Covariant et entendait utiliser sa technologie sous licence, notre enthousiasme a été total. Il a toujours été fascinant de visiter le site Web de Covariant. Pour autant, si dans les prochaines années nous pouvons commencer à raconter comment la technologie robotique, combinée aux LLM, alimente l’activité logistique d’Amazon, alors cette histoire deviendra tout simplement explicite en termes de puissance de l’intersection entre la robotique et l’IA. Il est encore relativement tôt, mais nous continuerons de surveiller de très près l’évolution de la robotique.

Source

¹ Knight, Will. “This Could Be the Start of Amazon’s Next Robot Revolution.” WIRED. 4 September 2024.

Terms & Conditions

Conditions générales

Ressortissants des États-Unis

Exclusion de responsabilité

Avertissements sur les risques

Cookies

Les grands modèles de langage transformeront-ils la robotique ?

À retenir

Tags

About the Contributor

BIENVENUE DANS L’AVENIR DE L’INVESTISSEMENT

BIENVENUE DANS L’AVENIR DE L’INVESTISSEMENT

Terms & Conditions

Conditions générales

Ressortissants des États-Unis

Exclusion de responsabilité

Avertissements sur les risques

Cookies

Les grands modèles de langage transformeront-ils la robotique ?

À retenir

Blogs associés

Tags

About the Contributor

BIENVENUE DANS
L’AVENIR DE L’INVESTISSEMENT