I modelli linguistici di grandi dimensioni trasformeranno la robotica?
Principali insegnamenti
- Covariant si avvale di LLM per dare ai robot maggiore flessibilità nel processo decisionale in tempo reale.
- La programmazione robotica tradizionale è limitata, ma l'approccio di Covariant offre la possibilità di adattamento a compiti complessi.
- Amazon ha assunto i fondatori di Covariant, confermando il potenziale della robotica guidata dall'intelligenza artificiale nella logistica globale.
- Questa tecnologia potrebbe rivoluzionare il modo in cui i robot gestiscono lo smistamento degli articoli e le operazioni logistiche per aziende come Amazon.
- L’integrazione tra IA e robotica è destinata a trasformare le operazioni industriali su scala globale.
Hans Moravec, membro associato di facoltà presso la Robotics Institute of Carnegie Mellon University, nel 1988 scrisse: “È relativamente facile far sì che i computer mostrino prestazioni di livello adulto nei test di intelligenza o nel gioco degli scacchi, ma è difficile o addirittura impossibile dare loro le competenze di un bambino di un anno quando si tratta di percezione e mobilità”.
Un altro aspetto da considerare riguarda la guida. Negli Stati Uniti, è normale che uno studente di scuola superiore di circa 16 anni ottenga un “permesso di guida” nell'estate immediatamente successiva al raggiungimento di una certa soglia, di solito tra il secondo e il terzo anno di scuola. Nel corso dell'estate, lo studente, affiancato da un conducente autorizzato, acquisisce un certo numero di ore e chilometri di esperienza di guida. Nella maggior parte dei casi, questo è sufficiente per sostenere l'esame di guida, che viene svolto in base allo Stato di appartenenza.
D'altro canto, esistono sistemi di guida autonoma che sono stati addestrati, in molti casi con simulazione, per l'equivalente di diversi miliardi di chilometri percorsi. Questi sistemi, nonostante i miliardi di chilometri percorsi virtualmente, non sono abbastanza affidabili per essere diffusi in tutto il mondo.
Esistono molti casi come questo, in cui diventa sempre più evidente che il modo in cui gli esseri umani e i sistemi informatici apprendono è totalmente diverso.
Il caso di Covariant
Covariant Robotics dispone di un ottimo sito web in cui è possibile visionare diversi video che mostrano sistemi robotici impegnati in compiti diversi. Abbiamo voluto segnalarlo agli investitori, in quanto rappresenta un modo semplice per illustrare un aspetto che riteniamo molto importante e cruciale:
- Il “vecchio criterio” di gestione di un sistema robotico consiste nel programmare il sistema indicandogli esattamente cosa fare. Il vantaggio è che il sistema è completamente deterministico: non si assiste mai a un comportamento inaspettato da parte del robot. Il problema è che se il compito non può essere programmato esplicitamente, il robot non sarà in grado di svolgerlo.
- Il “nuovo criterio” di gestione di un sistema robotico consiste nel fissare un grande modello linguistico (LLM) a un compito e nel dare al sistema un obiettivo generale. Un esempio potrebbe essere lo smistamento di diversi oggetti in un contenitore. Invece di programmare ogni possibile scenario e cercare di tenere conto di ogni possibile combinazione di oggetti in un contenitore, il sistema potrebbe ottimizzare lo smistamento degli oggetti in un contenitore sulla base di una serie di principi fondamentali. Il vantaggio è ovviamente la flessibilità, ma il rischio è che potrebbe essere difficile stabilire il comportamento del robot, creando così una serie di circostanze pericolose se, ad esempio, sono presenti persone in prossimità del robot.
A nostro avviso, qui sta la forza di ciò che mostrano i video di Covariant sul suo sito web. Il sistema abbina il sistema di controllo del robot a un'interfaccia in linguaggio naturale, così che, mentre il sistema tenta di portare a termine un compito, sullo schermo appare un testo che spiega ciò che il robot sta per fare.
Il video sul sistema di presa, basato in gran parte sull'aspirazione, che mostra il tentativo di raccogliere e smistare le coppie di calzini è particolarmente efficace. Basta pensare a come vengono confezionati i calzini: di solito al centro si trova una superficie liscia e appiccicosa simile alla carta, mentre i calzini di stoffa si estendono al di sopra e al di sotto.
Amazon assume i fondatori di Covariant 1
Amazon rappresenta uno degli esempi più sorprendenti di gestione logistica che si siano mai visti nel commercio globale. È in grado di consegnare molti articoli diversi in un giorno o anche meno in quasi tutte le località del mondo. È un'operazione impressionante.
Intuitivamente, i robot costituirebbero un'integrazione a questo sforzo, dal momento che possono funzionare instancabilmente, 24 ore su 24, 7 giorni su 7, 365 giorni all’anno. Tuttavia, non si può prescindere dalla loro capacità fondamentale di raccogliere e smistare quasi tutti i tipi di articoli in modo appropriato. Come ha sottolineato Hans Moravec, sviluppare e programmare un sistema in grado di gestire correttamente qualsiasi oggetto è molto più impegnativo di quanto possa sembrare.
La notizia pubblicata in un articolo su WIRED, secondo cui Amazon avrebbe assunto i fondatori di Covariant ottenendo in concessione la relativa licenza tecnologica, non poteva che entusiasmarci. Visitare il sito web di Covariant è sempre stato affascinante, ma se negli anni a venire potremo iniziare a raccontare la storia di come la tecnologia robotica combinata agli LLM sta sostenendo le operazioni logistiche di Amazon, questa storia diventerà praticamente autoesplicativa in termini di potenzialità derivanti dall'integrazione tra robotica e IA. È ancora relativamente presto, ma questa storia di robotica è per noi oggetto di grande attenzione.
Source
1 Knight, Will. “This Could Be the Start of Amazon’s Next Robot Revolution.” WIRED. 4 September 2024.