Google koristi AI jezične modele za poboljšanje robota za kućne pomoćnike

  • Sep 05, 2023

Veliki jezični modeli mogu pomoći robotima da identificiraju vještine koje su im potrebne za dovršenje određenog zadatka.

Kuhinjski robot
Slika: onurdongel / GettyImages

Istraživači na Svakodnevni roboti koriste modele jezika velikih razmjera kako bi pomogli robotima da izbjegnu pogrešno tumačenje ljudske komunikacije na načine koji bi mogli pokrenuti neprikladne ili čak opasne radnje.

Everyday Robots u vlasništvu Google Researcha i Alphabeta integriraju ono što nazivaju 'SayCan' (jezični modeli s temeljima u stvarnom svijetu u unaprijed obučenim vještinama) i svoj najveći jezični model -- PaLM, ili Jezični model putova.

Ova kombinacija, tzv PaLM-SayCan, pokazuje put naprijed za pojednostavljenje komunikacije između čovjeka i robota i poboljšanje performansi robotskih zadataka.

"PaLM može pomoći robotskom sustavu da obradi složenije, otvorene upite i odgovori na njih na načine koji su razumni i razumni," objašnjava Vincent Vanhoucke, istaknuti znanstvenik i voditelj robotike u Google Researchu.

Dok veliki jezični modeli poput 

OpenAI-jev GPT-3 može simulirati kako ljudi koriste jezik i pomoći programerima putem prijedloga za automatsko kodiranje kao što je GitHubov Copilot, oni ne prelaze u fizički svijet u kojem bi roboti jednog dana mogli raditi unutar kućnog okruženja.

Što se tiče robotike, roboti koji se danas koriste u tvornicama kruto su programirani. Googleovo istraživanje pokazuje kako bi ljudi jednog dana mogli koristiti prirodni jezik da robotu postave pitanje koje zahtijeva robota kako bi razumio kontekst pitanja, a zatim izvršio razumnu radnju u danom trenutku postavljanje.

Na primjer, danas, na upit GPT-3 s "Prolio sam piće, možete li pomoći?", dobiva odgovor: "Mogli biste pokušati upotrijebiti usisivač." To je vjerojatno opasna radnja. Googleov AI zasnovan na razgovoru ili dijalogu, LaMDA, daje odgovor: "Hoćeš li da nađem čistač?", dok drugi model, FLAN, kaže: "Žao mi je, nisam ga htio proliti." 

Tim iz Google Research and Everyday Robots testirao je pristup PALM-SayCan s robotom u kuhinjskom okruženju.

Njihov pristup uključivao je 'uzemljenje' PaLM-a u kontekstu robota koji prima upute visoke razine od a čovjeka gdje robot treba shvatiti što je korisna radnja i što je u tome sposoban okoliš.

Sada, kada Googleov istraživač kaže "Prolio sam svoje piće, možete li pomoći?", robot se vraća sa spužvom i čak pokušava staviti praznu limenku u pravu kantu za recikliranje. Daljnja obuka mogla bi uključivati ​​dodavanje vještine za brisanje izlijevanja.

Vanhoucke objašnjava kako utemeljenje jezičnog modela funkcionira u PaLM-SayCan-u.

"PaLM predlaže moguće pristupe zadatku na temelju razumijevanja jezika, a modeli robota čine isto na temelju izvedivog skupa vještina. Kombinirani sustav potom uspoređuje to dvoje kako bi pomogao identificirati korisnije i ostvarive pristupe za robota."

Osim što ljudima olakšava komunikaciju s robotima, ovaj pristup također poboljšava performanse robota i sposobnost planiranja i izvršavanja zadataka.

U njihovom radu 'Radi kako mogu, a ne kako ja kažem', Googleovi istraživači objašnjavaju kako su strukturirali robotove sposobnosti planiranja da identificiraju jednu od njegovih 'vještina' na temelju prema uputama na visokoj razini od čovjeka, a zatim procijeniti koliko je vjerojatno da će svaka moguća vještina ispuniti uputa.

„Praktično, planiranje strukturiramo kao dijalog između korisnika i robota, u kojem korisnik daje vrhunac nastava na razini, npr. 'Kako bi mi donio limenku Cole?' a jezični model odgovara eksplicitnom sekvencom npr. 'Ja bih: 1. Pronađi limenku Cole, 2. Uzmi limenku Cole, 3. Donosim ga tebi, 4. Gotovo'."

"Ukratko, s obzirom na poduku visoke razine, SayCan kombinira vjerojatnosti iz jezičnog modela (predstavljajući vjerojatnost da je vještina korisna za uputa) s vjerojatnostima iz funkcije vrijednosti (koja predstavlja vjerojatnost uspješnog izvršavanja navedene vještine) za odabir vještine za izvoditi. Ovo emitira vještinu koja je i moguća i korisna. Proces se ponavlja dodavanjem odabrane vještine odgovoru robota i ponovnim upitom za modele, sve dok izlazni korak ne završi."

Robotika

Ova protetička ruka koju pokreće AI donosi dizajn i stil u proizvod koji mijenja život
Najbolji robotski usisavači koji su sada dostupni
Zašto studenti dobivaju sve cool robote?
5 najboljih robotskih kosilica: njega travnjaka bez ruku
  • Ova protetička ruka koju pokreće AI donosi dizajn i stil u proizvod koji mijenja život
  • Najbolji robotski usisavači koji su sada dostupni
  • Zašto studenti dobivaju sve cool robote?
  • 5 najboljih robotskih kosilica: njega travnjaka bez ruku