Живеем в зората на ерата на роботиката с общо предназначение. Десетки компании вече решиха, че е време да инвестират големи средства в хуманоидни роботи, които могат автономно да се движат из съществуващите работни пространства и да започнат да поемат задачи от човешки работници.
Повечето от ранните случаи на употреба обаче попадат в това, което бих нарекъл Планета Фитнес категория: роботите ще повдигайте нещата и ги оставяйте. Това ще бъде чудесно за логистика в стил склад, товарене и разтоварване на камиони и палети и какво ли още не, и преместване на неща около фабриките. Но не всичко е толкова бляскаво и със сигурност не се доближава до полезността на човешкия работник.
За да се разширят тези способности до точката, в която роботите могат да се скитат във всяко работно място и да започнат да поемат голямо разнообразие от задачи, те се нуждаят от начин за бързо повишаване на уменията си въз основа на човешки инструкции или демонстрации. И това е мястото, където Toyota твърди, че е направила огромен пробив с нов подход на обучение, базиран на политиката за разпространение, който според нея отваря вратата към концепцията за големи модели на поведение.
Изследователски институт на Toyota
Политиката за разпространение е концепция, разработена от Toyota в партньорство с Columbia Engineering и MIT, и докато детайлите бързо стават много загадъчни, когато се вгледате по-дълбоко в тези неща, групата описва общата идея като „нов начин за генериране на поведение на роботи чрез представяне визуомоторната полиция на робот като условен дифузионен процес на обезшумяване.” Можете да научите повече и да видите някои примери в групите изследователска работа.
По същество, когато големите езикови модели (LLM) като ChatGPT могат да поемат милиарди думи от човешко писане и да се научат да пишат и кодират – и дори да разсъждават, за бога – на ниво, удивително близко до човешкото, политиката за разпространение позволява на роботизираните ИИ да гледайте как човек изпълнява дадена физическа задача в реалния свят и след това по същество се програмира да изпълнява тази задача по гъвкав начин.
Докато някои стартиращи фирми обучават своите роботи чрез VR телеприсъствие – давайки на човешки оператор точно това, което очите на робота могат да видят и им позволяват да контролират ръцете и ръцете на робота, за да изпълнят задачата – подходът на Toyota е по-фокусиран върху хаптиката. Операторите не носят VR слушалки, но получават хаптична обратна връзка от меките, гъвкави ръкохватки на робота чрез своите ръчни контроли, което им позволява в известен смисъл да усетят това, което роботът чувства, когато неговите манипулатори влизат в контакт с обекти.

Изследователски институт на Toyota
След като човешки оператор е показал на роботите как да изпълняват дадена задача няколко пъти, при малко по-различни условия, AI на робота изгражда свой собствен вътрешен модел за това как изглежда успехът и провалът и след това започва да изпълнява хиляди и хиляди физики -базирани симулации, базирани на неговите вътрешни модели на задачата, за да се ориентират към набор от техники за свършване на работата.
„Процесът започва с учител, който демонстрира малък набор от умения чрез телеоперация“, казва Бен Бърчфил, който носи забавното заглавие Мениджър на ловката манипулация. „Нашата политика за разпространение, базирана на изкуствен интелект, след това се учи във фонов режим за няколко часа. Обичайно е да обучаваме робот следобед, да го оставяме да се учи през нощта и след това да дойде на следващата сутрин към работещо ново поведение.“
Екипът е използвал този подход, за да обучи бързо ботовете в повече от 60 малки, предимно кухненски задачи досега – всяка сравнително проста за средностатистическия възрастен човек, но всяка изисква роботите да разберат сами как да хващат, държат и манипулирайте различни видове предмети, като използвате набор от инструменти и прибори.

Изследователски институт на Toyota
Говорим за използване на нож за равномерно намазване на филия хляб, използване на шпатула за обръщане на палачинка или използване на белачка за картофи за обелване на картофи. Научи се да разточвате тесто в основа за пица, след това да нанасяте сос върху основата и да го разстилате с лъжица. Зловещо е като да гледаш малки деца да измислят нещата. Виж това:
Обучение на роботи на нови поведения
Toyota казва, че ще има стотици задачи под контрол до края на годината и е насочена към над 1000 задачи до края на 2024 г. Като такава, тя разработва това, което смята, че ще бъде първият голям модел на поведение, или LBM – a рамка, която в крайна сметка ще се разшири, за да стане нещо като еквивалент на въплътен робот на ChatGPT. С други думи, изцяло генериран от AI модел за това как един робот може да взаимодейства с физическия свят, за да постигне определени резултати, който се проявява като гигантска купчина данни, която е напълно неразбираема за човешкото око.
Екипът ефективно въвежда процедурата, чрез която бъдещите собственици на роботи и оператори във всякакви ситуации ще могат бързо да обучават своите ботове на нови задачи, ако е необходимо – надграждайки цели флоти от роботи с нови умения, докато вървят.
„Задачите, които наблюдавам как тези роботи изпълняват, са просто невероятни – дори преди една година не бих предвидил, че ще се доближим до това ниво на разнообразна сръчност“, казва Ръс Тедраке, вицепрезидент по изследванията на роботиката в изследователския институт на Toyota . „Това, което е толкова вълнуващо в този нов подход, е скоростта и надеждността, с които можем да добавим нови умения. Тъй като тези умения работят директно от изображения на камерата и тактилно усещане, използвайки само научени представяния, те са в състояние да се представят добре дори при задачи, които включват деформируеми предмети, плат и течности – всички от които традиционно са били изключително трудни за роботите.

Изследователски институт на Toyota
Предполага се, че LBM, който Toyota конструира в момента, ще изисква роботи от същия тип, който използва сега – специално изработени единици, предназначени за „сръчни задачи за манипулиране с две ръце със специален фокус върху активирането на тактилна обратна връзка и тактилно усещане“. Но не е нужно много въображение, за да се екстраполира идеята в рамка, която хуманоидните роботи с пръсти и противоположни палци могат да използват, за да получат контрол над още по-широка гама от инструменти, предназначени за човешка употреба.
И вероятно, тъй като LBM развива все по-всеобхватно „разбиране“ на физическия свят в хиляди различни задачи, обекти, инструменти, местоположения и ситуации, и натрупва опит с набор от динамични, реални прекъсвания и неочаквани резултати, то ще става все по-добро и по-добро в обобщаването между задачите.
Всеки ден неумолимият марш на човечеството към технологичната сингулярност изглежда се ускорява. Всяка стъпка, като тази, представлява удивително постижение и въпреки това всяка ни катапултира по-нататък към бъдеще, което изглежда толкова различно от днес – да не говорим за преди 30 години – че изглежда почти невъзможно да се предвиди. Какъв ще бъде животът през 2050 г.? Колко наистина можете да поставите извън обхвата на възможните резултати?
Закопчайте коланите приятели, това пътуване не забавя скоростта.
източник: Тойота
Публикациите се превеждат автоматично с google translate