или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

C-LEARN – новый подход к обучению роботов из MIT (+видео)

schedule 15.05.2017 в 08:43 link C-LEARN обучение роботов MIT США
Многие до сих пор вспоминают, как неуклюже и медленно двигались роботы на DARPA Robotics Challenge (DRC) в 2015 году. Особенно эксперты удивляются тому, что гуманоиды постоянно падали, пытаясь справиться с простыми вещами, такими как открытие двери. Но исследователи Лаборатории искусственного интеллекта (CSAIL) Массачусетского технологического института разработали метод обучения роботов, который мог бы сделать машины более искусными в физических задачах при работе в чрезвычайных ситуациях, - сообщает Robotics.ua



Принцип обучения C-LEARN

Обучение с ограничениями C-LEARN (Constraints Learning) объединяет базу знаний с демонстрациями, предоставляя в основном роботу информацию, а затем инструкции о том, как выполнить задачу.

Одним из аспектов является планирование движения, которое представляет собой серию шагов, которые робот должен предпринять для выполнения задачи в физическом мире. C-LEARN сочетает в себе методы машинного обучения и планирования движения, чтобы люди, которые не являются робототехниками или программистами, могли обучать робота новым задачам, а те делились бы опытом с другими роботами. Подобный метод использовали Google в своем исследовании обучения роботов друг другу.

Этот подход объединяет два общих метода программирования движения в робототехнике: демонстрацию – например, перемещение манипулятора вручную, чтобы он взял чашку, и методы планирования движения, такие как оптимизация и выбор, в которых программист определяет цель задачи и любые ограничения в ней.

Первый метод часто трудно распространить на другие ситуации, в то время как второй может потребовать много времени и требует участия эксперта. Вместе с C-LEARN люди могут научить робота новым трюкам, просто предоставив ему базовую информацию о манипулировании вещами, а затем выполнив одну демонстрацию. Этот метод также позволяет машине приспосабливаться к новым ситуациям, например, если она сталкивается с препятствием, используя ту же информацию.

Ход исследования

Исследователи протестировали этот подход с Optimus, двуруким роботом-сапером с 16 степенями свободы. Он использует манипуляторы Robotiq и передвигается на автономной наземной машине Husky Clearpath Robotics. Ему были поставлены такие задачи, как перемещение цилиндра в ведро, извлечение цилиндров из ящика, открытие маленькой двери и манипуляции с подносом.

После предоставления роботу информации о том, как захватывать разные объекты, использовался 3D-интерфейс, показывающий машине, как выполнить определенную задачу, посредством серии шагов, известных как ключевые кадры. Обратившись к имеющейся у него информации о захвате, робот может автоматически формулировать свои собственные планы движения, которые оператор может редактировать.

«Этот подход на самом деле очень похож на то, как люди учатся новым задачам на основе имеющихся знаний», - говорит автор исследования, студент Claudia Pérez-D'Arpino. - «Мы не можем обучиться чему-то из одной демонстрации, поэтому мы принимаем новую информацию и сопоставляем ее с предыдущими знаниями о нашей среде».

Робот смог лучше работать с человеком-оператором, который мог исправить небольшие ошибки по сравнению с автономным поведением.

«Автономное выполнение привело к успеху в 87,5% в среднем в 10 испытаниях по каждой из четырех задач, в то время как метод общей автономии привел к общему успеху в 100%», - говорит соавтор Julie Shah, профессор Массачусетского технологического института.

По информации robotics.ua, исследователи также смогли передать навыки, приобретенные Optimus, в симулированную версию Atlas, 180 см двуногого робота с 28 степенями свободы от Boston Dynamics, которого MIT использовали в финале DRC. Есть надежда, что C-LEARN лучше подготовит роботов к реагированию на стихийные бедствия и другие чрезвычайные ситуации, когда каждое движение управляется дистанционно, а также работать в передовых производственных и эксплуатационных ролях.

Читайте также: У андроида Atlas новый алгоритм ходьбы по сложному рельефу (+видео). 

«Традиционное программирование роботов в реальных сценариях затруднено, утомительно и требует много знаний о домене», - говорит Шах. «Было бы намного эффективнее, если бы мы могли больше обучать их, как мы обучаем людей: давать им некоторые базовые знания и одну демонстрацию. Это захватывающий шаг в обучении роботов выполнению сложных многоступенчатых задач, необходимых для сборочного производства и обслуживания кораблей или самолетов».

Видео

Комментарии: