или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Google заставляет роботов обучать друг друга (+видео)

schedule 06.10.2016 в 08:52 link Google
Мы, люди, можем делиться своим опытом и знаниями с помощью языка и демонстрации. Роботы имеют потенциал мгновенно делиться всеми навыками, которым они научились с другими роботами просто через передачу информации по сети. Именно это «облако робототехники» ищут исследователи Google, чтобы помочь роботам получать необходимые навыки быстрее, чем традиционными способами, - передает Robotics.ua.



Основы технологии

Человеческий мозг имеет миллиарды нейронов, которые образуют между собой неисчисляемое количество соединений. Когда мы думаем и обучаемся, нейроны взаимодействуют друг с другом, получая некоторые связи, которые будут выбраны снова в будущем для обучения и формирования наших действий.

Искусственная нейронная сеть следует аналогичной структуре в меньшем масштабе. Роботам может быть дано задание и поручено использовать метод проб и ошибок, чтобы определить наилучший способ достижения цели. Уже на раннем этапе их поведение может выглядеть совершенно странным для стороннего наблюдателя, но, пробуя разные вещи, с течением времени они узнают, какие действия продвигают их ближе к цели и сосредотачивают внимание на тех, кто постоянно совершенствует свои способности.

Несмотря на свою эффективность, этот процесс занимает много времени. Поэтому исследователи ищут другие способы. Вместо того, чтобы каждый робот прошел через фазу экспериментирования по отдельности, их коллективные усилия могут быть совместными, эффективно позволяя одному роботу научить другого выполнить простую задачу, как открытие двери или перемещение объекта. Периодическая загрузка данных, которым они научились на сервере и последней версии, означает, что каждый из них имеет более полную картину, чем любой другой через индивидуальный опыт.

Результаты экспериментов

Используя эти знания, команда Google Research провела три различных типа экспериментов, обучая роботов по-разному найти наиболее эффективный и точный способ построить общую модель навыков.

В первом нескольким роботам на общей нейронной сети была поставлена задача открыть дверь методом проб и ошибок. Как показывает видео ниже, сначала они слепо шарили вокруг,  исследуя и выясняя, какие из действий подтолкнут их ближе к цели.



Через несколько часов экспериментов роботы работали все вместе, открывая дверь: тянулись к ручке, поворачивали и толкали. Они понимали, что эти действия приводят к успеху без необходимости построения явной модели.



Во втором эксперименте исследователи протестировали модель прогнозирования. Роботы получили поднос, полный повседневных предметов, и как они манипулировали этими предметами, они развивали базовое понимание причинно-следственных связей. Опять же, их выводы были общими, и группа может использовать их постоянно, совершенствуя причинно-следственную модель, чтобы предсказать, какие действия приведут к результату.

Используя компьютерный интерфейс, показывающий место испытания, исследователи могли бы указать, где роботы перемещают объект, щелкнув по нему, а затем выбрать место. Робот может опираться на свой общий опыт прошлых усилий, чтобы найти лучшие действия для достижения этой цели.

И, наконец, команда использовала человеческий контроль, чтобы научить другую партию роботов открывать дверь. Каждый робот был вручную перемещен исследователем через шаги к цели, а затем повторял эту цепочку действий, формируя «поведение» для выполнения основной задач – открытия двери.



Затем роботы методом проб и ошибок закрепляли свои умения. Поскольку каждый робот исследовал небольшие изменения в том, как выполнить задачу, они становились лучше в своей работе вплоть до момента, когда их коллективный опыт позволил им учитывать незначительные отклонения и обрабатывать позиции, не известные раньше.

В чем смысл всего этого? Для нейронных сетей чем больше данных, тем лучше. Поэтому команда роботов, обучающихся одновременно и показывающих друг другу, может производить лучшие результаты гораздо быстрее, чем один робот, обучающийся в одиночку. Ускорение этого процесса может открыть возможности для роботов, чтобы обрабатывать более сложные задачи быстрее.

Комментарии: