или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Самообучение робота методом проб и ошибок

schedule 26.05.2015 в 11:06 link PR2 Willow Garage wil UC Berkeley university of Berkeley
Исследователи Калифорнийского университета в Беркли разработали алгоритмы, которые позволяют роботам узнавать моторные задачи путем проб и ошибок, используя процесс, который более приближен к способности людей обучаться чему-то новому. Это отмечает важную веху в области искусственного интеллекта, - сообщает Robotics.ua.

Они продемонстрировали технику и тип обучения, где робот выполняет различные задачи, как поставить вешалку на стойку, перемещение игрушечного самолета, закручивание крышки на и другие без программирования подробной информации о его окружающей среде.



«Это новый подход к расширению возможностей робота обучаться», - сказал профессор Питер Эббиль (Pieter Abbeel) из факультета электротехники и компьютерных наук Калифорнийского университета в Беркли. «Главное то, что, когда робот сталкивается с чем-то новым, мы не должны перепрограммировать его. Точно такое же программное обеспечение было использовано для того, чтобы робот узнал все разные задачи, которые мы ему давали».

Последнее исследование будет представлено в четверг 28 мая в Сиэтле на Международной конференции по робототехнике и автоматизации ICRA. Эббиль ведет проект и с другими преподавателями с Беркли,в частности с Тревором Дарреллом, директором учебного центра по компьютерному зрению. Другие члены исследовательской группы – научный исследователь Сергей Левайн и студент Челси Финн.

Работа является частью новой инициативы People and Robots Initiative в центре УК для информационных технологий исследований в интересах общества (CITRIS). Новая многопрофильная исследовательская инициатива стремится сохранить головокружительные успехи в области искусственного интеллекта, робототехники и автоматизации в соответствие с потребностями человека.

«Большинство приложений роботов применяются в контролируемых условиях, где объекты находятся в предсказуемых позициях», сказал Даррелл. «Сложностью обучения робота, как дома так и в офисе, является то, что эти среды постоянно меняются. Робот должен уметь воспринимать и адаптироваться к любым условиям.»

Нейронное вдохновение


Обычные, но непрактичные подходы к помощи робота сделать свой путь через 3D мир, включают предварительное его программирование, чтобы обрабатывать огромный спектр возможных сценариев или создание смоделированных условий, внутри которых робот работает.

Вместо этого, исследователи Беркли обратились к новой отрасли искусственного интеллекта, известной как глубокое обучение, которое работает на основе нервной схемы мозга человека, когда он воспринимает и взаимодействует с миром.

«При всей нашей универсальности люди не рождаются с различными формами поведения, которые могут быть развернуты как складной нож, мы ведь не запрограммированы», сказал Левайн. "Вместо этого, мы узнаем новые навыки в течение нашей жизни от опыта и от других людей. Этот процесс обучения настолько глубоко укоренился в нашей нервной системе.»

В мире искусственного интеллекта глубокие программы обучения создают нейронные сети, в которых слои искусственных нейронов обрабатывают перекрытия сырой сенсорной информации, будь то звуковые волны или пиксели изображения. Это помогает роботу распознавать образы и категории среди данных, которые он получает. Люди, которые используют Siri на их айфонах, речь в тексте программы Google или GoogleStreet View, возможно, уже воспользовались значительными достижениями глубокого обучения.

Применение глубокого обучения в двигательных задачах было гораздо более сложным, так как задача выходит за рамки пассивного распознавания образов и звуков. «Перемещение в неструктурированной среде 3D является совсем другой игрой», сказал Финн. «Нет помеченных направлений, нет примеров того, как решить проблему заранее. Нет примеров правильного решения, как можно было бы в программах распознавания речи и зрения.»

Повторение – мать учения

В экспериментах исследователи работали с роботом PR2 от WillowGarage, которому они дали прозвище BRETT, сокращено от Berkeley Robot for the Elimination of Tedious Tasks. Они представили BRETT с серией двигательных задач, таких как размещение блоков в соответствующие отверстия или укладкаLego-блоков.Алгоритм управления обучения BRETT включал функции вознаграждения, которые обозначались счетом на основе того, насколько хорошо робот выполнял эту задачу.



Алгоритм обеспечивает обратную связь в режиме реального времени через счет на основе движений робота. Движения, которые продвигают робота ближе к завершению задачи, приносят больше очков, чем те, которые этого не делают.С обратными каналами через нейронные сети робот может узнать, какие движения лучше для задачи.

Этот процесс обучения лежит в основе способности робота узнать о самом себе. Когда PR2 перемещает свои руки и управляет объектами, алгоритм вычисляет хорошие значения для 92000 параметров нейронной сети, по которым он должен обучаться.

При таком подходе, когда даны соответствующие координаты начала и конца задачи, PR2 может освоить типичное назначение приблизительно за 10 минут. Перед размещением объектовему нужно научиться сопоставить зрение и контроль вместе, когда процесс обучения занимает около трех часов. Эббиль говорит, что вероятно, можно увидеть значительные улучшения в способности обрабатывать большие объемы данных. «С большим количеством данных вы можете начать обучение более сложным вещам», сказал он. «У нас еще длинный путь, прежде чем наши роботы смогут научиться чистить дом или отсортировать белье, но наши первоначальные результаты показывают, что эти виды глубоких методов обучения могут иметь преобразующее воздействие в плане позволять роботам узнавать сложные задачи полностью из нуля. В ближайшие 5-10 лет мы можем увидеть значительные достижения в возможности обучения роботов с помощью этой работы».

Видео

Комментарии: