или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Исследование: роботы учатся поведению друг у друга без программирования (+видео)

schedule 24.06.2015 в 06:24 link рой роботов исследование
Ученые из университета Бристоля провели проект Искусственная культура и выпустили исследование под названием«Об эволюции поведения через имитацию», - сообщает Robotics.ua.

Аннотация статьи:

«Эта статья описывает исследование, в котором имитация движений и поведенческая адаптация исследованы в роевой робототехнике. Мы моделируем социальное обучение в искусственных агентах с реальными роботами. Роботы способны наблюдать и учиться модели движения друг у друга, используя свои бортовые датчики и воплощая имитацию. Мы покажем, что изменения, которые возникают в процессе работы роботов, позволяют им выполнять определенные действия, которые лучше адаптированы к процессу имитации,развиваясь во множественных циклах имитации. Поскольку эти поведения являются более устойчивыми к неопределенности датчиков и исполнительных механизмов реальных роботов, они могут быть извлечены другими членами роя с более высокой точностью. Используя три различных типа памяти, мы узнали, что поведения были экспериментально проверены, чтобы исследовать влияние объема памяти на эволюцию моделей движения, и результаты показывают, что модели движений развиваются через несколько циклов имитации, отбора и изменчивости. Роботы способны  в некотором смысле обучиться структуре поведения, которому они подражали».

Теперь подробнее



В проекте Искусственная культура ученые реализовали социальное обучение в группе роботов. Роботы были запрограммированы, чтобы узнать друг от друге путем подражания. Эта имитация воплощается, когда роботы наблюдают друг у друга, используя свои бортовые датчики и визуальные данные из собственной камеры. Видео ниже показывает этот принцип:



Не удивительно, что имитация движений робот-робот является несовершенной. Сочетание факторов, включая сравнительно низкое разрешение камеры роботов, изменения в освещении, небольшие различия между роботами, относительные размеры и положения  роботов в поле зрения приводят к ошибкам имитации поведения. Некоторым моделям движения легче подражать, чем другим. Правильность подражания для роботов, так же, как для животных, является сложной функцией из четырех факторов:
  1. изучение поведения,
  2. сенсор и ум и морфология роботов, 
  3. шум окружающей среды,
  4. выведенный алгоритм обучения.


Целью ученых был способ, по которому поведение развивается и распространяется через рой. Воздействие шума на социальное обучение означает, что поведение может меняться в зависимости, как оно копируется от одного робота к другому. Множество циклов имитации приводит к поведенческой наследственности.

Эти эксперименты показывают, что приобретенная поведенческая эволюция действительно имеет место. Если выбор является случайным, то есть роботы выбирают поведение от других роботов, которые уже научились чему-то с равной вероятностью, то это представляет собой несколько интересных выводов.
  1. Если случайно один или несколько роботов следуют плохой имитации, это может привести к новым поведенческим видам или традициям. Таким образом, воздействие шума на обучение роботов может играть роль в поведенческом развитии.
  2. Очевидно, что адаптируемое поведение будет легче осуществляться с роевой робототехникой. Это способ думать о том, что датчики и органы робота и физическая среда с несколькими роботами вместе составляют «экологическую нишу» для поведенческой эволюции. Поведение мутирует, и те, кто лучше приспособленные к этой нише, выживут.
  3. Третий вывод из этой серии экспериментов, возможно, является самым неожиданным. Ученые исследовали поведенческую эволюцию с тремя объемами памяти: нулевая, ограниченная и неограниченная.

Диаграмма ниже показывает полную информацию о развитии роботов-подражателей для типичной перспективы с ограниченной памятью. В начале эксперимента роботы действовали с двумя подражателями, показанными1 и 2 в верхней части диаграммы. Поведение 1 осуществлялось по шаблону, в котором робот отслеживает путь по треугольнику. Поскольку пространство было ограничено памятью, этот кластер имеет только 20 форм поведения, и они показаны ниже в форме ромбов. Обратите внимание на кластер из 11 близкородственных  форм в правом нижнем углу, все из которых являются подражателями треугольника.



Когда исследователи провели несколько испытаний с ограниченным и неограниченным количеством памяти, затем анализировали количество и размеры кластеров, связанных с подражателями, они увидели, что испытания с ограниченной памятью имели меньшее количество более крупных кластеров, чем в случае с неограниченной памятью.

Суть этой кластеризации

Количество и размер роботов-подражателей являются хорошими показателями в исследовании. Это заставляет думать о каждом кластере, как о культурной традиции роботов. Культуре необходим баланс между стабильностью и разнообразием. Возможно, идеальным балансом является небольшое количество нескольких стойких традиций.

Ученые также упомянули об эффекте нулевой памяти. Это было наименее интересным из трех экспериментов. На самом деле нулевая память подразумевает размер памяти одного робота. Другими словами, робот не имеет никакого выбора, кроме как принять одно поведение, которое он познал. Здесь нет большого выбора и нет возможности образования кластеров. И, конечно, об образовании традиций вообще не идет речи.

Конечно, было бы неразумно делать какие-либо большие выводы из этого ограниченного экспериментального исследования. Но некоторые результаты все же будут необходимым условием для возникновения культуры социальных агентов.

Комментарии: