или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Ученые MIT обучили искусственный интеллект рукописи

schedule 11.12.2015 в 10:57 link MIT
​Новая компьютерная модель от инженеров MIT может имитировать человеческую способность к обучению новых задач от одного примера, а не сотни или тысячи, принимаемых в других методах машинного обучения, - сообщает Robotics.ua.

Быстрое освоение задачи

Новая компьютерная модель научилась писать вымышленные символы из мультипликационного шоу «Футурама», а также десятки алфавитов со всего мира. Программа также показала, что она может придумать символы самостоятельно в стиле данного языка.



Исследователи предполагают, что их модель может также узнать другие виды понятий, как речь и жесты. И хотя ученые добились больших успехов в области машинного обучения в последние годы, люди все же лучше осваивают новый материал, чем роботы.

«Люди могут обучиться новым задачам очень быстро даже от минимального количества  данных, только из одного или нескольких примеров», - говорит соавтор исследования Джошуа Тененбаум. В отличие от этого, «стандартные алгоритмы машинного обучения требуют десятки, сотни или даже тысячи примеров, чтобы выполнить аналогичную задачу».

Чтобы сократить сроки машинного обучения, исследователи разработали модель, которая лучше имитирует обучение человека, делая обобщения из немногих примеров концепции. Они сосредоточены на изучении простых визуальных концепций – рукописных  символов из различных алфавитов мира.

Цель ученых

«Наша работа имеет две цели: чтобы лучше понять, как люди учатся, методом обратного проектирования обучения человеческого ума; и построить машины, которые обучаются более человекоподобными способами», - говорит Тененбаум.

В то время как стандартные алгоритмы распознавания символов представляются в виде набора пикселей или договоренных особенностей, новая модель, которую разработали исследователи, представляет каждый символ, как простую компьютерную программу. Например, буква «А» представляет собой программу, которая генерирует примеры употребления, когда она запускается. Ни один программист не участвует в этом процессе обучения - модель генерирует эти программы самостоятельно.

Кроме того, каждая программа предназначена для создания вариаций каждого символа, помогая им захватить примеры таких понятий, которые могут отличаться, например, различия между тем, как два человека пишут одну и ту же букву.

«Идея этого алгоритма пришла из неожиданного открытия, которое мы наблюдали во время сбора набора данных рукописных символов со всего мира. Мы обнаружили, что, если вы попросите людей нарисовать персонаж какого-нибудь романа, вы увидите замечательную последовательность в том, как они это делают», - говорит ведущий автор исследования, Бренден Лэйк из Нью-Йоркского университета. «Когда люди узнают, или используют  эти новые понятия, они не просто видят символы как статические визуальные объекты, а богатую структуру. Что-то вроде модели причинно-следственной или последовательной связи, которая описывает, как эффективно производить новые примеры концепции».

Модель также применяется в знаниях из предыдущих концепций, чтобы ускорить познание новых концепций. Например, программа может использовать знания, полученные из латинского алфавита, чтобы узнать греческий алфавит. Они называют их модель «Программа обучения  Байеса» или «BPL».

Практические результаты

Исследователи применяли свои модели для более чем 1600 видов рукописных символов в 50 системах письменности, в том числе санскрите, тибетском, гуджарати, глаголице и даже вымышленных персонажах, как герои мультсериала «Футурама» и онлайн-игры Dark Horizon. В виду теста Тьюринга ученые обнаружили, что добровольцам, выбранным с помощью Amazon Mechanical Turk, было трудно отличить символы, написанные машиной и человеком.

По данным robotics.ua, ученые также ставили акцент на творческих задачах. Они попросили их системы создать целые новые концепции - например, создать новое тибетское письмо, основанное на том, что они знали о письменности в тибетском алфавите. Исследователи обнаружили, что добровольцы определяли символы машины, написанные на одном уровне с теми, что были придуманы человеком.

«Мы получили производительность человеческого уровня в этой творческой задаче», - сказал соавтор исследования Руслан Салахутдинов в университете Торонто. Потенциальные приложения для этой модели могут включать в себя распознавание рукописного текста, распознавание речи, распознавание жестов и объектов. «В конечном счете, мы пытаемся выяснить, как мы можем получить системы, которые приходят ближе к человеческому интеллекту», - говорит Салахутдинов. «Мы по-прежнему очень далеки от этой цели».

Комментарии: