или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Искусственный интеллект из Университета Брауна может определить животных по рисункам

schedule 17.09.2012 в 14:31 link Brown University Technical University of Berlin James Hays распознование образов
​Исследователи из Университета Брауна (Brown University) и технического университета Берлина (Technical University of Berlin) разработали компьютерную программу, которая может распознавать эскизы рисунков животных в реальном времени. Это первое приложение, которое позволяет компьютеру "семантически понимать" абстрактные зарисовки. Программа заранее может расчистить путь для значительного улучшения интерфейса эскизов и поиска приложений.



Компьютеры уже довольно хорошо справляются с эскизами объектов до тех пор, пока эскизы – это точные представления. Приложения были разработаны и могут соответствовать эскизам полиции к фактическим лицам в ситуациях нападения. Но знаковые или абстрактные зарисовки – это то, что большинство людей могут легко производить.

Например, если бы вас попросили нарисовать кролика, вы могли бы нарисовать мультяшного героя с большими ушами, зубами и пушистым хвостом. Для человека, вероятно, не было бы большой проблемой узнать в этом смешном рисунке кролика, несмотря на то, что это не так уж и похоже на настоящего кролика.

"Мы признаем кролика, потому что мы все выросли на таких рисунках," - сказал Джеймс Хейс (James Hays), доцент кафедры компьютерных наук в Университете Брауна, который разработал новую программу с Матиасом Эйтсом и Марком Алексом из Технического университета в Берлине.

Заставить компьютер понять, к чему мы пришли через годы мультфильмов и книжек-раскрасок является очень трудной задачей. Ключ к созданию этой новой программы - это большая база данных эскизов, которые могут быть использованы для обучения компьютера пониманию того, как люди рисуют объекты. "Это действительно первый раз, когда кто-либо изучил большую базу данных фактических эскизов," – сказал Хейс.

Чтобы перевести базу данных вместе, исследователи сначала придумали список предметов быта, которые люди могут рисовать. "Мы посмотрели на существующий набор данных компьютерного зрения, который называется LabelMe и имеет много аннотированных фотографий," – сказал Хейс. - "Мы посмотрели на показатели частоты и получили наиболее популярные объекты на фотографиях. Затем мы добавили прочие объекты, которые могут появиться в эскизах, таких как, например, радуга".

Ученые пришли в конечном итоге к набору из 250 категорий объектов. Затем они использовали робота Mechanical Turk, чтобы наметить объекты из каждой категории - 20.000 эскизов в общем. Эти данные затем были поданы в существующие алгоритмы машинного обучения, чтобы научить программу подбирать эскизы к каким категориям. Оттуда, команда разработала интерфейс, где пользователи вводили новые эскизы, и компьютер пытался их идентифицировать в реальном времени, так быстро, как рисует их пользователь.

Программа успешно идентифицирует эскизы приблизительно с 56-процентной точностью, если объект включен в одну из 250 категорий. Это не плохо, учитывая, что, когда исследователи попросили фактических людей определить эскизы в базу данных, они сумели это сделать с 73-процентной точностью. "Разрыв между человеком и вычислительной производительностью не столь большой, конечно, как в других задачах компьютерного зрения".

Программа не готова к правке Pictionary пока, в основном из-за своих ограниченных 250-категорий лексики. Но расширить её, чтобы включить другие категории, возможно. Один из способов сделать это - превратить программу в игру и собрать данные, которые вводят игроки. Команда уже сделала бесплатными приложения iPhone / IPad, которые могут использоваться в данном случае.

"Программа может попросить вас нарисовать что-то, и если другой человек может успешно распознать рисунок, то мы можем сказать, что это достаточно приличный набросок. Вы могли бы собирать всевозможные обучающие данные таким образом".

Такой краудсорсинг данных играет ключевую роль в проекте.

"Это был сбор данных, которые были проведены пользователями, а не цифровое представление или машинное обучение, а те уже в течение десяти лет. Нет возможности научиться распознавать эскизы львов, основанные на просто умном алгоритме. Алгоритму действительно нужно увидеть около 100 примеров того, как люди рисуют львов, и тогда становится возможным получать львов даже из горшечных растений."

В конечном счете, эта программа - это гораздо больше, чем просто веселые игры. Она может быть использована для разработки лучших эскиз-интерфейсов и поиска приложений. Несмотря на повсеместные сенсорные экраны, эскиз на основе поиска все еще широко не используется, но это, вероятно, потому что он просто не работал очень хорошо, говорит Хейс.

Лучший эскиз-интерфейс компьютера может улучшить доступность программы. "Непосредственно искать какие-то визуальные формы, вероятно, легче в некоторых областях. Это позволяет избежать всех языковых вопросов".

Комментарии: