или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Zoe из университета Кембриджа – цифровая говорящая голова, выражающая человеческие эмоции

schedule 22.03.2013 в 13:12 link Zoe University of Cambridge исследование
​Знакомьтесь с Zoe – цифровой говорящей головой, которая может выражать человеческие эмоции по требованию с "беспрецедентной реальностью" и может предвещать новую эру взаимодействия человека с компьютером.



Виртуальная "говорящая голова", которая может выразить весь спектр человеческих эмоций и может быть использована в качестве цифрового личного помощника, например, заменить текстовые сообщения "разговорными", была разработана исследователями Кембриджского университета (University of Cambridge).

Реалистичное лицо может отображать эмоции, такие как радость, гнев, страх, и меняет свой голос, чтобы удовлетворить любые чувства пользователя. Пользователи могут ввести любое сообщение, указав необходимую эмоцию, а лицо прочитает текст. Это самый выразительный Аватар, когда-либо созданный для отображения человеческих эмоций с беспрецедентной реальностью.

Система является результатом сотрудничества между исследователями лаборатории Toshiba и факультета технических наук Университета Кембриджа. Студенты уже заметили поразительное сходство между бестелесной головой и Holly, компьютерным навигатором из британской научно-фантастической комедии Красный карлик.

Само лицо представляет собой на самом деле облик Зои Листер, актрисы, пожалуй, известной, как Зои Карпентер в комедии. Чтобы воссоздать ее лицо и голос, исследователи провели несколько дней записи речи Зои и выражений её лица. В результате получилась система, которая достаточно легкая, чтобы работать в области мобильных технологий, и может быть использована в качестве личного помощника в смартфонах, или "лицом принятых сообщений".

"Zoe" также является шаблоном, который, в скором времени может дать людям возможность загружать свои собственные лица и голоса, но за считанные секунды, а не дни. Это означает, что в будущем пользователи смогут настроить и персонализировать своего собственного, эмоционально реалистичного, цифрового помощника.

Он может быть разработан так, чтобы пользователь мог получать текст сообщения "Я буду поздно", провозглашенный с эмоцией "разочарования".

Команда, которая создала Zoe, в настоящее время ищет приложения, а также работает со школой для аутистов и глухих детей, где технологии могут быть использованы, чтобы помочь учащимся "читать" эмоции и понимать по губам. В конечном счете, система может иметь множество применений - в том числе в играх, в аудио-визуальных книгах, как средство доставки онлайн-лекций, так и в других пользовательских интерфейсах.

"Эта технология может стать началом целого нового поколения интерфейсов, которые делают взаимодействие с компьютером намного больше, чем разговор с другим человеком", - говорит профессор Роберто Чиполла (Roberto Cipolla), из Департамента инженерии в Кембриджском университете. "Нам потребовалось несколько дней, чтобы создать Zoe, потому что надо было начинать с нуля, и научить систему понимать язык и выражения. Теперь, когда она уже понимает эти вещи, она не должна быть слишком жесткой для передачи одной информации на другой голос и лицо."

Она работает с помощью набора фундаментальных, "основных" эмоций. Голос Zoe имеет шесть основных параметров - счастье, грусть, нежность, злость, страх и нейтральные эмоции. Пользователь может настроить эти параметры на различных уровнях, а также изменить скорость и глубину голоса.

Объединив эти уровни, становится возможным предварительно установить или создать практически бесконечные эмоциональные комбинации. Например, сочетание счастья с нежностью и слегка увеличенной скоростью и глубиной делает звук дружелюбным и приветливым. Сочетание скорости, гнева и страха делает звук, как будто она в панике. Это позволяет получать уровень эмоциональной тонкости, который, говорят дизайнеры, не был возможен в других аватарах до сих пор.

Чтобы сделать систему как можно более реалистичной, исследовательская группа собрала набор из тысяч предложений, которые они использовали для обучения модели речи с помощью реальной жизни актрисы Зои Листер. Это было преобразовано в голос и моделирование лица, математические алгоритмы, которые показывают данные изображений, необходимые, чтобы воссоздать выражения на цифровом лице непосредственно из текста.

"На сегодняшний день взаимодействие человека с компьютером по-прежнему работает с помощью клавиатуры и мыши." – добавил Чиполла. - "Для многих людей это трудно и неудобно. В будущем, мы сможем открыть вычислительные технологии для людей, чтобы они смогли говорить и жестикулировать более естественным образом. Именно поэтому мы создали Zoe – более выразительное, эмоционально настроенное лицо, с которым люди могут разговаривать на самом деле."

Комментарии: