или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

Директор Geppetto Avatars: Как сделать общение с социальными роботами реальным?

schedule 24.01.2015 в 13:48 link аналитика Mark Stephen Meadows Geppetto Avatars
​Директор компании Geppetto Avatars Марк Стефан Мидоус (Mark Stephen Meadows) рассказал о проблеме общения людей с социальными роботами, - сообщает Robotics.ua.



Это исследование было обусловлено высказыванием одного из журналистов касательно робота-швейцара Pepper от Aldebaran в Бостоне. Но в целом можно это применить ко всем роботам. К большому огорчению журналиста, робот не отвечал, когда он к нему обращался. «Он не понимает ни слова», - заявил журналист. «Он просто не работает. Единственное слово, которое он понял, было «суши». В этот момент я понял, что робот просто не понимает английский, так как был запрограммирован, чтобы понимать японцев».
Эта проблема называется пользовательский опыт.

Пользовательский опыт в понимании естественного языка

Естественный язык является реальным элементом интерфейса. Так же, как GUI (графический пользовательский интерфейс) может в значительной степени заменить командную строку, NLP (обработка данных на естественном языке) в настоящее время используется роботами, Интернет вещами, портативными устройствами, различными манипуляторами и особенно разговорными системами, такими как Siri от Apple, Google Now, Cortana Microsoft, Nina Nuance, Echo Amazon и другими. Эти интерфейсы предназначены для упрощения, ускорения и улучшения выполнения задач. Естественное языковое взаимодействие с роботами и представляет собой интерфейс. Это форма пользовательского опыта, требующая дизайн.

Психология естественного языка

Мы все используем язык на ежедневной основе, как наш ключевой элемент взаимодействия с другими людьми. У нас у всех время от времени возникают проблемы разговора друг с другом, так что проектирование разговорных интерфейсов – сложная работа. Управление темами, очередность диалога, управление переходами, связь с знаковыми жестами и тысячи других аспектов коммуникации находятся прямо в середине этой новой дизайнерской дисциплины.

Традиционный дизайн программного обеспечения работает на знаменитой архитектурной пословице: «Форма следует за функцией». Но когда дело доходит до естественного языка интерфейса и робототехники в целом, мы имеем дело с новым видом дизайна, в котором функция следует форме. Форма человеческого взаимодействия становится функцией создания чего-то метафорического, простого, развлекательного и полезного.

Когда дело доходит до взаимодействия человека и социальных роботов, форма определяет функцию. Есть, по крайней мере, три причины для этого. Все они являются психологическими.

Социальные роботы должны выглядеть как мы

Во-первых, пользователь должен идентифицировать себя с разговорной системой. Любой ребенок школьного возраста скажет вам, что нет прагматичного повода сделать компьютер похожим на человека. Андроидный робот, кажется, разработан для глупых людей. Его забалансовые, неуклюжие датчики являются слишком сложными, ходьба трудно вычисляемой, и когда робот падает, это вызывает серьезные повреждения датчиков, которые находятся в той части робота, которая получает тяжелый удар при падении. А чего только стоит его голова?

Оказывается, что дети (взрослые и дети школьного возраста) способны признать даже абстрагируемое человеческое лицо на удивление быстро и в раннем возрасте. Даже самые маленькие дети тянутся к лицевому изображению, даже если оно содержит только две точки и линии.

Еще более любопытно, что 6-месячные дети более склонны тратить много времени, смотря на то, что может быть привлекательным.
Так, само собой разумеется, что социальный робот должен иметь привлекательное лицо, просто потому, что люди склонны обращать на это внимание. И это является частью метафоры, что является движущим дизайном андроида.

Но привлекательность содержится не только во внешнем виде. В то время как мы боремся с тем, чтобы избежать странных качеств внешнего вида, мы узнаем, что есть много странностей в звуках, цветах, жестах и даже психологии, в большей части.

Социальные роботы должны разговаривать как мы

Во-вторых, в настоящее время NLP технология, как правило, работает достаточно хорошо для выполнения задач конечных пользователей и обеспечения контекстного обучения, где пора приступить к рассмотрению личности таким же образом, как мы обратились к внешнему виду. Это означает, что когда мы убедимся, что мы разрабатываем роботов, которые похожи на нас, мы должны также разработать роботов, которые говорят, как мы.

Это просто означает, что пользовательский опыт естественного языка должен учитывать психологию и взаимодействие, как основные метафоры для проектирования социальных роботов. Это, как сделать перчатку, которая имеет форму руки. Инструмент должен быть рассчитан на работу человеческой руки. Так психология является ключевым фактором.
 «Рыбак рыбака видит издалека». Эта пословица связана с доверием. Мы привыкли доверять людям, которые похожи на нас, и когда мы кому-то доверяем, мы на самом деле воспринимаем их как подобие себя.

Говорить и выглядеть, как человек, довольно важно для социального робота.

Эта связь поведения и внешнего вида является ключом к пользовательскому опыту. Такие системы, как те, которые используются в здравоохранении, финансах и других очень важных интерфейсах, необходимо разрабатывать таким образом, чтобы они были надежны, и это означает, что они должны действовать как пользователь. Сейчас мало можно найти людей, которые готовы поведать о своих финансовых данных, или обсудить личные проблемы здравоохранения с каким-то вымышленным персонажем, который выглядит как Furby, или вращающийся шар металла. Чтобы сделать это возможным, опыт пользователя и естественно-языковые интерфейсы должны решать вопросы, которые включают в себя такие вещи, как акцент, жаргон и другие способы речи, связанные с конкретными регионами страны.

Исследователи в Geppetto Avatars определили, что люди охотнее смотрят на сверхъестественные элементы конструкции, если есть небольшие культурные различия в ней. Например, мы заметили, что синтезированные голоса звучат менее искусственно, если они имеют легкий акцент. Синтезированный голос с британским акцентом звучит не совсем синтетически к американскому слушателю. Но если вы дадите тому же слушателю послушать синтезированный голос, который использует американский акцент, слушатель, намного более вероятно заметит синтетические элементы. Это просто техника, чтобы уменьшить возникновение проблем. Так пользовательский опыт может играть роль в упрощении не только взаимодействия, но и технологии.

Социальные роботы должны быть вежливыми

Роботы или другие подключенные системы, которые используют естественный язык интерфейса, создают спонтанное поведение пользователя. Большинство пользователей на самом деле пытаются быть вежливыми и культурными, и даже начать приписывать личностные качества технике. Мы все разговариваем с нашей машиной, многие из нас дают ей имя, и это нас связывает с ней. Это то, что люди делают на автомате, нравится им это или нет, не только с естественно-языковыми системами, но почти всеми средствами массовой информации.

В 1996 году Ривз и Насс, два известных ученых из Стэнфорда (и авторы The Media Equation), доказали, что компьютеры вызывают социальные взаимодействия пользователей. Ученые разработали эксперимент, в котором 22 человека приходят в лабораторию, чтобы работать с компьютером через текстовый интерфейс естественного языка. В конце сессии Ривз и Насс попросили их оценить работу компьютера. Исследователи обнаружили, что пользователи имели автоматические социальные реакции во время теста и мнения о личности машины, с которой они работали.

Они снова сделали тест, на этот раз с помощью голосового интерфейса естественного языка, чтобы человеческо-социальная тема была более очевидной. Результаты испытаний были одинаковыми. Они пришли к выводу, что люди вежливы с компьютерами, как в устной, так и письменной речи, и эксперимент показал, что социальные правила могут применяться к средствам массовой информации и компьютеры могут быть социальными инициаторами. Участники отрицали это, но результаты показали противоположное.

Попробуйте сами - наблюдайте как люди разговаривают с Siri; они используют слово «пожалуйста» или «спасибо» чаще, чем вы могли бы предположить.
Мы должны разрабатывать системы, которые способны строить идентификацию и доверие к пользователю этих систем, чтобы выполнить рекомендации о здравоохранении как использовать наши тела, или в области финансов как использовать наши деньги. Разговорная система имеет власть над пользователем просто в принятии совета, который усиливается с принятием решения. Этика является логическим элементом интерфейса роботов.

Интерфейс, будь-то командная строка, GUI или естественный язык, всегда был самым мощным и ценным элементом компьютерного дизайна. Он по-прежнему будет важным и ценным элементом дизайна роботов. Как вывод, будущее пользовательского опыта является психологическим, графическим и этически функциональным.

Ученые, практикующие пользовательский опыт и дизайнеры робототехники, должны рассмотреть форму и функцию, особенно когда дело доходит до естественного языка интерфейса.

Комментарии: