Sunday, June 27th, 2010 10:40 pm
Насчёт распознавания голоса.

Я вот и думаю - а нафига оно вообще надо? Я бы с гораздо большим удовольствием пользовался какими-нибудь жестами (кстати, одна из вещей, которая мне по-настоящему, без вопросов и оговорок, нравится в Макбуке - это тачпад), чем голосом. Все телефонные системы с голосовым контролем ненавижу - особенно учитывая акцент и т.п., но даже без того я чувствую себя довольно тупо, произнося по указке автомата указанные фразы. Кнопками мне быстрее и удобнее. А обьяснять компутеру голосом, что надо удалить ~/logs/outdated или затолкать в репозиторий три последних изменения кода - извините, не надо.

Хотя, конечно, автоматические субтитры в фильмах, например, иметь было бы неплохо.

Кстати, в той же статье упоминается Пальм и его рукописная система. Я помню, куча народу ей писать научилась. Интересно, кто-то ещё пользуется?
Monday, June 28th, 2010 05:58 am (UTC)
Ага. Я один раз в жизни нарвалась на аудиоуправляемую систему - хотела всего лишь баллон газа заказать, так я почти до истерики дошла с ней. Рычала и плевалась. Пришел мой сын, удивился, что это со мной, и, как водится у мужчин, сказал, что он сейчас все устроит сам. Через пол часа он уже сам рычал и плевался.
Позвонила утром в обслуживание с человеческим лицом, и там мне за минуту все оформили, но сказали, что некоторым все же удается заказать через автомат...
Monday, June 28th, 2010 06:49 am (UTC)
В "Меухедет" ввели такую систему, но только на иврите. При этом известно, что такие системы не работают с акцентами, а только с нейтив спикерами. Кроме того, нередко у звонящего проблемы с голосом по состоянию здоровья. К счастью по-русски все через кнопки и человеков, так что можно выжить.
Monday, June 28th, 2010 06:54 am (UTC)
Распознавание произвольного текста действительно работает плохо, но для телефонных систем это не нужно - там распознаются слова и фразы из списка (так называемого grammar). Распознавание из списка работает достаточно хорошо для среднего человека. С сильными акцентами есть проблема, но тоже решаемая, например, есть специальные распознавалки для английского с индийским акцентом.

Главная проблема - usability. В принципе, speech recognition может сильно упростить работу с телефонными системами за счет избавления от меню - меню нельзя делать слишком длинными в наш век ADHD, поэтому их делают глубокими и до многих функций надо проходить через 2-3 меню, которые приходится внимательно выслушивать.

Speech recognition должна решать эту проблему - клиент просто сразу говорит то что ему нужно и все, он там где хочет. Но для этого нужно составлять правильный grammar, а это очень сложно и мало кто умеет. Кроме того, это требует неортодоксального подхода к usability - обычно-то думают как загнать пользователя в простые сценарии с маленьким выбором, а тут все наоборот.

Вот и делают идиотские системы, где оставляют меню, а клиента заставляют выбирать из него голосом
Monday, June 28th, 2010 07:20 am (UTC)
Халва аллаху, Меухедет еще не переделал сайт на распознавание голоса.
Monday, June 28th, 2010 07:48 am (UTC)
Аналогично ненавижу.
Edited 2010-06-28 07:49 am (UTC)
Monday, June 28th, 2010 07:50 am (UTC)
В "Оранж Биг Ток" пополнение счета на иврите тоже только путем автоответчика. Хорошо еще, что по-русски оставалась кнопочная опция.
Monday, June 28th, 2010 09:16 am (UTC)
Интересно, в следующий раз может попробую, работает ли у них. Но не признавались, да.
Monday, June 28th, 2010 09:18 am (UTC)
Эта система тоже была на иврите. Но сын-то у меня сабра, так что не знаю, чего ей еще было нужно...
Я там после некоторых попыток дошла уже до конца, и даже ей сообщила номер карточки, и на последнем каком-то, не имеющем значение вопросе - она вырубилась. Как тут не зарычишь. Ведь не понятно - приняла она оплату или нет. Впрочем, потом удалось это выяснить у живой девушки.
Monday, June 28th, 2010 10:19 am (UTC)
возникают забавные диалоги, как из "прошлых романах о будущем":
-Телефонный Голос: пожалуйста, скажите название вашей кредитной карты
-Пoкупатель:
-TГ: Если это Visa, скажите "да"
-П: Нет! Это American Express
-TГ: Если это Visa, скажите "да"
[проходят 5 аналогичных раундов]
-П: Идиотка! Я тебе чётко говорю: AMEX!!!
-TG: Если это Visa, скажите "да"
Monday, June 28th, 2010 02:42 pm (UTC)
Voice recognition works really well on Blackberry for handsfree dialing.

Monday, June 28th, 2010 04:31 pm (UTC)
http://www.youtube.com/watch?v=p3JcHhA7M-Y&feature=related
Monday, June 28th, 2010 06:30 pm (UTC)
А ее не надо достигать на 100%. В банк каждый день звонят тыщи людей, спрашивая всякую ерунду типа баланса на кредитке. Научится распознавать этот вопрос - и половину call center можно уволить.
Monday, June 28th, 2010 07:03 pm (UTC)
Проще получить авотматический клиренс. Через что-то вроде ADS-B
Tuesday, June 29th, 2010 03:46 pm (UTC)
Voice recognition, shmoice recognition.

Face recognition!! (http://gizmodo.com/5574640/leaked-docs-windows-8-to-feature-kinect+like-features-instant-onoff-more)
Monday, July 5th, 2010 04:27 pm (UTC)
Мой телефончик с Windows Mobile 6.1 имеет пальм-совместимую виртуальную клавиатуру, среди прочих. Она работает лучше других, но не переключается, к сожалению, на русский и иврит, посему я пользуюсь ею реже, чем виртуальным qwerty.
Monday, July 5th, 2010 04:28 pm (UTC)
да, выбор по голосу из списка контактов - вполне адекватная задача уже на сегодня