February 2026

S M T W T F S
1234567
891011121314
15161718192021
22232425262728

Style Credit

Expand Cut Tags

No cut tags
Sunday, June 27th, 2010 10:40 pm
Насчёт распознавания голоса.

Я вот и думаю - а нафига оно вообще надо? Я бы с гораздо большим удовольствием пользовался какими-нибудь жестами (кстати, одна из вещей, которая мне по-настоящему, без вопросов и оговорок, нравится в Макбуке - это тачпад), чем голосом. Все телефонные системы с голосовым контролем ненавижу - особенно учитывая акцент и т.п., но даже без того я чувствую себя довольно тупо, произнося по указке автомата указанные фразы. Кнопками мне быстрее и удобнее. А обьяснять компутеру голосом, что надо удалить ~/logs/outdated или затолкать в репозиторий три последних изменения кода - извините, не надо.

Хотя, конечно, автоматические субтитры в фильмах, например, иметь было бы неплохо.

Кстати, в той же статье упоминается Пальм и его рукописная система. Я помню, куча народу ей писать научилась. Интересно, кто-то ещё пользуется?
Monday, June 28th, 2010 06:54 am (UTC)
Распознавание произвольного текста действительно работает плохо, но для телефонных систем это не нужно - там распознаются слова и фразы из списка (так называемого grammar). Распознавание из списка работает достаточно хорошо для среднего человека. С сильными акцентами есть проблема, но тоже решаемая, например, есть специальные распознавалки для английского с индийским акцентом.

Главная проблема - usability. В принципе, speech recognition может сильно упростить работу с телефонными системами за счет избавления от меню - меню нельзя делать слишком длинными в наш век ADHD, поэтому их делают глубокими и до многих функций надо проходить через 2-3 меню, которые приходится внимательно выслушивать.

Speech recognition должна решать эту проблему - клиент просто сразу говорит то что ему нужно и все, он там где хочет. Но для этого нужно составлять правильный grammar, а это очень сложно и мало кто умеет. Кроме того, это требует неортодоксального подхода к usability - обычно-то думают как загнать пользователя в простые сценарии с маленьким выбором, а тут все наоборот.

Вот и делают идиотские системы, где оставляют меню, а клиента заставляют выбирать из него голосом
Monday, June 28th, 2010 06:30 pm (UTC)
А ее не надо достигать на 100%. В банк каждый день звонят тыщи людей, спрашивая всякую ерунду типа баланса на кредитке. Научится распознавать этот вопрос - и половину call center можно уволить.