Насчёт распознавания голоса.
Я вот и думаю - а нафига оно вообще надо? Я бы с гораздо большим удовольствием пользовался какими-нибудь жестами (кстати, одна из вещей, которая мне по-настоящему, без вопросов и оговорок, нравится в Макбуке - это тачпад), чем голосом. Все телефонные системы с голосовым контролем ненавижу - особенно учитывая акцент и т.п., но даже без того я чувствую себя довольно тупо, произнося по указке автомата указанные фразы. Кнопками мне быстрее и удобнее. А обьяснять компутеру голосом, что надо удалить ~/logs/outdated или затолкать в репозиторий три последних изменения кода - извините, не надо.
Хотя, конечно, автоматические субтитры в фильмах, например, иметь было бы неплохо.
Кстати, в той же статье упоминается Пальм и его рукописная система. Я помню, куча народу ей писать научилась. Интересно, кто-то ещё пользуется?
Я вот и думаю - а нафига оно вообще надо? Я бы с гораздо большим удовольствием пользовался какими-нибудь жестами (кстати, одна из вещей, которая мне по-настоящему, без вопросов и оговорок, нравится в Макбуке - это тачпад), чем голосом. Все телефонные системы с голосовым контролем ненавижу - особенно учитывая акцент и т.п., но даже без того я чувствую себя довольно тупо, произнося по указке автомата указанные фразы. Кнопками мне быстрее и удобнее. А обьяснять компутеру голосом, что надо удалить ~/logs/outdated или затолкать в репозиторий три последних изменения кода - извините, не надо.
Хотя, конечно, автоматические субтитры в фильмах, например, иметь было бы неплохо.
Кстати, в той же статье упоминается Пальм и его рукописная система. Я помню, куча народу ей писать научилась. Интересно, кто-то ещё пользуется?
Tags:
no subject
Главная проблема - usability. В принципе, speech recognition может сильно упростить работу с телефонными системами за счет избавления от меню - меню нельзя делать слишком длинными в наш век ADHD, поэтому их делают глубокими и до многих функций надо проходить через 2-3 меню, которые приходится внимательно выслушивать.
Speech recognition должна решать эту проблему - клиент просто сразу говорит то что ему нужно и все, он там где хочет. Но для этого нужно составлять правильный grammar, а это очень сложно и мало кто умеет. Кроме того, это требует неортодоксального подхода к usability - обычно-то думают как загнать пользователя в простые сценарии с маленьким выбором, а тут все наоборот.
Вот и делают идиотские системы, где оставляют меню, а клиента заставляют выбирать из него голосом
no subject
no subject