stas | voice recognition

You're viewing

stas's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Navigation

Page Summary

Style Credit

Style: Blue for Drifting by Jennie Griner
Resources: OSWD design

Expand Cut Tags

No cut tags

voice recognition

stas

Sunday, June 27th, 2010 10:40 pm

Насчёт распознавания голоса.

Я вот и думаю - а нафига оно вообще надо? Я бы с гораздо большим удовольствием пользовался какими-нибудь жестами (кстати, одна из вещей, которая мне по-настоящему, без вопросов и оговорок, нравится в Макбуке - это тачпад), чем голосом. Все телефонные системы с голосовым контролем ненавижу - особенно учитывая акцент и т.п., но даже без того я чувствую себя довольно тупо, произнося по указке автомата указанные фразы. Кнопками мне быстрее и удобнее. А обьяснять компутеру голосом, что надо удалить ~/logs/outdated или затолкать в репозиторий три последних изменения кода - извините, не надо.

Хотя, конечно, автоматические субтитры в фильмах, например, иметь было бы неплохо.

Кстати, в той же статье упоминается Пальм и его рукописная система. Я помню, куча народу ей писать научилась. Интересно, кто-то ещё пользуется?

Tags:

профессия

Threaded | Top-Level Comments Only

no subject

Monday, June 28th, 2010 05:58 am (UTC)

Ага. Я один раз в жизни нарвалась на аудиоуправляемую систему - хотела всего лишь баллон газа заказать, так я почти до истерики дошла с ней. Рычала и плевалась. Пришел мой сын, удивился, что это со мной, и, как водится у мужчин, сказал, что он сейчас все устроит сам. Через пол часа он уже сам рычал и плевался.
Позвонила утром в обслуживание с человеческим лицом, и там мне за минуту все оформили, но сказали, что некоторым все же удается заказать через автомат...

Link
Reply

no subject

stas

Monday, June 28th, 2010 06:25 am (UTC)

Не все знают, но у большинства этих телефонных систем по-прежнему есть функция управления кнопками - хотя не все в этом признаются. Т.е. если они предлагают произнести одно из трёх слов, то зачастую цифры 1,2,3 на телефоне произведут тот же эффект. Я этим обычно пользуюсь, очень часто работает.

no subject

cjelli.livejournal.com

Monday, June 28th, 2010 06:49 am (UTC)

В "Меухедет" ввели такую систему, но только на иврите. При этом известно, что такие системы не работают с акцентами, а только с нейтив спикерами. Кроме того, нередко у звонящего проблемы с голосом по состоянию здоровья. К счастью по-русски все через кнопки и человеков, так что можно выжить.

no subject

msh.livejournal.com

Monday, June 28th, 2010 06:54 am (UTC)

Распознавание произвольного текста действительно работает плохо, но для телефонных систем это не нужно - там распознаются слова и фразы из списка (так называемого grammar). Распознавание из списка работает достаточно хорошо для среднего человека. С сильными акцентами есть проблема, но тоже решаемая, например, есть специальные распознавалки для английского с индийским акцентом.

Главная проблема - usability. В принципе, speech recognition может сильно упростить работу с телефонными системами за счет избавления от меню - меню нельзя делать слишком длинными в наш век ADHD, поэтому их делают глубокими и до многих функций надо проходить через 2-3 меню, которые приходится внимательно выслушивать.

Speech recognition должна решать эту проблему - клиент просто сразу говорит то что ему нужно и все, он там где хочет. Но для этого нужно составлять правильный grammar, а это очень сложно и мало кто умеет. Кроме того, это требует неортодоксального подхода к usability - обычно-то думают как загнать пользователя в простые сценарии с маленьким выбором, а тут все наоборот.

Вот и делают идиотские системы, где оставляют меню, а клиента заставляют выбирать из него голосом

Link
Reply

no subject

trurle.livejournal.com

Monday, June 28th, 2010 07:20 am (UTC)

Халва аллаху, Меухедет еще не переделал сайт на распознавание голоса.

no subject

ostseer.livejournal.com

Monday, June 28th, 2010 07:48 am (UTC)

Аналогично ненавижу.

Edited 2010-06-28 07:49 am (UTC)

Link
Reply

no subject

ostseer.livejournal.com

Monday, June 28th, 2010 07:50 am (UTC)

В "Оранж Биг Ток" пополнение счета на иврите тоже только путем автоответчика. Хорошо еще, что по-русски оставалась кнопочная опция.

no subject

Monday, June 28th, 2010 09:16 am (UTC)

Интересно, в следующий раз может попробую, работает ли у них. Но не признавались, да.

no subject

Monday, June 28th, 2010 09:18 am (UTC)

Эта система тоже была на иврите. Но сын-то у меня сабра, так что не знаю, чего ей еще было нужно...
Я там после некоторых попыток дошла уже до конца, и даже ей сообщила номер карточки, и на последнем каком-то, не имеющем значение вопросе - она вырубилась. Как тут не зарычишь. Ведь не понятно - приняла она оплату или нет. Впрочем, потом удалось это выяснить у живой девушки.

no subject

eta-ta.livejournal.com

Monday, June 28th, 2010 10:19 am (UTC)

возникают забавные диалоги, как из "прошлых романах о будущем":
-Телефонный Голос: пожалуйста, скажите название вашей кредитной карты
-Пoкупатель:
-TГ: Если это Visa, скажите "да"
-П: Нет! Это American Express
-TГ: Если это Visa, скажите "да"
[проходят 5 аналогичных раундов]
-П: Идиотка! Я тебе чётко говорю: AMEX!!!
-TG: Если это Visa, скажите "да"

Link
Reply

no subject

induke.livejournal.com

Monday, June 28th, 2010 02:42 pm (UTC)

Voice recognition works really well on Blackberry for handsfree dialing.

Link
Reply

most likely you have seen it

nick-petvi.livejournal.com

Monday, June 28th, 2010 04:31 pm (UTC)

http://www.youtube.com/watch?v=p3JcHhA7M-Y&feature=related

Link
Reply

no subject

stas

Monday, June 28th, 2010 05:51 pm (UTC)

как раз в пилотаже я бы не стал доверять... перепутает машинка 20 и 12, пилот на автомате скажет "подтверждаю" - компьютеры ж не ошибаются, всем известно - и кирдык.

no subject

stas

Monday, June 28th, 2010 05:58 pm (UTC)

Насчёт говорить то, что нужно - это недостижимая мечта. Клиент звонит в банк и говорит примерно так: "У меня в вашем банке уже десять лет счёт, и тут мы поехали во Флориду и я увидела в одном магазине такую красивую штуку, а он говорит, что это слишком дорого, небось для него не дорого, а он говорит, что у нас нет денег, как будто я не знаю, у нас же есть кредитка, десять лет платим, никогда не опаздывали, но пять тысяч не хватает, говорит не разрешает больше". Если вы сможете из этого извлечь фразу "увеличение кредитного лимита", вы будете миллиардер :)

no subject

msh.livejournal.com

Monday, June 28th, 2010 06:30 pm (UTC)

А ее не надо достигать на 100%. В банк каждый день звонят тыщи людей, спрашивая всякую ерунду типа баланса на кредитке. Научится распознавать этот вопрос - и половину call center можно уволить.

to hankers

beobahter.livejournal.com

Monday, June 28th, 2010 07:03 pm (UTC)

Проще получить авотматический клиренс. Через что-то вроде ADS-B

no subject

darth-sipid.livejournal.com

Tuesday, June 29th, 2010 03:46 pm (UTC)

Voice recognition, shmoice recognition.

Face recognition!! (http://gizmodo.com/5574640/leaked-docs-windows-8-to-feature-kinect+like-features-instant-onoff-more)

Link
Reply

no subject

stas

Tuesday, June 29th, 2010 04:35 pm (UTC)

Я читал, Амазон подал патент на покупки кивком и выражением лица.

no subject

alexcohn.livejournal.com

Monday, July 5th, 2010 04:27 pm (UTC)

Мой телефончик с Windows Mobile 6.1 имеет пальм-совместимую виртуальную клавиатуру, среди прочих. Она работает лучше других, но не переключается, к сожалению, на русский и иврит, посему я пользуюсь ею реже, чем виртуальным qwerty.

Link
Reply

no subject

alexcohn.livejournal.com

Monday, July 5th, 2010 04:28 pm (UTC)

да, выбор по голосу из списка контактов - вполне адекватная задача уже на сегодня

Threaded | Top-Level Comments Only