↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Home Orchid
19 января 2016
Aa Aa
#вопрос
На телефонах есть приложения, которые переводят звук в текст сообщений. Интересно, есть ли подобное для компа - я диктую, текст на экране? Это ж спасения для автора, личный секретарь.
19 января 2016
9 комментариев из 23
Home Orchid
У меня один раз "Снейп отказ от дементоров и они в постели у него благина", другой - "Снейпа подкрался где ментором и они запустили в него блогером".
То и значит. Для распознавания речи нужны:
- Хорошая модель соответствия акустических характеристик фонологическим - не знаю, доведено ли до ума или нет. Делать всего ничего, но могут быть проблемы с нашими редуцированными гласными, наверное.
- Хороший словарь - просто слов натолкать - сколько хочешь, но у нас сложный язык с кучей падежей и прочими ужасами, настроганным под английский язык методам от этого совсем плохо. А у служб, которые определяют, что "определяют" - это третье лицо множественного числа настоящего времени глагола "определять", не очень высокая точность. Как из-за языковой сложности, так и из-за проблем с ресурсами.
- Хорошая языковая модель (какое слово самое вероятное после предыдущих) - ей тоже не очень хорошо.
В том же Dragon нужно подключить русские фонетические словари, и включить на пару недель режим обучения под ваши голос и манеру речи - тогда результаты будут получше
Горыныч когда-то был, так себе... хотя, может, вина словарей. Имхо, пальцами быстрее и качественней при должной тренировке.
кусь
Мысль меня посетила, потому что я повредила спину и не могу долго сидеть. Печатать - мучение.
В идеале было бы здорово надиктовать на тот же телефон текст ( этапами), потом забросить
звуковой файл в программу, и - опля, текст.

Cheery Cherry
Я вас поняла. Мне кажется, это вопрос времени , коммерческой востребованномти такого софта и переделки наструганных под английский методов. Но не проблемы русского как такового. Редукция, имхо, не беда по сравнению с вариативностью англ, ос. не нейтивов, коих большинство.
Home Orchid
Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих других языках: если у каждого слова может быть 200 форм, то считай, что данных у тебя в разы меньше, чем было в аналогичном тексте на английском.
"Они читают книги"
"Я читаю книгу"
"Мы не читаем книг"
- выходит не пример сочетания "читать книгу", а разрозренные пары. "Они читают книгу" по этому набору не выучишь. В чем разница между "книги" и "книг", тоже непонятно: "они не читают книгу" будет, потому что "не читают" система не видела, только "не читаем".
А когда "схлопываешь" формы одного слова, всё более менее приходит в норму, зато утрачиваешь сложные сведения о языке, которые вообще-то тоже были нужны.
Нет, как-то это всё решается, но жирную точку в разработках ставить еще очень рано. В компании с русским есть и еще более жуткие языки, для них же тоже надо что-то строить. А еще бывают языки с очень ограниченными ресурсами - например, для машинного перевода тебе нужны примеры переводов, у тебя на руках только текст Библии, а заказ на перевод для компании, занимающейся торговлей авто.
Показать полностью
Cheery Cherry
Ну, у читать всего 7 форм с инфинитивом. Спряжения и склонения есть во многих языках, и вопрос форм придется решать и в них. Разве это не проблема времени - просто скормить все словоформы программе?
Нет, все-таки форм не семь, и сложности с управлениями, а еще с глагольными приставками - вокруг них совсем караул творится. А когда у каждого слова их не семь, то комбинации между словами становятся гораздо более разрозненными, и машине гораздо тяжелее сделать содержательные и правильные выводы.
Но года через два-три можно ожидать подвижек?
Не знаю, трудно так сказать. Если бы в России побольше занимались компьютерной лингвистикой, это бы помогло. А так все не едут, потому что все не едут.
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть