↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Home Orchid
19 января 2016
Aa Aa
#вопрос
На телефонах есть приложения, которые переводят звук в текст сообщений. Интересно, есть ли подобное для компа - я диктую, текст на экране? Это ж спасения для автора, личный секретарь.
19 января 2016
20 комментариев из 23
Dragon Speaking и прочие
Да, есть, но вам проще самой погуглить, мы же не знаем ни ОС, ни на каких языках вы хотите использовать, ни обязательно ли бесплатно или готовы платить/ломать...
Komisar Онлайн
есть, но они уебищны и работают более менее только с англ языком, так что особо на хяшяву с писаниной не надейтесь
Komisar
То есть на русском надиктовать фф пока можно не мечтать?
нету 100% распознающего софта
для любого языка
забавно, что сверху поста домашней орхидеи - пост дикой орхидеи))
Погуглила Dragon Speaking с примером на ютубе. Деловые тексты и полуформальные - норм, но худ. текст вряд ли гладко распознает. Со скепсисом думаю про диалекты.
И всё же - наши программеры, эй, где вы там? Полезная же штука! И диалектов русского в разы меньше, чем англ.
PersikPas
У меня нет планшета. А вы пробовали? Щас отберу у малой айфон и попробую надиктовать что-нибудь про Снейпа и дементоров.
mi=
Цветник.
Программисты тут особо ни при чём, нужны ресурсы русского языка, а их не шибко-то много.
Cheery Cherry
Уточните, если можно. Что значит не много?
* Снейп подкрался к дементорам, и они запустили в него бладжером.
Отобразилось:
Сны подкрался где менторам я не запустили в него блат жиром.
Что не есть плохо, на самом деле.

А вот Есенин со своими "скирды солнца в водах лонных" и пр. отлично пошёл.
То есть в принципе можно надиктовать на айфон миник, прислать себе на почту, и все дела.
Home Orchid
У меня один раз "Снейп отказ от дементоров и они в постели у него благина", другой - "Снейпа подкрался где ментором и они запустили в него блогером".
То и значит. Для распознавания речи нужны:
- Хорошая модель соответствия акустических характеристик фонологическим - не знаю, доведено ли до ума или нет. Делать всего ничего, но могут быть проблемы с нашими редуцированными гласными, наверное.
- Хороший словарь - просто слов натолкать - сколько хочешь, но у нас сложный язык с кучей падежей и прочими ужасами, настроганным под английский язык методам от этого совсем плохо. А у служб, которые определяют, что "определяют" - это третье лицо множественного числа настоящего времени глагола "определять", не очень высокая точность. Как из-за языковой сложности, так и из-за проблем с ресурсами.
- Хорошая языковая модель (какое слово самое вероятное после предыдущих) - ей тоже не очень хорошо.
В том же Dragon нужно подключить русские фонетические словари, и включить на пару недель режим обучения под ваши голос и манеру речи - тогда результаты будут получше
Горыныч когда-то был, так себе... хотя, может, вина словарей. Имхо, пальцами быстрее и качественней при должной тренировке.
кусь
Мысль меня посетила, потому что я повредила спину и не могу долго сидеть. Печатать - мучение.
В идеале было бы здорово надиктовать на тот же телефон текст ( этапами), потом забросить
звуковой файл в программу, и - опля, текст.

Cheery Cherry
Я вас поняла. Мне кажется, это вопрос времени , коммерческой востребованномти такого софта и переделки наструганных под английский методов. Но не проблемы русского как такового. Редукция, имхо, не беда по сравнению с вариативностью англ, ос. не нейтивов, коих большинство.
Home Orchid
Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих других языках: если у каждого слова может быть 200 форм, то считай, что данных у тебя в разы меньше, чем было в аналогичном тексте на английском.
"Они читают книги"
"Я читаю книгу"
"Мы не читаем книг"
- выходит не пример сочетания "читать книгу", а разрозренные пары. "Они читают книгу" по этому набору не выучишь. В чем разница между "книги" и "книг", тоже непонятно: "они не читают книгу" будет, потому что "не читают" система не видела, только "не читаем".
А когда "схлопываешь" формы одного слова, всё более менее приходит в норму, зато утрачиваешь сложные сведения о языке, которые вообще-то тоже были нужны.
Нет, как-то это всё решается, но жирную точку в разработках ставить еще очень рано. В компании с русским есть и еще более жуткие языки, для них же тоже надо что-то строить. А еще бывают языки с очень ограниченными ресурсами - например, для машинного перевода тебе нужны примеры переводов, у тебя на руках только текст Библии, а заказ на перевод для компании, занимающейся торговлей авто.
Показать полностью
Cheery Cherry
Ну, у читать всего 7 форм с инфинитивом. Спряжения и склонения есть во многих языках, и вопрос форм придется решать и в них. Разве это не проблема времени - просто скормить все словоформы программе?
Нет, все-таки форм не семь, и сложности с управлениями, а еще с глагольными приставками - вокруг них совсем караул творится. А когда у каждого слова их не семь, то комбинации между словами становятся гораздо более разрозненными, и машине гораздо тяжелее сделать содержательные и правильные выводы.
Но года через два-три можно ожидать подвижек?
Не знаю, трудно так сказать. Если бы в России побольше занимались компьютерной лингвистикой, это бы помогло. А так все не едут, потому что все не едут.
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть