↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Home Orchid
19 января 2016
Aa Aa
#вопрос
На телефонах есть приложения, которые переводят звук в текст сообщений. Интересно, есть ли подобное для компа - я диктую, текст на экране? Это ж спасения для автора, личный секретарь.
19 января 2016
5 комментариев из 23
Home Orchid
Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих других языках: если у каждого слова может быть 200 форм, то считай, что данных у тебя в разы меньше, чем было в аналогичном тексте на английском.
"Они читают книги"
"Я читаю книгу"
"Мы не читаем книг"
- выходит не пример сочетания "читать книгу", а разрозренные пары. "Они читают книгу" по этому набору не выучишь. В чем разница между "книги" и "книг", тоже непонятно: "они не читают книгу" будет, потому что "не читают" система не видела, только "не читаем".
А когда "схлопываешь" формы одного слова, всё более менее приходит в норму, зато утрачиваешь сложные сведения о языке, которые вообще-то тоже были нужны.
Нет, как-то это всё решается, но жирную точку в разработках ставить еще очень рано. В компании с русским есть и еще более жуткие языки, для них же тоже надо что-то строить. А еще бывают языки с очень ограниченными ресурсами - например, для машинного перевода тебе нужны примеры переводов, у тебя на руках только текст Библии, а заказ на перевод для компании, занимающейся торговлей авто.
Показать полностью
Cheery Cherry
Ну, у читать всего 7 форм с инфинитивом. Спряжения и склонения есть во многих языках, и вопрос форм придется решать и в них. Разве это не проблема времени - просто скормить все словоформы программе?
Нет, все-таки форм не семь, и сложности с управлениями, а еще с глагольными приставками - вокруг них совсем караул творится. А когда у каждого слова их не семь, то комбинации между словами становятся гораздо более разрозненными, и машине гораздо тяжелее сделать содержательные и правильные выводы.
Но года через два-три можно ожидать подвижек?
Не знаю, трудно так сказать. Если бы в России побольше занимались компьютерной лингвистикой, это бы помогло. А так все не едут, потому что все не едут.
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть