Cheery Cherry комментирует: Home Orchid Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих д

20 января 2016

Home Orchid
Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих других языках: если у каждого слова может быть 200 форм, то считай, что данных у тебя в разы меньше, чем было в аналогичном тексте на английском.
"Они читают книги"
"Я читаю книгу"
"Мы не читаем книг"
- выходит не пример сочетания "читать книгу", а разрозренные пары. "Они читают книгу" по этому набору не выучишь. В чем разница между "книги" и "книг", тоже непонятно: "они не читают книгу" будет, потому что "не читают" система не видела, только "не читаем".
А когда "схлопываешь" формы одного слова, всё более менее приходит в норму, зато утрачиваешь сложные сведения о языке, которые вообще-то тоже были нужны.
Нет, как-то это всё решается, но жирную точку в разработках ставить еще очень рано. В компании с русским есть и еще более жуткие языки, для них же тоже надо что-то строить. А еще бывают языки с очень ограниченными ресурсами - например, для машинного перевода тебе нужны примеры переводов, у тебя на руках только текст Библии, а заказ на перевод для компании, занимающейся торговлей авто.

Комментарий к сообщению