20 января 2016
|
|
Home Orchid
Нет, с фонетической точки зрения я проблем не ожидаю. Проблема та же, что и во многих других языках: если у каждого слова может быть 200 форм, то считай, что данных у тебя в разы меньше, чем было в аналогичном тексте на английском. "Они читают книги" "Я читаю книгу" "Мы не читаем книг" - выходит не пример сочетания "читать книгу", а разрозренные пары. "Они читают книгу" по этому набору не выучишь. В чем разница между "книги" и "книг", тоже непонятно: "они не читают книгу" будет, потому что "не читают" система не видела, только "не читаем". А когда "схлопываешь" формы одного слова, всё более менее приходит в норму, зато утрачиваешь сложные сведения о языке, которые вообще-то тоже были нужны. Нет, как-то это всё решается, но жирную точку в разработках ставить еще очень рано. В компании с русским есть и еще более жуткие языки, для них же тоже надо что-то строить. А еще бывают языки с очень ограниченными ресурсами - например, для машинного перевода тебе нужны примеры переводов, у тебя на руках только текст Библии, а заказ на перевод для компании, занимающейся торговлей авто. |