Коллекции загружаются
Для решения многих лингвистических задач используются так называемые текстовые корпуса — специальным образом подобранные и структурированные коллекции текстов. Наиболее информативными являются размеченные корпуса, то есть такие, в которых частям текста приписана лингвистическая информация — например, каждое слово отнесено к той или иной части речи.
Русский корпус делают уже шестой год. Это долго, муторно, но полезно и интересно ;) Помочь может любой. Даже если вы от скуки обработаете один абзац или пару-тройку предложений, то вы уже поможете! С миру по нитке будет рубашка, помните об этом ;) http://www.opencorpora.org/?page=about #любовь_к_цыферкам #контекстуальное #когдатояхотелбытьжурналистом 29 февраля 2016
4 |
аналог notabenoid?
|
Heinrich Kramer
Нет, аналог http://www.natcorp.ox.ac.uk/ Т.е. ты не переводишь, а делаешь подобие разбора предложения, как в школе. |