↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Временно не работает,
как войти читайте здесь!
Cheery Cherry
ДНИЩE--ЫЫЫЫ
Публичное сообщение
21 января 2015
Aa Aa
#хочуздравуюидеюикофебезсахара #завернитессобой
Как ещё можно автоматически повылавливать болтовню в комментариях? Сейчас я считаю, что болтовня начинается на ник пользователя из стольки-то отписавшихся выше. Междусобойчик типа такого (последние) оно не ловит. Может, есть какой здравый способ ещё? Я подумывала о "и если все ближайшие маркированы как беседы, то это тоже беседа", но это скорее вроде неправда, чем правда.
21 января 2015
20 комментариев из 29
лол) традиционная уличная магия ^^
Угум. Но на удивление неплохо работает, я посмотрела первые отфильтрованные - правда беседы
Правда, для фанфикса это означает довольно огорчающие результаты, я писала тут пропорции отфильтрованных - это правда больше, чем казалось бы нужным)
кстати
Если это готовить на использование в онлайне, по-настоящему, нужно будет в php перегнать.

нашел где-то ваш коммент
хочу отсоветовать
изучите лучше Django или Flask - web-фреймворки для питона:)
они няшнее этих слоников
В итоговом приложении python, наверное, будет не нужен. Поскольку всё равно лемматизаторов для русского языка особо нет, определения частей речи тоже, мы постараемся обойтись самым минимумом ресурсов. Итоговый алгоритм будет, увы, прост как тумбочка.
точно нет?
http://www.solarix.ru/for_developers/api/lemmatizator-api.shtml вот что-то нагуглилось
http://nlpub.ru/%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0 - вот таблица со списком библиотек и т.п. по работе с нат языками
сорри, если вы уже видели
Ну, есть, есть, конечно. Как же не быть, это же русский, а не язык племени мумбайя какого-нибудь :) Но качество работы так себе.
За ссылки спасибо.
ОК :)
в том, что с русским все плохо, видно на примере того же google translate и его pronuncation ^)
Я думаю, они просто не особо старались с русским
Так-то мой планшет, например, русский TTS очень даже достойно организовал (Amazon то бишь)
надо еще будет посмотреть новую яндекс-диктовку
Думаю, они нормальную систему должны были сделать, у них-то в отличие от гугла мотивация для работы с русским вполне есть)
реклама на хабре многое обещала. но у них пока бета
Там ничего революционного делать не надо, просто взять рабочий метод, достаточное количество часов начитки - и вперед)
ну мб
мне вот вокалоиды нравятся(Мику Хатсуне, например :3)
нераспознанные слова в вашем сообщении
вокалоиды
нравятся(Мику
Хатсуне
хе-хе-хе.
лексематизатор кривой, не умеет сплитить по знакам препинания?
Есть_{V} такое_{DET}
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть