↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Лиса Ересь
17 декабря 2015
Aa Aa
А я опять упрт за добро и "ну это же важно": ищу переводы на фанфиксе и проставляю у них язык оригинала, если отсутствует, и загружаю их в фвф, если они ещё нет и вообще это возможно. )^_^(

#любовь_к_цыферкам #ЛевВнутриМеняТребует
17 декабря 2015
9 комментариев из 14
Закачать результат поиска фанфиков по запросу "перевод", проанализировать шапки, выцепить оттуда ссылки на оригиналы, скачать текст того, что по ссылке (ФвФ и не ФвФ), вычистить хтмл-верстку, скормить содержимое автоматическим определялкам языка, с какими подружишься. Если ни с какой не подружишься, то на несколько самых распространенных языков можно сделать очень глупенькую по самым частым словам конкретного языка: в тексте встретилось большинство - значит, он.
Даже самая-самая тупая реализация - и то ускорит.
Cheery Cherry
Я тупой настолько, что даже не представляю, КАК реализовать скрипт. На каком языке писать, как потом запускать... Что я делаю в IT ВУЗе?((((
Cheery Cherry
>вычистить хтмл-верстку, скормить содержимое автоматическим определялкам языка
так на большей части сайтов есть указание на язык
или речь идет далеко не об сайтах фиков, а просто дневниках ?

Лиса Ересь

бери пайтон
edzidbear
хм... я про него давно думаю, надо будет как-нибудь сесть нормально
Ну, в принципе, любой язык подойдет, и выцепить поле ссылки на оригинал должно быть достаточно просто даже в очень корявых языках.
И ничего не скажу - я то, что делала, не довела до ума, моя программа закачивания фанфиков с конкурсов разбросана на два языка, часть в R, часть в Python, и ещё потом надо запускать WinHTTrack. Но всё равно какой-то опыт) Я считаю, что даже фигня, которой занимаешься, должна что-то тебе давать.
Cheery Cherry
ур
ты прямо сейчас на пару с edzidbear исполняешь мой гороскоп на 17.12)
edzidbear
Да там ссылка может быть на что угодно, мне было бы лень смотреть, где в куче разных сайтов указание на язык - это то же самое "вручную"...
Лиса Ересь
сейчас отманулируем
Cheery Cherry
>скормить содержимое автоматическим определялкам языка, с какими подружишься
https://github.com/detectlanguage/detectlanguage-python
мвахаха
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть