↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Яэль Киршенбаум
24 февраля 2021
Aa Aa
На днях я узнала про очень любопытную вещь.

Стилометрия — изучение стиля текста при помощи статистических методов. Если коротко, то каждый текст в корпусе представляют как вектор частотностей слов, а после высчитывают расстояние между этими векторами.

Собственно, мне почти безразлично, как там это считают; главное, получаются красивые картинки.

Сначала я решила проверить, насколько качественно Гладков («Давным-давно») маскируется под старину, а то что-то меня в некоторых местах пьесы начинали терзать сомнения. Набрала для этого поэм и пьес в стихотворениях девятнадцатого века; не всех, конечно, и, наверное, не самым правильным образом, но уж как смогла.

А потом мне подумалось, что неплохо бы туда же добавить и собственное стихотворение, а то мне за последнюю неделю очень много раз писали о том, что у меня хорошая стилизация, хотя я почти не думала о ней. Так это стихотворение требовало куда больше усилий, чтобы попасть в более или менее нормальный стиль. Оно короткое, а стилометрия лучше работает на длинных текстах, но, справедливости ради, «Граф Нулин» примерно такого же размера (если судить по размеру файла).

Вот что у меня получилось. Это анализ биграмм, то есть последовательностей из двух слов; мне кажется, что это хотя бы немного поможет избежать того, что пьесы окажутся близки из-за слов типа «явление» или «действие».


В общем, все пьесы попали в одну ветку. Я предполагала, что ветки разделятся по авторам (и в прозе так и происходит: Пушкин отдельно, Лермонтов — отдельно), но, как видно, «Маскарад», например, попал к пьесам, а «Демон» — к поэмам. Гладков молодец, зря я сомневалась (но я ещё подумаю, насколько мне нравится «об... идиотском шёлке»).

А моё стихотворение соединилось с «Тамбовской казначейшей». Наверно, это значит, что стилометрия работает неплохо: у нас обоих онегинские строфы.
24 февраля 2021
ПОИСК
ФАНФИКОВ











Закрыть
Закрыть
Закрыть