1 октября в 10:20
|
|
Jas Tina, у людей разный словарь и плюс в зависимости от выбранного стиля разная частота употребления длинных и коротких слов. Соответственно, если в конкурс допускаются мини в районе 5 кб, то возможна большая разница между кб и словами. Потому что слова, эм, как бы так сказать... разной длины??? Если вдруг не замечали. А символы одной и той же длины всегда. Поэтому считать объём в символах легче - это стабильная штука. Если ты добавил 1 счёта, то добавилось ровно столько-то байт, всё стабильно. А если ты добавил одно слово, то может добавиться от 1 байта до каких-нибудь 15 (ладно, на самом деле, больше, но мне влом вспоминать длину "самых длинных слов"). И с обратной стороны, если ты добавил 6 единиц учёта в символах, то добавилось 6 байт. Если ты добавил 6 единиц учёта в словах, то добавилось... ну вы поняли. Профессиональные издательства, которым нужен организованный учёт, считают в авторских листах - эти штуки тоже получаются из символов (печатных знаков). И ладно бы, допустим, учёт слов как-то помогал (типа в отличие от учёта символов) показывать, сколько "более информативного" текста, но нет, условные "и" учитываются наравне с прилагательными, существительными и глаголами! Некоторые слова и вовсе имеют эквивалент в виде символов-неслов, например, "и" и запятая, "является" и тире и т.п., т.е. учёт слов не улучшает понимание осмысленности текста.
В общем, мне лично непонятно. Ладно бы в а.л. (хотя такую большую единицу применять на конкурсе, где мини, нелогично, но хотя бы понятно, почему так - организатор является профессиональным редактором, ему привычно в алках мыслить). Но слова - это нечто странное. Почему не в фразах? Фразы больше коррелируют с количеством смысла в тексте. Ещё лучше, наверно, будет выглядеть учёт в грамматических основах, включая опущенные для краткости, но это сложно реализовать технически, зато будет полезней. Наверное, ещё как-то можно поиграть с энтропией текста, не уверен, типа, посчитать какой-нибудь интеграл от энтропии, получая через плотность информации общее количество? Хз, но это будет обоснованный подход. 6 |