↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
ReFeRy Онлайн
10 апреля 2021
Aa Aa
#повседневное #информационные_технологии #интернет_сайты

Меня можно назвать олдфагом в отношении интернета, да ещё я айтишник. Для меня измерять размер текста в килобайтах - это нормально и понятно.
На заре компьютеризации общества одна буква кодировалась одним байтом информации. В килобайте 1024 байт. То есть, текст размером 10 кб, это текст в 10240 символов, включая пробелы и переносы строк.
С позиции же более молодого и/или менее технически подкованного человека - это странно. Одна буква уже давно занимает не один байт. Изменять в единицах, кратных 1024? Да и пользователям уже давно нет необходимости понимать, что такое байт, килобайт или сколько их влезает на дискету, диск, флешку или сколько надо времени, чтобы скачать с интернета файл, объемом 1 мегабайт. Для большинства пользователей интернета измерять размер текста в килобайтах, значит усложнять ситуацию, вносить дополнительные смыслы и определения.

Раньше это было упрощением через общеупотребимое понятие, а теперь это усложнение.

Дополнительная проблема в том, что на многих сайтах зачем-то до сих пор пишут размер файла с текстом в килобайтах. Особенно популярно это там, где есть возможность скачать текст в различных форматах. Ну какая сейчас разница - 345 кб файл весит или 396? Однако, это используется. И это дополнительно мешает измерять в килобайтах именно число знаков, а не размер файла.

Однако альтернативные меры измерения размера текстового произведения тоже не без греха. Самым объективным и понятным является измерение в тысячах символов, тут возникает всего один вопрос - с пробелами или без. И то, возникает он только у людей, что-то слышавших про копирайтинг.

Многие немолодые авторы привыкли измерять литературные произведения в авторских листах.
В СССР и Российской Федерации учётный авторский лист равен 40 000 печатных знаков (включая знаки препинания, цифры и пробелы между словами и до полей), или 700 строкам стихотворного текста, или 3000 см² воспроизведённого авторского иллюстрационного материала (графиков, рисунков, таблиц). Авторский лист составляет основу специальной системы подсчёта для определения объёма подготовленных к изданию рукописей и опубликованных работ.
(c) Википедия
Этот подход тоже очень сильно устарел, мало кому сейчас понятно, зачем в современном интернете привязываться к стандартам измерения печатных изданий времён СССР.

Самый странный формат, вызывающий у меня больше всего вопросов - страницы. Я знаю два определения размера "страницы". На фикбуке страница это: 50 строк текста, в каждой строке не более 90 символов, при переносе на следующую строку слова не разрываются. В страницах на Фанфиксе я реализовал этот же алгоритм. А вот на ЛитМаркете страницей считают тупо 1800 символов. Зачем нужны такие страницы и что они дают пользователю, я искренне не понимаю уже много лет.

Есть ещё вариант измерения размера текста в словах. Насколько я знаю, корни этого дела уходят глубоко в прошлое. Когда-то в газетах/журналах платили авторам публикаций за каждое слово и вроде бы при оплате переводов тоже так считали. Что даёт пользователю количество слов в тексте? Я не знаю. Как и с килобайтами, авторскими листами, страницами - дело привычки.

Каждый человек вырабатывает свои уникальные ассоциации и привычки, кто-то помнит, что средний размер издаваемого романа - 16 авторских листов, а роман более 25 а.л. одним томом уже вообще не издать (речь про художественную литературу, Российские издательства, примерно на рубеже веков). Кто-то привык работать в ворде и ему удобно считать страницы (хотя и получается очень примерно). Кто-то привык к словам.

Итого в каком формате приводить размер фанфиков/ориджиналов/книг на современном сайте? Логичнее всего в тысячах символов.

P.S. Это просто пост-размышление.
10 апреля 2021
50 комментариев
А почему ни слова про единицу "слово"? :3
ReFeRy Онлайн
GreenWater
А почему ни слова про единицу "слово"? :3
О, точно. Полчаса писал пост, меня тут дома дёргали, когда уже закончу и пойду ужинать. В итоге забыл :(
слова переменной длины
Всегда думаю о длине текста в словах. Да, мое восприятие безвозвратно искажено космобитвами
ReFeRy Онлайн
Добавил про слова.
Мне удобны варианты как в кб, так и в словах, т.к. я приблизительно знаю, что 9к слов - это обычно около 50 кб. Легко оценивать размер)
"мало кому сейчас понятно, зачем в современном интернете привязываться к стандартам измерения печатных изданий времён СССР"
Эм, я не проверял, а в современных печатных изданиях этот стандарт уже не работает, что ли? Просто обычно объясняется, что в этом и смысл: по тексту хоть в интернете, хоть в рукописи сразу понять, сколько он займёт в книжном виде. Для тех, кто действительно собирается издаваться, по-прежнему актуально.
Да, в тысячах знаках - вариант. А если в килобайтах - то считать не в юникодном, а в 8-битном варианте кодировки. В конце концов, перевести тексты в такие кодировки потенциально возможно почти всегда.
В эл.книгах Amazon размер текста измеряется в "местах". 100 страниц - в среднем 3000 таких "мест".
(с подозрением) А не навеян ли этот вопрос недавними обновлениями на фикбуке?
Если чо, меня устраивают текущие измерения.
ReFeRy Онлайн
GreenWater
Для тех, кто действительно собирается издаваться, по-прежнему актуально.
Авторов, издающихся на бумаге - незначительное число, по сравнению с тем, сколько человек имеют дело с текстами в интернете.
GreenWater
Именно что! Эта система работает до сих пор. И для всех, кто так или иначе имеет дело с изданием текстов на бумаге, считать в знаках с пробелами вполне привычно. И для корректоров/редакторов при оценке объема работы и ее стоимости, и для наборщиков/верстальщиков, и для переплетчиков, и т.д.
ReFeRy
Работающие в интернете тоже считают объем своей работы в знаках с пробелами и по этому параметру выставляют счет))
"Что даёт пользователю количество слов в тексте? Я не знаю."
Версия: когда не было компьютеров, использовали число слов, потому что его проще определить вручную, чем символы ))
А так... число слов более ясно даёт впечатление об объёме текста. С символами это напрямую не связывается - может, автор любит длинные слова и имена, поэтому у него выходит знаков побольше. Но читаем-то мы не по символам, а по словам.
ReFeRy Онлайн
хочется жить
(с подозрением) А не навеян ли этот вопрос недавними обновлениями на фикбуке?
Если чо, меня устраивают текущие измерения.
Нет. Отменять мини-миди-макси я не планирую. Вот добавить поиск по заданному пользователем количеству кб/т.с./слов/страниц планирую. Тут-то и возникает вопрос, какой способ измерения использовать по умолчанию. Но этот вопрос давно стоит.
ReFeRy Онлайн
GreenWater
А так... число слов более ясно даёт впечатление об объёме текста. С символами это напрямую не связывается - может, автор любит длинные слова и имена, поэтому у него выходит знаков побольше. Но читаем-то мы не по символам, а по словам.
Всё зависит от персонального опыта и ассоциаций. Я работаю с текстами более 15 лет. Размер в словах мне не говорит ничего. Просто не привык к такому измерению. Зато количество символов мне скажет о тексте всё необходимое.
ReFeRy
А, ясно.
Но это вкусовщина, кмк.
Не угадать.
ReFeRy
Кстати, помнится, вы говорили, что есть в планах сделать возможным, чтоб в содержании отображалось количество знаков в главе.
Это не праздный интерес, просто с опытом уже знаешь, сколько твоих личных человекочасов уходит на редактуру 10 тысяч, сколько на авт.лист.
Привыкла в (тысячах) символах.
Все тезисы, статьи, аннотации считаются в них.
Кб - ок, потому что примерно похоже, погрешностью можно пренебречь.
Практически все регламентируемые длины текстов в интернете кроме художественных произведений считаются в символах с пробелами. Заполнение разного рода форм в заявках со свободным изложением материала, научные статьи в большинство журналов (только монографии и совсем уж старомодные издания продолжают мерить в авторских листах), да банальная длина SMS-ок ограничена именно числом символов, включая пробелы. Не вижу причин плодить сущности и в случае с сетевой литературой.
ReFeRy
А если есть техническая возможность, можно ли, чтоб пользователь выбирал вариант себе по вкусу?
Я знаю только, что около 1мб способен за сутки прочесть. В остальном на единицы измерения мне плевать.
Я тоже считаю, что в тысячах символов - наиболее удобная единица измерения (только называю их "килознаками", потому что "тысяча символов" - громоздко).
А, еще одну засаду с измерением вспомнила.
На АТ, чтоб попасть в виджет, нужна глава объемом не менее 15 т.с. Несешь отсюда главу в 15 кб — но она может оказаться меньше знаков этак на сотню, приходится дописывать на ходу.
InCome
Упс, а как? 15*1024 - больше 15000.
Или там меряют в знаках без пробелов?
Есть же ещё количество слов. Несмотря на разницу в длине этих самых слов, данный способ измерения размера текста во многом адекватнее и сильно понятнее других.
UPD: ого, сколько комментов накатали, пока я тупила.
Уточню, что количество слов - удобная мера именно для читателя. Но конечно, к этому нужно сначала привыкнуть.
Лично мне удобнее и привычнее в килобайтах или в символах.
Страницы, слова - заставляет лишний раз напрягаться и соображать "а это сколько?"
хочется жить
А вот и я не понимаю, как так. Меряют в знаках с пробелами. Может, какие-то технические символы еще подрезаются при переносе?
Килобайты и знаки.
InCome
А, это возможно.
Я как-то столкнулась с ситуацией, когда моего подбетного завернули с конкурса по причине превышения лимита символов. Там был большой отрывок, который необходимо было выделить курсивом, а каждый тег курсива - это семь символов. Причём, когда его ставишь, он и занимает семь символов, а как только сохранишь - этот грёбаный тег ставится на каждый абзац, а это хуева туча доп. символов.
ReFeRy Онлайн
хочется жить
Есть такие не очевидные нюансы. Например, в подсчете слов тоже хватает проблем. Частицы и союзы за слова считаются? А если человек постоянно пишет с ошибками "кто то", "что то" и так далее...
ReFeRy
Ржу.
Небеченые работы не публикуются.
GreenWater
Эм, я не проверял, а в современных печатных изданиях этот стандарт (стандарт измерения печатных изданий времён СССР) уже не работает, что ли?
Работает. Только в электронном формате он нахрен не нужен.
40 000 символов, редакторский лист - это издательская система измерения, завязанная на типографскую технику.
1800 символов это машинописные страницы, напечатанные на пишущей машинке через два интервала.
Ну и зачем это здесь?
Не надо ничего менять, пожалуйста)

Привыкла в килобайтах, потому что тексты читала в основном здесь, и как-то общая структура нарисовалась. Большой фик, маленький или средний для своего размера, за сколько я его прочитаю, много ли я написала. Очень удобно, везде бы так делали.
Лучшее враг хорошего.
Размер именно в килобайтах прекрасно представляю.
Особенно на конкурсе :)
Именно по нему я определяю, как и что буду читать. Мини-миди-макси - при поиске и сортировке.
InCome
ReFeRy
Работающие в интернете тоже считают объем своей работы в знаках с пробелами и по этому параметру выставляют счет))
Плюсую. Именно так.
Привыкла в знаках с пробелами. Самый точный показатель, имхо.
Но в то же время я буду скакать от радости, если хоть один мой текст возьмёт планку в 1 мб. И пофиг на тыс. симв.)
ArtChaos
Я буду циничен, но вставь в текст картинку. :)
Собственно, этим тысячи знаков и лучше килобайтов.
Виктор Некрам
Ахаха)

Но на самом деле у нас картинки в счёт не идут)

Да, чуть-чуть добавить самим тегом и вставкой, но вес картинки не идёт в счётчик)
ArtChaos
Вес не идёт, но символы кода картинки идут.
хочется жить
ну я про то же.
Вообще удобнее всего было бы по персонализированной скорости чтения, как у MonkAlex. Ну плюс с какой-то объективной цифрой на случай, если оценка плохо работает. Читалки так делают.
Немножко не в тему, но в шапке фиков немножко не хватает информации о количестве глав. Когда читаешь по главам и переходишь к следующей главе с помощью соответствующей кнопочки, ты не знаешь, сколько тебе ещё осталось до конца.
Marlagram Онлайн
Итого в каком формате приводить размер фанфиков/ориджиналов/книг на современном сайте? Логичнее всего в тысячах символов.
Нету и не будет одного, универсального решения - пока сайт ориентируется на широкую, особенно в смысле возраста, аудиторию.
Менять привычки сложно. Особенно привычки с выдержкой в десятилетия. Поэтому - кто как привык, тот так и будет измерять. Мне вот действительно привычно измерять в килобайтах однобайтно кодированного текста - и я ещё помню эксперименты по части архиваторов и попыток запихнуть больше на эту дискету, ещё больше, .ha с вручную, экспериментально подобранным размером словаря под каждый архив и 800.com...

Этот подход тоже очень сильно устарел, мало кому сейчас понятно, зачем в современном интернете привязываться к стандартам измерения печатных изданий времён СССР.
...
что средний размер издаваемого романа - 16 авторских листов, а роман более 25 а.л. одним томом уже вообще не издать (речь про художественную литературу, Российские издательства, примерно на рубеже веков).
Он не устарел для тех, кто много читал в 90-х и нулевых. Только глядя на цифру а. л./п. л. в издательской сводке в конце книги можно было предположить реальное содержание текста в бумажном кирпичике на вокзальном книжном развале, торопясь на поезд. Количество страниц, физическая толщина - всё это ерунда...
И да. Нормальная книжка - это 26-30 а. л. Вон, взять Панкееву "Рассмешить богов" в Армаде-Альфа-книге издания 2006 года - 26,88.
Показать полностью
Вообще, как мне кажется, удобно два варианта: количество символов (с указанием - "с пробелами" или "без пробелов") для расчёта объёма, на который ориентируется автор, и количество слов, на который ориентируется читатель (скорость чтения, если я правильно помню, в словах же).
Навия
Количество символов без пробелов придумали, чтобы недоплачивать текстовикам. Я не очень понимаю, кому оно может быть интересно.
Виктор Некрам
Я тоже ХЗ, но мне бы вообще хотелось бы видеть, как именно в данной избушке считают, а не думать - с пробелами или без имелось ввиду.
Я ориентируюсь обычно на Кб. Просто в силу привычки.
345 или 396 Кб - действительно разницы нет. Но 100, 500 или 10000 Кб дают хорошее сравнительное представление о размерах текста.
На фигбуке страница — это что-то вообще очень странное. Проводили эксперименты, делали разные разбивки (части, абзацы), получали в результате текста с гулькин… нос, а страниц при этом дохрена и больше.
ReFeRy Онлайн
Wave
Я описал в посте алгоритм подсчета страниц на фикбуке. Весь вопрос лишь в обработке пустых строк, считать их или нет или частично считать.
ПОИСК
ФАНФИКОВ







Закрыть
Закрыть
Закрыть