Marlagram: Заметил, что обороты вида "не то, а это", особенно несколько на абзац, окончательно вышли из оборота

Заметил, что обороты вида "не то, а это", особенно несколько на абзац, окончательно вышли из оборота более-менее читающей и пишущей публики. Теперь такое выдаёт или ИИ, или те кто не в курсе...

И кстати - отдельный способ отпугнуть читателя это вставить аннотацию, написанную llm (особенно бесплатной китайской). А ведь на Киниге/Фикбуке это местами аж как лайфхак некоторые рекламировали. Лучше уж вообще без аннотации, чем сгенерированная, имхо.
Даже орфографические ошибки теперь отпугивают меньше...

#ai #ии

Сообщение не показывается в общей ленте блогов

15 марта в 12:47

Отключить рекламу

4 комментария

Marlagram Онлайн

15 марта в 13:10

Atomlib:

...
>Будьте конкретнее, пожалуйста.

Зря вы это сказали.

Поскольку никто нормально комментарии не читает, придётся сразу оговориться: мне всё равно, кто и как писал текст. Мне не нравится исключительно сам машинный стиль, а не факт, насколько автоматизированным был процесс написания.

Если кому-то удаcтся добиться на выходе из ChatGPT красивого текста, то я за этого человека буду искренне счастлив и не буду возражать читать подобное. К сожалению, писанина у машин всегда максимально отвратительная.

>Это не предупреждение из разряда «желательно» - это обязательное условие.

>это не опция, это необходимость

>Это не «похоже на Chrome» — это Chrome.

>они не конкурируют, они комбинируются

Противопоставление вида «это не X, это Y».

А вот тут просто каша из нескольких приёмов, характерных для языковых моделей. Темп, повторы, тире — всё машинное:

>Рукопожатие идеальное. Детекция идёт не по нему. Детекция идёт по поведению соединения после него — и здесь Reality ничего не делает.

Большие языковые модели считают, что повторы — это очень красиво. Вообще, переиспользование структур языка — частая проблема БЯМ. В одной из прошлогодних работ (arXiv:2504.09373) был такой вывод: «we find that LLMs often reuse discourse structures (more so than humans) across samples, even when content differs». Там речь шла про повторы в повествовании вообще, не про слова, но мне кажется это связанным.

Больше повторов слов:

>Реальное iCloud-соединение от реального iPhone или Mac имеет характерный паттерн запросов: конкретные API-эндпоинты, конкретные заголовки, конкретные тайминги.

>Каждая транзакция — это обычная HTTP-пара запрос-ответ с нормальными заголовками, нормальным временем жизни.

Повторы и противопоставления в одном флаконе:

>Reality закрывает детекцию на уровне TLS-рукопожатия и активного зондирования. XHTTP закрывает детекцию на уровне поведения соединения после рукопожатия.

>Она маскирует установку соединения, но не маскирует то, что по этому соединению передаётся.

>Детекция идёт не по нему. Детекция идёт по поведению соединения после него

Другая проблема — ненужные тире, которые вставляются абсолютно без повода:

>Что конкретно изменилось, как это устроено на уровне алгоритмов — и почему XHTTP сейчас выглядит как правильный следующий шаг.

>DPI-система делает активное зондирование, получает сертификат, смотрит на ASN и IP-адрес сертификата — и видит что это не iCloud и не Spotify.

>Но для детекции «это не браузер вообще» — JA3 по-прежнему работает отлично.

Иногда куда лучше бы смотрелась запятая вместо тире:

>Именно здесь Reality начинает проигрывать — и к этому мы вернёмся.

>JA3-хэш Go-клиента хорошо известен — он встречается в базах детекции.

>Не потому что их «нашли» — а потому что их трафик-профиль слишком аномальный.

Из-за подобных тире текст читается с каким-то придыханием, будто от избытка чувств перевести дух не удаётся. Но откуда здесь взяться эмоциям? Хотя тема животрепещущая, текст технический.

Не знаю, как называются вот такие конструкции в кавычках, но в машинной писанине они везде:

>Это не «похоже на Chrome» — это Chrome.

>Но для детекции «это не браузер вообще» — JA3 по-прежнему работает отлично.

>Не «похожим на нехороший» — просто другим, и это уже аномалия.

Также БЯМ используют кавычки при малейшем оттенке переносного смысла. Видимо, их обучали на образцах литературного русского, но тонкости языка они уловить не в состоянии:

>Реальный Chrome вставляет случайные «мусорные» расширения в ClientHello.

>видит «нормальный» HTTP-трафик.

Наконец, приём, который меня выбешивает: два–три однотипных односложных предложения, рублёный ритм. Почему это случается, понять легко: дробим фразу, и сказанное будет выглядеть мощнее — дёшево и сердито.

>Выбор очевидный. Конфиги выше. Удачи.

>Работает. Пока. Где-то. У некоторых. Иногда. Если сервер не под нагрузкой. И донор выбран правильно. И луна в правильной фазе.

>Рукопожатие идеальное. Детекция идёт не по нему. Детекция идёт по поведению соединения после него — и здесь Reality ничего не делает.

А вот заголовки в разумных пределах мне наоборот нравятся. Не вижу ничего дурного в том, что есть выделение полужирным. Разве что здесь не так много написано, чтобы была необходимость разбавить простыню текста форматированием.

Отредактировано: Вижу, что пока писал этот комментарий, вы уже убрали многие из этих примеров из текста.

Из комментариев к этой статье

Показать полностью

	ar neamhni 15 марта в 13:46
А как по аннотации понять, что она сгенерирована? Она же совсем короткая

Marlagram Онлайн

15 марта в 13:53

ar neamhni
Не то чтобы понять, но оценить вероятность можно и по одному абзацу.
Вот пример из топа Киниги, который отчётливо вызывает подозрения:

Гарри Поттер, легендарный Главный аврор с сорокалетним стажем, мечтал о покое, а получил... вторую смену. Проснувшись в теле безносого психопата, он не впадает в истерику, а включает режим аудитора. Пожиратели смерти? Профнепригодные кадры с ПТСР. Министерство? Гнилое болото. Грядёт корпоративный ад: Беллатриса учит этикет, Снейп пишет отчёты в трёх экземплярах, а Люциус оплачивает банкет. Британию ждёт не террор, а тотальная проверка. Тёмный Лорд ещё никогда не был настолько... адекватным.

И гляньте разбор из первого комментария.

	ar neamhni 15 марта в 14:19
Marlagram ну здесь да, но у ИИ можно же и нормальную выбить. Ну, мне так кажется.