|
Заметил, что обороты вида "не то, а это", особенно несколько на абзац, окончательно вышли из оборота более-менее читающей и пишущей публики. Теперь такое выдаёт или ИИ, или те кто не в курсе...
И кстати - отдельный способ отпугнуть читателя это вставить аннотацию, написанную llm (особенно бесплатной китайской). А ведь на Киниге/Фикбуке это местами аж как лайфхак некоторые рекламировали. Лучше уж вообще без аннотации, чем сгенерированная, имхо. Даже орфографические ошибки теперь отпугивают меньше... #ai #ии 15 марта в 12:47
3 |
|
Atomlib:
Показать полностью
... Из комментариев к этой статье>Будьте конкретнее, пожалуйста. Зря вы это сказали. Поскольку никто нормально комментарии не читает, придётся сразу оговориться: мне всё равно, кто и как писал текст. Мне не нравится исключительно сам машинный стиль, а не факт, насколько автоматизированным был процесс написания. Если кому-то удаcтся добиться на выходе из ChatGPT красивого текста, то я за этого человека буду искренне счастлив и не буду возражать читать подобное. К сожалению, писанина у машин всегда максимально отвратительная. >Это не предупреждение из разряда «желательно» - это обязательное условие. >это не опция, это необходимость >Это не «похоже на Chrome» — это Chrome. >они не конкурируют, они комбинируются Противопоставление вида «это не X, это Y». А вот тут просто каша из нескольких приёмов, характерных для языковых моделей. Темп, повторы, тире — всё машинное: >Рукопожатие идеальное. Детекция идёт не по нему. Детекция идёт по поведению соединения после него — и здесь Reality ничего не делает. Большие языковые модели считают, что повторы — это очень красиво. Вообще, переиспользование структур языка — частая проблема БЯМ. В одной из прошлогодних работ (arXiv:2504.09373) был такой вывод: «we find that LLMs often reuse discourse structures (more so than humans) across samples, even when content differs». Там речь шла про повторы в повествовании вообще, не про слова, но мне кажется это связанным. Больше повторов слов: >Реальное iCloud-соединение от реального iPhone или Mac имеет характерный паттерн запросов: конкретные API-эндпоинты, конкретные заголовки, конкретные тайминги. >Каждая транзакция — это обычная HTTP-пара запрос-ответ с нормальными заголовками, нормальным временем жизни. Повторы и противопоставления в одном флаконе: >Reality закрывает детекцию на уровне TLS-рукопожатия и активного зондирования. XHTTP закрывает детекцию на уровне поведения соединения после рукопожатия. >Она маскирует установку соединения, но не маскирует то, что по этому соединению передаётся. >Детекция идёт не по нему. Детекция идёт по поведению соединения после него Другая проблема — ненужные тире, которые вставляются абсолютно без повода: >Что конкретно изменилось, как это устроено на уровне алгоритмов — и почему XHTTP сейчас выглядит как правильный следующий шаг. >DPI-система делает активное зондирование, получает сертификат, смотрит на ASN и IP-адрес сертификата — и видит что это не iCloud и не Spotify. >Но для детекции «это не браузер вообще» — JA3 по-прежнему работает отлично. Иногда куда лучше бы смотрелась запятая вместо тире: >Именно здесь Reality начинает проигрывать — и к этому мы вернёмся. >JA3-хэш Go-клиента хорошо известен — он встречается в базах детекции. >Не потому что их «нашли» — а потому что их трафик-профиль слишком аномальный. Из-за подобных тире текст читается с каким-то придыханием, будто от избытка чувств перевести дух не удаётся. Но откуда здесь взяться эмоциям? Хотя тема животрепещущая, текст технический. Не знаю, как называются вот такие конструкции в кавычках, но в машинной писанине они везде: >Это не «похоже на Chrome» — это Chrome. >Но для детекции «это не браузер вообще» — JA3 по-прежнему работает отлично. >Не «похожим на нехороший» — просто другим, и это уже аномалия. Также БЯМ используют кавычки при малейшем оттенке переносного смысла. Видимо, их обучали на образцах литературного русского, но тонкости языка они уловить не в состоянии: >Реальный Chrome вставляет случайные «мусорные» расширения в ClientHello. >видит «нормальный» HTTP-трафик. Наконец, приём, который меня выбешивает: два–три однотипных односложных предложения, рублёный ритм. Почему это случается, понять легко: дробим фразу, и сказанное будет выглядеть мощнее — дёшево и сердито. >Выбор очевидный. Конфиги выше. Удачи. >Работает. Пока. Где-то. У некоторых. Иногда. Если сервер не под нагрузкой. И донор выбран правильно. И луна в правильной фазе. >Рукопожатие идеальное. Детекция идёт не по нему. Детекция идёт по поведению соединения после него — и здесь Reality ничего не делает. А вот заголовки в разумных пределах мне наоборот нравятся. Не вижу ничего дурного в том, что есть выделение полужирным. Разве что здесь не так много написано, чтобы была необходимость разбавить простыню текста форматированием. Отредактировано: Вижу, что пока писал этот комментарий, вы уже убрали многие из этих примеров из текста. 1 |
|
|
А как по аннотации понять, что она сгенерирована? Она же совсем короткая
|
|
|
ar neamhni
Не то чтобы понять, но оценить вероятность можно и по одному абзацу. Вот пример из топа Киниги, который отчётливо вызывает подозрения: Гарри Поттер, легендарный Главный аврор с сорокалетним стажем, мечтал о покое, а получил... вторую смену. Проснувшись в теле безносого психопата, он не впадает в истерику, а включает режим аудитора. Пожиратели смерти? Профнепригодные кадры с ПТСР. Министерство? Гнилое болото. Грядёт корпоративный ад: Беллатриса учит этикет, Снейп пишет отчёты в трёх экземплярах, а Люциус оплачивает банкет. Британию ждёт не террор, а тотальная проверка. Тёмный Лорд ещё никогда не был настолько... адекватным. И гляньте разбор из первого комментария.1 |
|
|
Marlagram
ну здесь да, но у ИИ можно же и нормальную выбить. Ну, мне так кажется. |
|