↓
 ↑
Регистрация
Имя/email

Пароль

 
Войти при помощи
Временно не работает,
как войти читайте здесь!
Marlagram Онлайн
вчера в 03:20
Aa Aa
Промпт для GPT-4o: Как превратить текст в «человеческий» и обойти AI-детекторы
...
Система, решающая эту задачу, условно называется «Humanizer» (от англ. humanize – очеловечивать). В данном отчёте рассматриваются методы создания такой системы и обеспечения того, чтобы выходной текст выглядел как написанный человеком, оставаясь при этом этичным и законным.
...
Одной из ключевых стратегий Humanizer-системы является лингвистическая вариативность – то есть умение перефразировать исходный ИИ-сгенерированный текст множеством разных способов, избегая шаблонности и избыточно правильного, «машинного» языка. ИИ-модели часто повторяют устойчивые обороты и поддерживают единообразный стиль изложения, что выдаёт их природу. Humanizer должен разнообразить лексику и синтаксис: заменять слова синонимами, пересоставлять предложения, менять залог (активный/пассивный) и порядок слов, дробить длинные предложения или, наоборот, объединять короткие. Эти приёмы разбивают монотонность текста и устраняют шаблоны, присущие ИИ.
...
Синонимическая замена и перефразирование уничтожают очевидные повторы и делают текст уникальным. Инструменты-парафразеры вроде Quillbot уже давно применяют такие техники для улучшения слога. В исследовании Pangram Labs перечислены популярные сегодня сервисы, умеющие «очеловечивать» или перефразировать текст: от классических парафразеров (Grammarly, Quillbot) до специальных «AI humanizer»-платформ (Bypass GPT, HumanizeAI, StealthWriter.AI, Undetectable AI, WriteHuman.ai и др.).
...
Чтобы текст казался написанным человеком, недостаточно варьировать лексику – полезно имитировать некоторые человеческие когнитивные черты, которые почти отсутствуют в выверенном ИИ-тексте. К ним относятся: случайные ошибки, внезапные сдвиги мысли, колебания в логике изложения, эмоциональные или субъективные вкрапления. Умеренное внедрение таких элементов делает слог более человечным, ведь реальные люди не пишут как идеальные автоматы.
...
Имитация когнитивных сдвигов может заключаться в том, чтобы вставить внезапное замечание или вопрос от первого лица.
...
Добавление фраз, выражающих личное мнение или сомнение («мне кажется», «я не совсем уверен»), также придаёт тексту человеческий облик. Машинные тексты часто звучат излишне уверенно и категорично; человеческий же текст может содержать оговорки, условности, субъективные оценки.
...
например, добавить предложение, которое не несет новой информации, но служит эмоциональной реакцией («Честно говоря, это весьма неожиданно.»), или включить небольшой оффтопик-пример. Такие элементы отражают человеческую спонтанность мысли.
...
У каждого человека свой почерк: кто-то злоупотребляет скобками (репликами в скобках), кто-то ставит многоточия, кто-то использует разговорные слова-паразиты («в общем», «как бы», «значит»). Такие черты обычно отсутствуют в гладком тексте от ИИ. Поэтому внедрение стилистических особенностей личности – ещё один уровень очеловечивания.
...
Программа GPTZero, например, стала знаменитой использованием метрик «перплексии и равномерности» (см. далее) – грубо говоря, она ищет слишком упорядоченный, предсказуемый текст.
...
Предсказуемость текста – главный враг «незаметности». Современные детекторы анализируют статистические свойства, такие как перплексность (perplexity) и «рывистость» текста (burstiness), чтобы отличить ИИ-стиль от человеческого. В общих чертах, ИИ стремится генерировать наиболее вероятные по модели слова и строить гладкие предложения средней длины. Человек же часто выбирает менее ожидаемые слова и чередует короткие и длинные фразы.
...
Использование разных типов предложений: повествовательные разбавлять вопросительными или восклицательными (если уместно). Например: «Многие задаются вопросом – а что же будет дальше?» – подобная фраза в середине анализа неожиданна, но в живом тексте встречается.

Менять структуру: иногда начинать с обстоятельства («По этой причине мы...») или с подлежащего, иногда использовать диалоги или цитаты. ИИ часто придерживается одной схемы, а человек свободнее перестраивает фразу.
...
Лучшие коммерческие детекторы достигали ~84% точности, а бесплатные – около 68%, и это в идеальных условиях.
...
Отметим, что уже существуют инструменты, сочетающие проверку текста и его «очеловечивание» под потребности пользователя. Например, сервис Humbot.ai заявляет: «мы поможем очеловечить текст ИИ и обойти распространённые детекторы (Originality.ai, ZeroGPT и др.)».
...
Современные генеративные модели могут оставлять в тексте едва уловимую «подпись» – статистический или даже криптографический признак, по которому можно распознать искусственное происхождение. Подпись может появляться неумышленно (как итог особенностей обучения модели) или быть целенаправленно встроенной разработчиками (водяной знак). Задача Humanizer – обнаружить и стереть эти метки, то есть выполнить signature scrubbing (очистку от подписи).
...
Например, может оказаться, что язык модели GPT всегда чуть чаще употребляет редкое слово X, чем это делают люди. Детекторы могут ловить такие тонкие стилистические отличия. Поэтому Humanizer должен по возможности сгладить статистический профиль текста, приблизив его к среднестатистическому человеческому. Для этого используются описанные выше методы вариативности – они как раз устраняют типичные паттерны модели. Кроме того, есть подход кросс-модельного преобразования: когда текст, сгенерированный одной нейросетью, пропускают через другую модель с иным стилем. В результате смешиваются стили, и исходная «fingerprint» первой модели размывается.
...
Другой пример – система SynthID от Google DeepMind, которая помечает текст на уровне скрытых признаков вероятностей токенов. Идея в том, что зная ключ или паттерн, можно проверять, есть ли в тексте этот отпечаток.

Humanizer должен уметь обнаруживать и убирать подобные водяные знаки. Чаще всего это достигается опять-таки перефразированием.
...
разработчики детекторов тоже не стоят на месте: уже появляются алгоритмы, натренированные распознавать «очеловеченный» текст. Так, исследователи Pangram Labs специально обучили детектор на выборке текстов, прошедших через популярные humanizer-инструменты, и добились того, что их модель стала успешно различать даже парафразированный ИИ-текст.
...
В краткосрочной перспективе (2025–2026 гг.) мы увидим эскалацию противоборства: детекторы будут улучшаться (учитывать парафразирование, обучаться на adversarial примерах), а Humanizer-инструменты – усложнять методы (многошаговые трансформации, глубокая персонализация). Возможно появление гибридных решений: например, сервис, который сначала определяет вероятный алгоритм генерации (GPT/Claude и пр.), а потом применяет оптимизированный под него профиль перефраза.
...
Небольшая ликбезная статья на весьма актуальную тему.

Предсказуемость для художественного текста... Эхм. Сложный вопрос, штампы подтвердят.
Но например попытки писать разными нейросетками с специально разными дополнениями промптов за разных персонажей уже даже не новость кое-где...

#ai #дзен
вчера в 03:20
2 комментария
А кое где - это где?
Marlagram Онлайн
Asteroid
В игродеве.
ПОИСК
ФАНФИКОВ











Закрыть
Закрыть
Закрыть