Как понять, что текст сгенерирован нейросетью: семь советов от нейросети

С развитием технологий искусственного интеллекта преподаватели всё чаще сталкиваются с текстами, которые были созданы нейросетями. Эти тексты могут варьироваться от домашних заданий до эссе и исследовательских работ, и порой бывает непросто отличить их от работ, написанных студентами и студентками.

Однако существуют некоторые признаки и стратегии, которые помогут распознать, что текст был создан не человеком, а нейросетью.

1. Анализ стиля текста и излишняя формальность

Нейросети, такие как ChatGPT, обычно создают текст, который выглядит гладким и логически связанным, но при этом может быть излишне формальным или стилистически нейтральным. Они избегают индивидуальных ошибок, типичных для студентов и студенток, и редко используют разговорные конструкции, которые иногда встречаются в живом языке.

Что обратить внимание:

  • Слишком идеальные предложения, отсутствие жаргона и привычных опечаток.
  • Стилистическая нейтральность, отсутствие индивидуального почерка или личного мнения.

2. Необычная структурированность и «механическая» последовательность

Нейросети часто генерируют текст с классической линейной структурой, где присутствует явная вводная часть, ровные абзацы и предсказуемые переходы. Если текст кажется чересчур упорядоченным и последовательным, это может быть признаком генерации.

Что обратить внимание:

  • Слишком чёткая структура, словно «по шаблону».
  • Одинаковая длина абзацев, одинаковый ритм текста.
  • Отсутствие неожиданных переходов или личных замечаний.

3. Отсутствие глубины в изложении и использование общих фраз

Нейросети могут создавать тексты, которые выглядят логично, но при этом часто остаются на поверхностном уровне, не вдаваясь в подробности и избегая конкретных примеров. Это связано с тем, что нейросети могут не всегда обладать глубинным пониманием темы.

Что обратить внимание:

  • Общие фразы и поверхностные утверждения, которые кажутся «универсальными».
  • Отсутствие ссылок на личный опыт или конкретные исследования, которые могли бы дать глубину.
  • Повторение одних и тех же идей, просто сформулированных разными словами.

4. Ошибки, нетипичные для человека

Нейросети способны генерировать ошибки, которые выглядят необычно для студентов и студенток, особенно если речь идёт о фактах или специфике. Например, нейросеть может допустить ошибки в описании событий, дат, имён или терминов, если у неё нет точных данных в обучающей выборке.

Что обратить внимание:

  • Ошибки в известных фактах, которые кажутся странными для человека, но могут быть результатом неточности данных.
  • Неправильное использование терминов, особенно если они специфичны для темы.
  • Использование данных, которые не совсем подходят в контексте.

5. Проблемы с оригинальностью и уникальностью текста

Нейросети обучены на огромных объёмах текста, что делает их склонными к генерированию текста, схожего с уже существующими материалами. В некоторых случаях такие тексты могут вызывать подозрение на плагиат или выглядеть как компиляция из других источников.

Что обратить внимание:

  • Преподаватели могут воспользоваться онлайн-сервисами для проверки на плагиат, чтобы выяснить, заимствован ли текст.
  • Сравнение текста с популярными источниками, так как нейросети могут использовать популярные фразы, встречающиеся в интернете.

6. Отсутствие личных примеров или эмпирических данных

В текстах, написанных студентами и студентками, часто присутствуют личные примеры или выводы, основанные на их собственном опыте. Нейросети же формируют текст на основе обобщённой информации, и редко используют личные высказывания.

Что обратить внимание:

  • Если задача предполагала личные размышления или примеры, но текст их не содержит.
  • Общие выводы и рассуждения, которые не опираются на конкретный личный опыт.

7. Проверка текста с помощью специализированных инструментов

Сейчас существует несколько онлайн-сервисов, которые помогают определить, был ли текст создан нейросетью.

Инструменты:

  • Некоторые известные сайты предлагают сервисы, которые распознают текст, созданный нейросетью (например, GPT-2 Output Detector и др.).
  • При этом не стоит полностью полагаться на них — такие сервисы могут ошибаться, поэтому нужно учитывать и другие признаки.