Уязвимость в ИИ-рецензентах: манипуляция качеством статей

Исследователи нашли способ завышать оценки научных работ через «состязательную переупаковку» текста без использования скрытых промптов.

Автор Sergey KostenchukОпубликовано 2026-06-15Обновлено 2026-06-15

2026-06-15 Исследования

🤖 Как обмануть ИИ-рецензента без скрытых промптов

Исследователи обнаружили уязвимость под названием Adversarial Repackaging. Она позволяет искусственно завышать оценки научных статей, используя только изменения в подаче и структуре текста (framing), не меняя научной сути. В тестах атака была успешна в 75.1% случаев.

🌍 ИИ-системы рецензирования могут стать объектом оптимизации не за счет качества науки, а за счет манипуляции интерпретативными искажениями моделей. Это создает риск масштабного «гейминга» системы.

👤 Если научные сообщества массово перейдут на ИИ-проверку, реальная ценность открытий может быть размыта «натренированными» на ИИ презентациями, которые выглядят убедительно для алгоритма.

Источник 1: https://arxiv.org/abs/2606.13044

Источники