🤖 Как обмануть ИИ-рецензента без скрытых промптов
Исследователи обнаружили уязвимость под названием Adversarial Repackaging. Она позволяет искусственно завышать оценки научных статей, используя только изменения в подаче и структуре текста (framing), не меняя научной сути. В тестах атака была успешна в 75.1% случаев.
🌍 ИИ-системы рецензирования могут стать объектом оптимизации не за счет качества науки, а за счет манипуляции интерпретативными искажениями моделей. Это создает риск масштабного «гейминга» системы.
👤 Если научные сообщества массово перейдут на ИИ-проверку, реальная ценность открытий может быть размыта «натренированными» на ИИ презентациями, которые выглядят убедительно для алгоритма.
Источник 1: https://arxiv.org/abs/2606.13044
