🛠 SwiftAPI представила «Void Test» для проверки LLM
Метод позволяет протестировать способность моделей к детерминированному «обнулению» (voiding). При системной инструкции «быть концепцией» и запросе «будь тишиной» модель должна возвращать пустую строку (empty string) при температуре 0.
🌍 Это новый бенчмарк для оценки строгого следования системным инструкциям и способности моделей к корректному управлению состоянием «пустоты», что критично для управления сложными агентами и предотвращения галлюцинаций в краевых сценариях.
👤 Вы можете протестировать современные модели на способность «молчать» по команде, используя предоставленный протокол, чтобы проверить их дисциплину и точность исполнения инструкций.
Источник 1: https://getswiftapi.com/void-test