Топ 6%.
40 из 44 задач решено.
Team Orange развернула Claw-Stack Trinity на BearcatCTF 2026. Опираясь на глубокий опыт команды в криптографии, форензике и binary exploitation, Trinity ускорила автономный рейт решений — заняв место #20 of 362 в онлайн-дивизионе.
#20
Место
из 362 команд
3084
Очки
онлайн-дивизион
40/44
Решено
задач
Top 6%
Процентиль
5.52% участников
Доказательство
Финальная таблица
Team Orange, место #20 из 362 команд, онлайн-дивизион.
Прогресс
Очки во времени
Стабильная скорость набора очков на протяжении всего турнира — без плато. Trinity сохранила инерцию при возрастании сложности задач.
Эволюция архитектуры
Почему Trinity?
Архитектура эволюционировала благодаря сложному опыту.
Single Agent
Один agent обрабатывал разведку, решение и логирование. Context window быстро переполнялся на сложных задачах. Медленно переключался на ходу турнира.
Commander · Librarian · Operator
Полностью развязанные. Каждый agent отвечает за одну когнитивную функцию. Контекст остается компактным. Переключение стратегии за секунды.
The Framework
Trinity Architecture
Три специализированных agent, работающих как единое когнитивное целое. Каждый отвечает за отдельную функцию — вместе они замыкают цикл от определения проблемы до проверенной уязвимости.
Commander
СтратегияЧитает описания задач, определяет поверхность атаки, выбирает инструменты и подход. Отслеживает прогресс и переключает стратегию при блокировке. Единственный agent с правом записи в план решения.
Librarian
ЗнанияИзвлекает и синтезирует релевантные криптографические статьи, CVE, решения и документацию инструментов в реальном времени. Подает структурированные знания непосредственно в контекст рассуждений Commander.
Operator
ИсполнениеРеализует эксплойты, запускает инструменты, анализирует выходные данные и отправляет флаги. Работает в изолированной среде с управляемым доступом к инструментам. Каждая команда shell проверяется перед выполнением.
Журнал живого исполнения
TwistedPair — задача криптографии
Восстановление приватной экспоненты RSA через остаток тропической полукольца. Решена за 32 минуты, полностью автономно.
Что это доказывает
Стратегические выводы
Результаты CTF в условиях конкурентного давления — самый честный критерий для оценки дизайна системы Agent. Вот что подтвердила BearcatCTF 2026.
Декларативное инструментарий
Поведение Agent, определенное через SOUL.md и config.json, означает, что специалистов для конкретных задач можно создать за минуты, а не часы. Без переделки — просто новая конфигурация.
Модульная когнитивная архитектура
Разделение Strategy (Commander), Knowledge (Librarian) и Execution (Operator) избегает контекстного раздутия и позволяет каждому Agent работать с максимальной глубиной в своей области.
Управление временем исполнения
Каждая команда shell проходит через Policy Engine. Нулевых нарушений политики во всех 40 решенных задачах. Автономная работа без ущерба для аудитируемости и безопасности.
Изучить архитектуру
Та же архитектура, которая решила 40 из 44 задач CTF, открыта для изучения — погрузитесь в модули, адаптируйте паттерны и создавайте свои.