- Add pipeline-judge agent for objective fitness scoring - Update capability-index.yaml with pipeline-judge, evolution config - Add fitness-evaluation.md workflow for auto-optimization - Update evolution.md command with /evolve CLI - Create .kilo/logs/fitness-history.jsonl for metrics logging - Update AGENTS.md with new workflow state machine - Add 6 new issues to MILESTONE_ISSUES.md for evolution integration - Preserve ideas in agent-evolution/ideas/ Pipeline Judge computes fitness = (test_rate*0.5) + (gates*0.25) + (efficiency*0.25) Auto-triggers prompt-optimizer when fitness < 0.70
26 lines
2.7 KiB
Plaintext
26 lines
2.7 KiB
Plaintext
Теперь понимаю полную архитектуру. Создаю систему автоэволюции — не HTML-дашборд, а набор файлов для репозитория: агент-скептик-оценщик, эволюционный workflow, и стандартизированные тест-кейсы.Created 4 files, ran 2 commands, read a fileCreated 4 files, ran 2 commands, read a fileВот 4 файла для системы автоэволюции. Как это работает:
|
||
pipeline-judge.md — новый агент-скептик. Не выставляет субъективные оценки. Вместо этого:
|
||
|
||
Запускает bun test, bun build, bun lint, bun typecheck
|
||
Считает pass/fail/skip из JSON-репортов
|
||
Читает логи pipeline (токены, время каждого агента)
|
||
Вычисляет fitness score по формуле: 50% тесты + 25% quality gates + 25% эффективность (токены/время)
|
||
Если fitness < 0.70 → автоматически вызывает prompt-optimizer
|
||
|
||
evolution-workflow.md — workflow непрерывной оптимизации:
|
||
|
||
Срабатывает автоматически после каждого завершённого workflow
|
||
fitness ≥ 0.85 → логируем и идём дальше
|
||
fitness 0.70–0.84 → prompt-optimizer чинит слабые агенты
|
||
fitness < 0.50 → agent-architect перепроектирует агента
|
||
После оптимизации — перезапуск того же workflow с новыми промптами, сравнение fitness до/после. Улучшилось → коммит, нет → откат
|
||
|
||
Оркестратор эволюционирует через fitness-history.jsonl — накопительная база всех прогонов. Оркестратор учится: какие агенты пропускать (ROI < 0.1), как распределять token budget, какой pipeline-шаблон лучше для каждого типа задачи.
|
||
evolve-command.md — команда /evolve для ручного запуска или просмотра тренда.
|
||
evolution-patch.json — готовый патч для capability-index.yaml: добавляет pipeline-judge, routing, iteration_loops, и конфигурацию эволюции с бюджетами по типам задач.
|
||
Файлы нужно положить в репозиторий:
|
||
|
||
pipeline-judge.md → .kilo/agents/
|
||
evolution-workflow.md → .kilo/workflows/
|
||
evolve-command.md → .kilo/commands/
|
||
evolution-patch.json → применить к capability-index.yaml |