feat: add pipeline-judge agent and evolution workflow system

- Add pipeline-judge agent for objective fitness scoring
- Update capability-index.yaml with pipeline-judge, evolution config
- Add fitness-evaluation.md workflow for auto-optimization
- Update evolution.md command with /evolve CLI
- Create .kilo/logs/fitness-history.jsonl for metrics logging
- Update AGENTS.md with new workflow state machine
- Add 6 new issues to MILESTONE_ISSUES.md for evolution integration
- Preserve ideas in agent-evolution/ideas/

Pipeline Judge computes fitness = (test_rate*0.5) + (gates*0.25) + (efficiency*0.25)
Auto-triggers prompt-optimizer when fitness < 0.70
This commit is contained in:
¨NW¨
2026-04-06 00:23:50 +01:00
parent 1ab9939c92
commit fa68141d47
12 changed files with 1653 additions and 193 deletions

View File

@@ -0,0 +1,26 @@
Теперь понимаю полную архитектуру. Создаю систему автоэволюции — не HTML-дашборд, а набор файлов для репозитория: агент-скептик-оценщик, эволюционный workflow, и стандартизированные тест-кейсы.Created 4 files, ran 2 commands, read a fileCreated 4 files, ran 2 commands, read a fileВот 4 файла для системы автоэволюции. Как это работает:
pipeline-judge.md — новый агент-скептик. Не выставляет субъективные оценки. Вместо этого:
Запускает bun test, bun build, bun lint, bun typecheck
Считает pass/fail/skip из JSON-репортов
Читает логи pipeline (токены, время каждого агента)
Вычисляет fitness score по формуле: 50% тесты + 25% quality gates + 25% эффективность (токены/время)
Если fitness < 0.70 → автоматически вызывает prompt-optimizer
evolution-workflow.md — workflow непрерывной оптимизации:
Срабатывает автоматически после каждого завершённого workflow
fitness ≥ 0.85 → логируем и идём дальше
fitness 0.700.84 → prompt-optimizer чинит слабые агенты
fitness < 0.50 → agent-architect перепроектирует агента
После оптимизации — перезапуск того же workflow с новыми промптами, сравнение fitness до/после. Улучшилось → коммит, нет → откат
Оркестратор эволюционирует через fitness-history.jsonl — накопительная база всех прогонов. Оркестратор учится: какие агенты пропускать (ROI < 0.1), как распределять token budget, какой pipeline-шаблон лучше для каждого типа задачи.
evolve-command.md — команда /evolve для ручного запуска или просмотра тренда.
evolution-patch.json — готовый патч для capability-index.yaml: добавляет pipeline-judge, routing, iteration_loops, и конфигурацию эволюции с бюджетами по типам задач.
Файлы нужно положить в репозиторий:
pipeline-judge.md → .kilo/agents/
evolution-workflow.md → .kilo/workflows/
evolve-command.md → .kilo/commands/
evolution-patch.json → применить к capability-index.yaml