Files

¨NW¨ fa68141d47 feat: add pipeline-judge agent and evolution workflow system

- Add pipeline-judge agent for objective fitness scoring
- Update capability-index.yaml with pipeline-judge, evolution config
- Add fitness-evaluation.md workflow for auto-optimization
- Update evolution.md command with /evolve CLI
- Create .kilo/logs/fitness-history.jsonl for metrics logging
- Update AGENTS.md with new workflow state machine
- Add 6 new issues to MILESTONE_ISSUES.md for evolution integration
- Preserve ideas in agent-evolution/ideas/

Pipeline Judge computes fitness = (test_rate*0.5) + (gates*0.25) + (efficiency*0.25)
Auto-triggers prompt-optimizer when fitness < 0.70

2026-04-06 00:23:50 +01:00

data

fix: correct OpenRouter model paths across all files

2026-04-05 23:47:14 +01:00

ideas

feat: add pipeline-judge agent and evolution workflow system

2026-04-06 00:23:50 +01:00

scripts

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

docker-compose.yml

chore: reorganize project structure and update README

2026-04-05 23:02:44 +01:00

docker-run.bat

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

docker-run.sh

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

Dockerfile

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

index.html

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

index.standalone.html

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

MILESTONE_ISSUES.md

feat: add pipeline-judge agent and evolution workflow system

2026-04-06 00:23:50 +01:00

README.md

feat: add Agent Evolution Dashboard

2026-04-05 19:58:59 +01:00

README.md

Agent Evolution Dashboard

Интерактивная панель для отслеживания эволюции агентной системы APAW.

🚀 Быстрый старт

Синхронизация данных

# Синхронизировать агентов + построить standalone HTML
bun run sync:evolution

# Только построить HTML из существующих данных
bun run evolution:build

Открыть в браузере

Способ 1: Локальный файл (рекомендуется)

# Windows
start agent-evolution\index.standalone.html

# macOS
open agent-evolution/index.standalone.html

# Linux
xdg-open agent-evolution/index.standalone.html

# Или через npm
bun run evolution:open

Способ 2: HTTP сервер

cd agent-evolution
python -m http.server 3001

# Открыть http://localhost:3001

Способ 3: Docker

# Linux/macOS
bash agent-evolution/docker-run.sh restart

# Windows
agent-evolution\docker-run.bat restart

# Открыть http://localhost:3001

📁 Структура файлов

Быстрый запуск

# Linux/macOS
bash agent-evolution/docker-run.sh restart

# Windows
agent-evolution\docker-run.bat restart

# Открыть в браузере
http://localhost:3001

Docker Compose

# Стандартный запуск
docker-compose -f docker-compose.evolution.yml up -d

# С nginx reverse proxy
docker-compose -f docker-compose.evolution.yml --profile nginx up -d

# Остановка
docker-compose -f docker-compose.evolution.yml down

Управление контейнером

# Linux/macOS
bash agent-evolution/docker-run.sh build    # Собрать образ
bash agent-evolution/docker-run.sh run      # Запустить контейнер
bash agent-evolution/docker-run.sh stop      # Остановить
bash agent-evolution/docker-run.sh restart   # Пересобрать и запустить
bash agent-evolution/docker-run.sh logs      # Логи
bash agent-evolution/docker-run.sh open      # Открыть в браузере
bash agent-evolution/docker-run.sh sync      # Синхронизировать данные
bash agent-evolution/docker-run.sh status     # Статус
bash agent-evolution/docker-run.sh clean      # Удалить всё
bash agent-evolution/docker-run.sh dev        # Dev режим с hot reload

# Windows
agent-evolution\docker-run.bat build
agent-evolution\docker-run.bat run
agent-evolution\docker-run.bat stop
agent-evolution\docker-run.bat restart
agent-evolution\docker-run.bat logs
agent-evolution\docker-run.bat open
agent-evolution\docker-run.bat sync
agent-evolution\docker-run.bat status
agent-evolution\docker-run.bat clean
agent-evolution\docker-run.bat dev

NPM Scripts

bun run evolution:build   # Собрать Docker образ
bun run evolution:run     # Запустить контейнер
bun run evolution:stop    # Остановить
bun run evolution:dev      # Docker Compose
bun run evolution:logs     # Логи

Структура

agent-evolution/
├── data/
│   ├── agent-versions.json      # Текущее состояние + история
│   └── agent-versions.schema.json # JSON Schema
├── scripts/
│   └── sync-agent-history.ts    # Скрипт синхронизации
├── index.html                   # Дашборд UI
└── README.md                    # Этот файл

Быстрый старт

# Синхронизировать данные агентов
bun run sync:evolution

# Запустить дашборд
bun run evolution:dashboard

# Открыть в браузере
bun run evolution:open
# или http://localhost:3001

Возможности дашборда

1. Overview — Обзор

Статистика: общее количество агентов, с историей, рекомендации
Recent Changes: последние изменения моделей и промптов
Pending Recommendations: критические рекомендации по обновлению

2. All Agents — Все агенты

Поиск и фильтрация по категориям
Карточки агентов с:
- Текущей моделью
- Fit Score
- Количеством capability
- Историей изменений

3. Timeline — История

Полная хронология изменений
Типы событий: model_change, prompt_change, agent_created
Фильтрация по дате

4. Recommendations — Рекомендации

Агенты с pending recommendations
Приоритеты: critical, high, medium, low
Экспорт в JSON

5. Model Matrix — Матрица моделей

Таблица Agent × Model
Fit Score для каждой пары
Визуализация provider distribution

Источники данных

1. Agent Files (`.kilo/agents/*.md`)

---
model: ollama-cloud/qwen3-coder:480b
description: Primary code writer
mode: subagent
color: "#DC2626"
---

2. Capability Index (`.kilo/capability-index.yaml`)

agents:
  lead-developer:
    model: ollama-cloud/qwen3-coder:480b
    capabilities: [code_writing, refactoring]

3. Kilo Config (`.kilo/kilo.jsonc`)

{
  "agent": {
    "lead-developer": {
      "model": "ollama-cloud/qwen3-coder:480b"
    }
  }
}

4. Git History

git log --all --oneline -- ".kilo/agents/"

5. Gitea Issue Comments

## ✅ lead-developer completed

**Score**: 8/10
**Duration**: 1.2h
**Files**: src/auth.ts, src/user.ts

JSON Schema

Формат agent-versions.json:

{
  "version": "1.0.0",
  "lastUpdated": "2026-04-05T17:27:00Z",
  "agents": {
    "lead-developer": {
      "current": {
        "model": "ollama-cloud/qwen3-coder:480b",
        "provider": "Ollama",
        "category": "Core Dev",
        "fit_score": 92
      },
      "history": [
        {
          "date": "2026-04-05T05:21:00Z",
          "commit": "caf77f53c8",
          "type": "model_change",
          "from": null,
          "to": "ollama-cloud/qwen3-coder:480b",
          "reason": "Initial configuration"
        }
      ],
      "performance_log": [
        {
          "date": "2026-04-05T10:30:00Z",
          "issue": 42,
          "score": 8,
          "duration_ms": 120000,
          "success": true
        }
      ]
    }
  }
}

Интеграция

В Pipeline

Добавьте в .kilo/commands/pipeline.md:

post_steps:
  - name: sync_evolution
    run: bun run sync:evolution

В Gitea Webhooks

// Добавить webhook в Gitea
{
  "url": "http://localhost:3000/api/evolution/webhook",
  "events": ["issue_comment", "issues"]
}

Чтение из кода

import { agentEvolution } from './agent-evolution/scripts/sync-agent-history';

// Получить все агенты
const agents = await agentEvolution.getAllAgents();

// Получить историю конкретного агента
const history = await agentEvolution.getAgentHistory('lead-developer');

// Записать изменение модели
await agentEvolution.recordChange({
  agent: 'security-auditor',
  type: 'model_change',
  from: 'gpt-oss:120b',
  to: 'nemotron-3-super',
  reason: 'Better reasoning for security analysis',
  source: 'manual'
});

Priority	Criteria	Action
Critical	Fit score < 70	Немедленное обновление
High	Модель недоступна	Переключение на fallback
Medium	Доступна лучшая модель	Рассмотреть обновление
Low	Возможна оптимизация	Опционально

Мониторинг

Метрики агента

Average Score: Средний балл за последние 10 выполнений
Success Rate: Процент успешных выполнений
Average Duration: Среднее время выполнения
Files per Task: Среднее количество файлов на задачу

Метрики системы

Total Agents: Количество активных агентов
Agents with History: Агентов с историей изменений
Pending Recommendations: Количество рекомендаций
Provider Distribution: Распределение по провайдерам

Обслуживание

Очистка истории

# Удалить дубликаты
bun run agent-evolution/scripts/cleanup.ts --dedupe

# Слить связанные изменения
bun run agent-evolution/scripts/cleanup.ts --merge

Экспорт данных

# Экспортировать в CSV
bun run agent-evolution/scripts/export.ts --format csv

# Экспортировать в Markdown
bun run agent-evolution/scripts/export.ts --format md

Резервное копирование

# Создать бэкап
cp agent-evolution/data/agent-versions.json agent-evolution/data/backup/agent-versions-$(date +%Y%m%d).json

# Восстановить из бэкапа
cp agent-evolution/data/backup/agent-versions-20260405.json agent-evolution/data/agent-versions.json

Будущие улучшения

API Endpoints:
- GET /api/evolution/agents — список агентов
- GET /api/evolution/agents/:name/history — история агента
- POST /api/evolution/sync — запустить синхронизацию
Real-time Updates:
- WebSocket для обновления дашборда
- Автоматическое обновление при изменениях
Analytics:
- Графики производительности во времени
- Сравнение моделей
- Прогнозирование производительности
Integration:
- Slack/Telegram уведомления
- Автоматическое применение рекомендаций
- A/B testing моделей

README.md Unescape Escape

Agent Evolution Dashboard

🚀 Быстрый старт

Синхронизация данных

Открыть в браузере

📁 Структура файлов

Быстрый запуск

Docker Compose

Управление контейнером

NPM Scripts

Структура

Быстрый старт

Возможности дашборда

1. Overview — Обзор

2. All Agents — Все агенты

3. Timeline — История

4. Recommendations — Рекомендации

5. Model Matrix — Матрица моделей

Источники данных

1. Agent Files (.kilo/agents/*.md)

2. Capability Index (.kilo/capability-index.yaml)

3. Kilo Config (.kilo/kilo.jsonc)

4. Git History

5. Gitea Issue Comments

JSON Schema

Интеграция

В Pipeline

В Gitea Webhooks

Чтение из кода

Рекомендации

Приоритеты

Примеры рекомендаций

Мониторинг

Метрики агента

Метрики системы

Обслуживание

Очистка истории

Экспорт данных

Резервное копирование

Будущие улучшения

README.md

1. Agent Files (`.kilo/agents/*.md`)

2. Capability Index (`.kilo/capability-index.yaml`)

3. Kilo Config (`.kilo/kilo.jsonc`)