[Evolution Experiment] GNS-2.1 — Issue Lifecycle Audit & Close-Loop Enforcement #129
Closed
opened 2026-06-06 13:32:29 +00:00 by NW
·
2 comments
Labels
Clear labels
agent::agent-architect
agent::capability-analyst
agent::code-skeptic
agent::evaluator
agent::history-miner
agent::lead-developer
agent::orchestrator
agent::sdet-engineer
agent::system-analyst
agent::the-fixer
budget::exhausted
budget::sufficient
budget::warning
cascade::depth-0
cascade::depth-1
cascade::depth-2
cascade::depth-exceeded
cascade::depth-n
dashboard::frozen
evolution::model-change
evolution::new-agent
evolution::new-skill
evolution::new-workflow
evolution::prompt-opt
memory::checkpoint
memory::fresh
memory::recoverable
memory::stale
permission::evolve-system
permission::read-only
permission::violation
permission::write-code
permission::write-config
phase::awaiting-review
phase::drafting-spec
phase::executing
phase::gathering-evidence
phase::refining-prompt
phase::researching
phase::verifying
priority::critical
priority::high
priority::low
priority::medium
quality::blocked
quality::fail
quality::needs-fix
quality::pass
size::l
size::m
size::s
size::xl
size::xs
status::blocked
status::cancelled
status::done
status::in-progress
status::new
status::planned
status::review
status::testing
type::bug
type::chore
type::documentation
type::enhancement
type::feature
type::refactor
type::test
Owned by agent-architect
Owned by capability-analyst
Owned by code-skeptic
Owned by evaluator
Owned by history-miner
Owned by lead-developer
Owned by orchestrator
Owned by sdet-engineer
Owned by system-analyst
Owned by the-fixer
Token budget exhausted
Token budget sufficient
Token budget low
No subagent calls
1-level subagent calls
2-level subagent calls
Depth limit exceeded
Unlimited subagent calls
Dashboard feature freeze — no new features until thaw
Model change evolution
New agent evolution
New skill evolution
New workflow evolution
Prompt optimization evolution
Checkpoint stored
Checkpoint fresh
Checkpoint recoverable
Checkpoint stale
Can evolve system
Read-only access
Security violation
Can write code
Can write config
Agent awaits review
Agent is drafting specification
Agent is executing task
Agent is gathering data
Agent is refining prompts
Research phase — gathering evidence and solutions
Agent is verifying results
Critical priority
High priority
Low priority
Medium priority
Blocked by quality
Quality check failed
Needs fixes
Quality check passed
Large (4-8 hours)
Medium (2-4 hours)
Small (1-2 hours)
Extra large (>8 hours)
Extra small (<1 hour)
Blocked
Cancelled
Completed
Work in progress
New issue, not started
Planned for sprint
Under review
In testing
Something is broken
Maintenance task
Documentation
Improvement
New feature
Code refactoring
Testing
Milestone
No items
Projects
Clear projects
No project
No Assignees
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: UniqueSoft/APAW#129
Reference in New Issue
Block a user
Blocking a user prevents them from interacting with repositories, such as opening or commenting on pull requests or issues. Learn more about blocking a user.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Описание эксперимента
На основе аудита проекта UniqueSoft/FutureWork выявлены системные проблемы в эволюционном процессе GNS-2, связанные с жизненным циклом ишусов.
Аудит FutureWork — найденные проблемы
Проблема 1: Чекбоксы обновляются в комментариях, а не в теле ишуса
Факты:
Паттерн: Агент пишет результат в комментарий с
[x], но НЕ обновляет тело ишуса (PATCH /issues/{n}сbodyгде[ ] → [x]).Проблема 2: Ишусы не закрываются после выполнения
Факты:
Closes #5 #6, ишус открыт, хотя #5 и #6 уже закрыты9 открытых ишусов, из которых минимум 3-4 фактически выполнены.
Проблема 3: Нет связи коммитов с критериями приёмки
Факты:
Deploy BotсодержатCloses #21и т.д., но нет отображения «какие именно критерии из тела ишуса покрывает этот коммит»Проблема 4: Дублирование статуса через PR
Количественный анализ эффективности промптов
Closes #Prompt Quality Score
Текущий PQ = 0.47 / 1.0 — неудовлетворительно.
Предлагаемые улучшения для GNS-2.1
1. Правило Close-Loop Enforcement
Каждый агент ОБЯЗАН при выходе:
PATCH /repos/{owner}/{repo}/issues/{n}с regex заменой[ ]→[x]state: closed)status::partial2. Commit-Criteria Mapping
Каждый коммит от агента ДОЛЖЕН содержать:
Это позволяет автоматически сопоставлять коммиты с критериями приёмки.
3. Auto-Close Gate
Оркестратор проверяет перед переходом к следующему агенту:
status::in-progressquality::needs-fix4. Prompt Quality Score (PQS) — метрика качества промптов
5. Issue Health Dashboard
Автоматическая проверка каждые 24ч:
status::staleЭксперимент
Фаза 1: Правила (июнь 2026)
issue-close-loop.mdв.kilo/rules/→ created commitff87670close_loopfield added with {issue, checkboxes_total, checkboxes_checked, checkboxes_updated_in_body, issue_closed}evaluatorprompt → Phase 2scripts/issue-health-check.py→ 367 lines, PQS calculation + --fix mode, tested on FutureWorkФаза 2: Реализация (июнь 2026)
lead-developer→ On Exit step 1: Update issue body checkboxesthe-fixerпромпт: обязан обновлять чекбоксы + закрывать ишусclose_loopв GNS-2 checkpoint → Exit Protocol step 9, GNS_EVENT footer fieldФаза 3: Валидация на FutureWork (июль 2026)
Критерии приёмки
issue-close-loop.mdсоздано и принято → .kilo/rules/issue-close-loop.md✅ Фаза 1 завершена — Реализация GNS-2.1 Close-Loop Enforcement
Созданные файлы
.kilo/rules/issue-close-loop.mdscripts/issue-health-check.pyОбновлённые файлы
.kilo/agents/lead-developer.md.kilo/agents/the-fixer.md.kilo/rules/gns-agent-protocol.mdclose_loopв GNS_EVENT.kilo/agents/orchestrator.mdРезультаты тестирования на FutureWork
До внедрения (baseline):
После закрытия 3 осиротевших ишусов (#25, #38, #39):
Цель после внедрения агентов: PQS ≥ 0.85
Закрытые осиротевшие ишусы
fix: admin API tested OK + store.ts deprecation→ закрыт (ссылался на #5, #6 которые уже закрыты)fix: авторизация и регистрация — seed, email, Docker→ закрыт (вся работа выполнена в коммите 1a76867)Dashboard: замена статичных данных на реальные из API и D1→ закрыт (все 6 чекбоксов обновлены после синхронизации из комментариев)Следующие шаги (Фаза 2)
issue-health-check.py --fixкаждые 24ч✅ Issue Auto-Closed
All acceptance criteria met.