APAW/docker/evolution-test/run-local-test.bat

@echo off
REM Evolution Test Runner (Local Fallback)
REM Runs pipeline-judge tests without Docker - less precise but works immediately

setlocal enabledelayedexpansion

echo === Evolution Test Runner (Local) ===
echo.

REM Check bun
where bun >nul 2>&1
if %errorlevel% neq 0 (
    echo Error: bun not found
    echo Install bun first from https://bun.sh
    exit /b 1
)

REM Get workflow type
set WORKFLOW=%1
if "%WORKFLOW%"=="" set WORKFLOW=feature

echo Running evolution test for: %WORKFLOW%
echo.

REM Set budget based on workflow
if "%WORKFLOW%"=="feature" (
    set TOKEN_BUDGET=50000
    set TIME_BUDGET=300
    set MIN_COVERAGE=80
) else if "%WORKFLOW%"=="bugfix" (
    set TOKEN_BUDGET=20000
    set TIME_BUDGET=120
    set MIN_COVERAGE=90
) else if "%WORKFLOW%"=="refactor" (
    set TOKEN_BUDGET=40000
    set TIME_BUDGET=240
    set MIN_COVERAGE=95
) else if "%WORKFLOW%"=="security" (
    set TOKEN_BUDGET=30000
    set TIME_BUDGET=180
    set MIN_COVERAGE=80
) else if "%WORKFLOW%"=="all" (
    echo Running all workflows sequentially...
    call %0 feature
    call %0 bugfix
    call %0 refactor
    call %0 security
    exit /b 0
) else (
    echo Unknown workflow: %WORKFLOW%
    echo Usage: %0 [feature^|bugfix^|refactor^|security^|all]
    exit /b 1
)

echo Token Budget: %TOKEN_BUDGET%
echo Time Budget: %TIME_BUDGET%s
echo Min Coverage: %MIN_COVERAGE%%%
echo.

REM Create logs directory
if not exist .kilo\logs mkdir .kilo\logs

REM Run tests with timing
echo Running tests...
powershell -Command "$start = Get-Date; bun test --reporter=json --coverage 2>&1 | Tee-Object -FilePath C:\tmp\test-results.json; $end = Get-Date; $ms = ($end - $start).TotalMilliseconds; Write-Host ('Time: {0}ms' -f [math]::Round($ms, 2))"
set TIME_MS=%errorlevel%

echo.
echo === Test Results ===

REM Parse results using PowerShell
for /f %%i in ('powershell -Command "(Get-Content C:\tmp\test-results.json | ConvertFrom-Json).numTotalTests" 2^>nul') do set TOTAL=%%i
for /f %%i in ('powershell -Command "(Get-Content C:\tmp\test-results.json | ConvertFrom-Json).numPassedTests" 2^>nul') do set PASSED=%%i
for /f %%i in ('powershell -Command "(Get-Content C:\tmp\test-results.json | ConvertFrom-Json).numFailedTests" 2^>nul') do set FAILED=%%i

if "%TOTAL%"=="" set TOTAL=0
if "%PASSED%"=="" set PASSED=0
if "%FAILED%"=="" set FAILED=0

echo Tests: %PASSED%/%TOTAL% passed

REM Quality gates
echo.
echo === Quality Gates ===

set GATES_PASSED=0
set TOTAL_GATES=5

REM Gate 1: Build
bun run build >nul 2>&1
if %errorlevel% equ 0 (
    echo [PASS] Build
    set /a GATES_PASSED+=1
) else (
    echo [FAIL] Build
)

REM Gate 2: Lint (don't penalize missing config)
bun run lint >nul 2>&1
if %errorlevel% equ 0 (
    echo [PASS] Lint
    set /a GATES_PASSED+=1
) else (
    echo [SKIP] Lint (no config)
    set /a GATES_PASSED+=1
)

REM Gate 3: Typecheck
bun run typecheck >nul 2>&1
if %errorlevel% equ 0 (
    echo [PASS] Types
    set /a GATES_PASSED+=1
) else (
    echo [FAIL] Types
)

REM Gate 4: Tests clean
if "%FAILED%"=="0" (
    echo [PASS] Tests Clean
    set /a GATES_PASSED+=1
) else (
    echo [FAIL] Tests Clean (%FAILED% failures^)
)

REM Gate 5: Coverage
echo [INFO] Coverage check skipped in local mode
set /a GATES_PASSED+=1

echo.
echo === Fitness Score ===

REM Calculate fitness using PowerShell
powershell -Command ^
    "$passed = %PASSED%; $total = %TOTAL%; $gates = %GATES_PASSED%; $gatesTotal = %TOTAL_GATES%; $time = %TIME_MS%; $budget = %TOKEN_BUDGET%; " ^
    "$testRate = $total -gt 0 ? $passed / $total : 0; $gatesRate = $gates / $gatesTotal; " ^
    "$normCost = ($total * 10 / $budget * 0.5) + ($time / 1000 / %TIME_BUDGET% * 0.5); $efficiency = 1 - [math]::Min($normCost, 1); " ^
    "$fitness = ($testRate * 0.50) + ($gatesRate * 0.25) + ($efficiency * 0.25); " ^
    "Write-Host ('| Metric | Value | Weight | Contribution |'); " ^
    "Write-Host ('|--------|-------|--------|--------------|'); " ^
    "Write-Host ('| Tests  | ' + [math]::Round($testRate * 100, 2) + '%% | 50%% | ' + [math]::Round($testRate * 0.50, 2) + ' |'); " ^
    "Write-Host ('| Gates  | ' + $gates + '/' + $gatesTotal + ' | 25%% | ' + [math]::Round($gatesRate * 0.25, 2) + ' |'); " ^
    "Write-Host ('| Efficiency | ' + $time + 'ms | 25%% | ' + [math]::Round($efficiency * 0.25, 2) + ' |'); " ^
    "Write-Host (''); " ^
    "Write-Host ('Fitness Score: ' + [math]::Round($fitness, 2)); " ^
    "$verdict = $fitness -ge 0.85 ? 'PASS' : ($fitness -ge 0.70 ? 'MARGINAL' : 'FAIL'); Write-Host ('Verdict: ' + $verdict)"

REM Log to fitness-history.jsonl
for /f "tokens=*" %%a in ('powershell -Command "Get-Date -AsUTC -Format 'yyyy-MM-ddTHH:mm:ssZ'"') do set TIMESTAMP=%%a

echo {"ts":"%TIMESTAMP%","workflow":"%WORKFLOW%","fitness":%FITNESS%,"tests_passed":%PASSED%,"tests_total":%TOTAL%,"verdict":"%VERDICT%"} >> .kilo\logs\fitness-history.jsonl
echo.
echo Logged to .kilo/logs/fitness-history.jsonl

echo.
echo === Summary ===
echo Workflow: %WORKFLOW%
echo Tests: %PASSED%/%TOTAL% passed
echo Quality Gates: %GATES_PASSED%/%TOTAL_GATES%
echo Fitness: %FITNESS% (%VERDICT%)
echo.

exit /b