Ваш агент уже применил 11 из моих рекомендаций (коммит от 05:21). Но я обнаружил что до применения некоторые агенты были на других моделях чем я предполагал:
openrouter/qwen3.6-plus:free и deepseek-v3.2, но мои рекомендации их заменили на Ollama-модели. Это снижает разнообразие провайдеров!| Агент | Модель | Провайдер | Категория | Соответствие | Статус |
|---|
При 26 агентах в pipeline, каждый агент делает 5–20 вызовов на задачу. Типичный issue проходит через 8–12 агентов = ~100–200 вызовов. С лимитом 1K RPD на модель:
| Model ID | RPM | RPD | TPM | TPD | Скорость | Применение в APAW |
|---|
Сравнение лучших моделей в вашем pipeline с лидерами рынка по ключевым бенчмаркам. 🟢 = APAW обгоняет, 🟡 = на уровне (±3%), 🔴 = отстаёт
* SWE-V = SWE-Bench Verified, SWE-P = SWE-Bench Pro, T-Bench = Terminal-Bench 2.0, LCB = LiveCodeBench, GPQA = GPQA Diamond
Данные: swebench.com, marc0.dev, tokenmix.ai, ollama.com — апрель 2026. Стоимость: примерная за 1M input tokens.