8910ae6cd6
Round 7 adversarial audit (через superpowers:brainstorming skill) выявил 13 классов которые 9 предыдущих раундов не покрывали: - 2 FATAL: F5 Read-leak parent_random_id через Glob+Read (R-NEW-4 обнулён), F6 subagent tool_result.content exfil - 4 CRITICAL: C12 system DNS/config (/etc/hosts/~/.ssh/registry) вне §3.1, C13 || true exit-code spoof (per-token vs per-chain), C14 subagent state exfil, C15 §5.2 multi-language gap (PHP/Ruby/Go test runners) - 5 SERIOUS: S22 Skill(claude-md-management) exemption backdoor, S23 Workflow args parameter payload, S24 path-equivalence (Unicode NFC/NFD + Windows 8.3 + hardlinks), S25 MCP filesystem/redis write tools classification, S26 stop-keywords morphology gaps - 2 EDGE: E31 gate-error reason disclosure (probing pattern), E32 LLM-judge cache cross-session persistence 18 spec edits: header bump + TL;DR + Changes v3.8→v3.9 table + §3.1 system paths + parent-sentinel→restricted + §3.4 PostToolUse Task scanner + §3.6.2 normative-content second-layer gate + §4.5 stop-keywords expanded + §4.7 cache per-session + §5 MCP classification + §5.1 chain ANY-mutating + PostToolUse rev-parse verify + §5.1.2 PowerShell mirror + §5.2 multi-language scan + §6.3 redacted reason mode + §9 13 closures + §10.2 gate-config v3.9 fields + §11 v3.9 history entry. Spec: 2554 → 2964 строк (+410 lines). Budget: 45-60h (v3.8) → 53-72h (v3.9). Закрыто 118 holes total через 10 раундов adversarial audit. cspell-words.txt +18 терминов (exfiltration/exfil/NFD/RCE/syscall/Inodes/PROGRA/ resolv/nsswitch/ics/HKCU/HKLM/fsutil/unstar/mvn/popen/брэйншторм/стопаем). Generalisable formula R7 (новая): для каждого следующего audit задавать 3 вопроса до enumeration — какие safe tools/paths/chains дают visibility/leverage; какие границы scope подразумеваются но не enforce'ятся; где per-token vs per-chain formulation gap есть в композиции. §0 cross-refs не меняются — spec-only, не tooling-канон / не ADR / не off-phase подкатегория. Methodology: superpowers:brainstorming skill + AskUserQuestion scope choice (user выбрал «Полное v3.9 closure всех 13»). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
134 lines
6.9 KiB
Markdown
134 lines
6.9 KiB
Markdown
# Brain Status (auto-generated)
|
|
|
|
Last updated: 2026-05-29T11:29:46.942Z
|
|
|
|
| Контролёр | Состояние | Детали |
|
|
|---|---|---|
|
|
| C1 L1-watcher | ✅ | [l1-watcher] OK — 0 drift |
|
|
| C2 Cross-ref consistency | ✅ | [cross-ref-checker] OK — 0 drift in 4 files |
|
|
| C3 Observer-of-observer | ✅ | [observer-of-observer] OK — last read 0 week(s) ago |
|
|
| C4 Сигнальный статус | ✅ | This file (self-reference) |
|
|
| C5 Observer-coverage | ⚠️ | 638 episode(s) this month · Stop-hook + post-commit OK · 20 missed activation(s) — see /brain-retro |
|
|
| C6 Chain map sync | ✅ | [chain-map-checker] OK — 16 chains in sync |
|
|
|
|
## Метрики (информационные, не алерты)
|
|
|
|
- Observer evidence: 638 episodes this month, 0 observer_error markers, 130 PII matches before filter
|
|
- Legacy v1 episodes (not in factor analysis): 499
|
|
- Last /brain-retro: 2 day(s) ago
|
|
- Использование узлов: см. `/brain-retro` (раз в спринт). missed_activations: 20. **Неиспользованные узлы — не алерт, если профильной задачи не было** (Pravila §16.4 v1.36; capability-readiness; см. memory `feedback_brain_unused_tools_not_problem` — outside-repo memory store).
|
|
|
|
## Метрики дисциплины
|
|
|
|
Baseline дисциплины роутера (этап 2 router discipline overhaul, spec 2026-05-23). Цель — увидеть «точку До» перед enforcement-хуком этапа 3.
|
|
|
|
| Тип задачи | Эпизодов | % с триггер-матчем | % через скил |
|
|
|---|---|---|---|
|
|
| analysis | 27 | 29.6% | 14.8% |
|
|
| bugfix | 18 | 22.2% | 27.8% |
|
|
| feature | 18 | 11.1% | 0.0% |
|
|
| planning | 16 | 18.8% | 18.8% |
|
|
| cleanup | 7 | 0.0% | 0.0% |
|
|
| refactor | 1 | 0.0% | 0.0% |
|
|
|
|
Router step distribution: 1: 277, 2: 232, 3: 60, 5: 61
|
|
|
|
Boundaries applied (ADR / границы): 73 of 630 эпизодов (11.6%).
|
|
|
|
## Активные многоэтапные проекты
|
|
|
|
- **Router discipline overhaul** ([spec](../superpowers/specs/2026-05-23-router-discipline-overhaul-design.md))
|
|
- Этап 1 (машиночитаемый реестр) ✅ закрыт 2026-05-23 — `docs/registry/nodes.yaml` (83 узла + 16 chains L1-L16), `tools/registry-load.mjs` + `tools/registry-render.mjs` (16 тестов), auto-render Tooling §4.0 + routing-off-phase, lefthook job 17 (warn-only).
|
|
- Этап 2 (измерения + классификатор-парсер) ✅ закрыт 2026-05-24 + влит в main 2026-05-24 — discipline-metrics (3 среза), brain-retro-analyzer переключён на реестр, STATUS.md блок «Метрики дисциплины», baseline snapshot `docs/observer/baselines/2026-05-24-pre-enforcement.md`. Plan: `docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md`.
|
|
- Этап 3 (принуждение — хук на routing) — Phase A+B (классификатор + 3 хука: router-prehook/tool-gate/stop-gate в `.claude/settings.json`) ✅ + влит в main 2026-05-24. Гейт работает в режиме **`warn-only`** (только stderr-предупреждения, никакой блокировки). Bug-fix `bec69aa5`: `deriveRouterStep` в `tools/discipline-metrics.mjs` — шаг роутера теперь выводится из наблюдаемых признаков (был захардкоженной константой 1). **Follow-up 3 fixes 2026-05-24** (после ANTHROPIC_API_KEY + рестарта CC выявлены при инспекции state): (a) UTF-8 stdin helper `tools/router-stdin-helper.mjs` через `StringDecoder` + подключение к 3 хукам (русский в state-файл и Anthropic API без mojibake); (b) `tools/observer-state-enricher.mjs` — pure helper для чтения `router-state-<session>.json`; (c) `parseTranscript` обогащение `primary_rationale` 4 полями (`recommended_node` override + `recommended_chain` + `chain_progress` + `chain_completed`). 538 tools-тестов GREEN. Plan: `docs/superpowers/plans/2026-05-24-router-stage3-three-fixes.md`. CHECKPOINT B: дать warn-only накопить реальные наблюдения с **починенным** сторожем (план говорит «минимум 24 часа»), затем Task 9 — переключение в `enforce` + 2 новых метрики (domain-hit-rate / chain-completion). Plan: `docs/superpowers/plans/2026-05-24-router-overhaul-stage-3-enforcement.md`.
|
|
- Этап 4 (уборка устаревших правил, deprecation `observer-classification-map.json` → удаление) — не начат.
|
|
|
|
## Длинные сессии
|
|
|
|
Ни одной сессии с >50 ходов сегодня (UTC). ✅
|
|
|
|
## Стоимость месяца
|
|
|
|
| Компонент | Токены (in/out) | USD |
|
|
|---|---|---|
|
|
| Classifier (Sonnet 4.6) | 3138/42903 | $0.65 |
|
|
| Self-assessment (Sonnet 4.6) | 0/0 | $0.00 |
|
|
| Reviewer (Opus 4.7 + fallback) | 0/0 | $0.00 |
|
|
| **Итого** | | **$0.65** |
|
|
|
|
## Аномалии классификатора
|
|
|
|
Аномалий нет.
|
|
|
|
## Авто-ретроспектива
|
|
|
|
Last self-retrospect: never ⚠️ (542 эпизодов с последнего запуска, порог 10)
|
|
Episodes since last run: 542 / threshold: 10
|
|
|
|
## Reviewer: субагент vs fallback
|
|
|
|
0 эпизодов проверено из 638.
|
|
|
|
## Reviewer findings
|
|
|
|
Проверено: 339 эпизодов. **51 actionable** (wrong_skill + wrong_chain_order).
|
|
|
|
### error_root_cause
|
|
|
|
| cause | count |
|
|
|---|---:|
|
|
| n/a | 261 |
|
|
| wrong_skill | 41 |
|
|
| external_failure | 23 |
|
|
| wrong_chain_order | 10 |
|
|
| wrong_tool | 4 |
|
|
|
|
### Топ alternative_better
|
|
|
|
| recommended | count |
|
|
|---|---:|
|
|
| #19 | 16 |
|
|
| #25 | 15 |
|
|
| #34 | 8 |
|
|
| #18 | 6 |
|
|
| #33 | 3 |
|
|
|
|
### node_quality
|
|
|
|
| judgment | count |
|
|
|---|---:|
|
|
| disputable | 191 |
|
|
| correct | 113 |
|
|
| wrong_node | 31 |
|
|
| underkill | 2 |
|
|
| overkill | 2 |
|
|
|
|
## Использование override-фраз
|
|
|
|
⚠️ Превышен порог override-использования сегодня (≥5/день)
|
|
|
|
| Фраза | За всё время | За сегодня |
|
|
|---|---|---|
|
|
| `recovery` | 1416 | 519 ⚠️ |
|
|
| `без скилов` | 333 | 155 ⚠️ |
|
|
| `ремонт инфраструктуры` | 310 | 125 ⚠️ |
|
|
| `срочно` | 219 | 126 ⚠️ |
|
|
| `memory dump` | 36 | 19 ⚠️ |
|
|
| `direct ok` | 6 | 0 |
|
|
| `быстрый коммит` | 3 | 0 |
|
|
|
|
## System Health
|
|
|
|
Топ-3 процессов с CPU > 1ч:
|
|
|
|
| PID | Имя | CPU-время | Возраст |
|
|
|---|---|---|---|
|
|
| 3464 | MsMpEng | 2.35ч | 0.0ч |
|
|
| 16128 | Code | 1.56ч | 0.0ч |
|
|
|
|
⚠️ Проверь, не «осиротевшие» ли это процессы от завершённых Claude-сессий.
|
|
|
|
## Алерт-индикаторы
|
|
|
|
✅ — норма ・ ⚠️ — внимание ・ 🔴 — действие требуется ・ ⚪ — не запускалось
|