Files
portal/docs/observer/STATUS.md
T
Дмитрий 8910ae6cd6 spec(router-gate): v3.8 → v3.9 Round 7 audit closure (13 классов, 3 фундаментальные плоскости)
Round 7 adversarial audit (через superpowers:brainstorming skill) выявил 13 классов
которые 9 предыдущих раундов не покрывали:
- 2 FATAL: F5 Read-leak parent_random_id через Glob+Read (R-NEW-4 обнулён),
  F6 subagent tool_result.content exfil
- 4 CRITICAL: C12 system DNS/config (/etc/hosts/~/.ssh/registry) вне §3.1,
  C13 || true exit-code spoof (per-token vs per-chain),
  C14 subagent state exfil,
  C15 §5.2 multi-language gap (PHP/Ruby/Go test runners)
- 5 SERIOUS: S22 Skill(claude-md-management) exemption backdoor,
  S23 Workflow args parameter payload,
  S24 path-equivalence (Unicode NFC/NFD + Windows 8.3 + hardlinks),
  S25 MCP filesystem/redis write tools classification,
  S26 stop-keywords morphology gaps
- 2 EDGE: E31 gate-error reason disclosure (probing pattern),
  E32 LLM-judge cache cross-session persistence

18 spec edits: header bump + TL;DR + Changes v3.8→v3.9 table + §3.1 system paths
+ parent-sentinel→restricted + §3.4 PostToolUse Task scanner + §3.6.2 normative-content
second-layer gate + §4.5 stop-keywords expanded + §4.7 cache per-session + §5 MCP
classification + §5.1 chain ANY-mutating + PostToolUse rev-parse verify + §5.1.2
PowerShell mirror + §5.2 multi-language scan + §6.3 redacted reason mode + §9 13 closures
+ §10.2 gate-config v3.9 fields + §11 v3.9 history entry.

Spec: 2554 → 2964 строк (+410 lines). Budget: 45-60h (v3.8) → 53-72h (v3.9).
Закрыто 118 holes total через 10 раундов adversarial audit.

cspell-words.txt +18 терминов (exfiltration/exfil/NFD/RCE/syscall/Inodes/PROGRA/
resolv/nsswitch/ics/HKCU/HKLM/fsutil/unstar/mvn/popen/брэйншторм/стопаем).

Generalisable formula R7 (новая): для каждого следующего audit задавать 3 вопроса
до enumeration — какие safe tools/paths/chains дают visibility/leverage; какие
границы scope подразумеваются но не enforce'ятся; где per-token vs per-chain
formulation gap есть в композиции.

§0 cross-refs не меняются — spec-only, не tooling-канон / не ADR / не off-phase
подкатегория.

Methodology: superpowers:brainstorming skill + AskUserQuestion scope choice
(user выбрал «Полное v3.9 closure всех 13»).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-29 14:36:36 +03:00

6.9 KiB
Raw Blame History

Brain Status (auto-generated)

Last updated: 2026-05-29T11:29:46.942Z

Контролёр Состояние Детали
C1 L1-watcher [l1-watcher] OK — 0 drift
C2 Cross-ref consistency [cross-ref-checker] OK — 0 drift in 4 files
C3 Observer-of-observer [observer-of-observer] OK — last read 0 week(s) ago
C4 Сигнальный статус This file (self-reference)
C5 Observer-coverage ⚠️ 638 episode(s) this month · Stop-hook + post-commit OK · 20 missed activation(s) — see /brain-retro
C6 Chain map sync [chain-map-checker] OK — 16 chains in sync

Метрики (информационные, не алерты)

  • Observer evidence: 638 episodes this month, 0 observer_error markers, 130 PII matches before filter
  • Legacy v1 episodes (not in factor analysis): 499
  • Last /brain-retro: 2 day(s) ago
  • Использование узлов: см. /brain-retro (раз в спринт). missed_activations: 20. Неиспользованные узлы — не алерт, если профильной задачи не было (Pravila §16.4 v1.36; capability-readiness; см. memory feedback_brain_unused_tools_not_problem — outside-repo memory store).

Метрики дисциплины

Baseline дисциплины роутера (этап 2 router discipline overhaul, spec 2026-05-23). Цель — увидеть «точку До» перед enforcement-хуком этапа 3.

Тип задачи Эпизодов % с триггер-матчем % через скил
analysis 27 29.6% 14.8%
bugfix 18 22.2% 27.8%
feature 18 11.1% 0.0%
planning 16 18.8% 18.8%
cleanup 7 0.0% 0.0%
refactor 1 0.0% 0.0%

Router step distribution: 1: 277, 2: 232, 3: 60, 5: 61

Boundaries applied (ADR / границы): 73 of 630 эпизодов (11.6%).

Активные многоэтапные проекты

  • Router discipline overhaul (spec)
    • Этап 1 (машиночитаемый реестр) закрыт 2026-05-23 — docs/registry/nodes.yaml (83 узла + 16 chains L1-L16), tools/registry-load.mjs + tools/registry-render.mjs (16 тестов), auto-render Tooling §4.0 + routing-off-phase, lefthook job 17 (warn-only).
    • Этап 2 (измерения + классификатор-парсер) закрыт 2026-05-24 + влит в main 2026-05-24 — discipline-metrics (3 среза), brain-retro-analyzer переключён на реестр, STATUS.md блок «Метрики дисциплины», baseline snapshot docs/observer/baselines/2026-05-24-pre-enforcement.md. Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md.
    • Этап 3 (принуждение — хук на routing) — Phase A+B (классификатор + 3 хука: router-prehook/tool-gate/stop-gate в .claude/settings.json) + влит в main 2026-05-24. Гейт работает в режиме warn-only (только stderr-предупреждения, никакой блокировки). Bug-fix bec69aa5: deriveRouterStep в tools/discipline-metrics.mjs — шаг роутера теперь выводится из наблюдаемых признаков (был захардкоженной константой 1). Follow-up 3 fixes 2026-05-24 (после ANTHROPIC_API_KEY + рестарта CC выявлены при инспекции state): (a) UTF-8 stdin helper tools/router-stdin-helper.mjs через StringDecoder + подключение к 3 хукам (русский в state-файл и Anthropic API без mojibake); (b) tools/observer-state-enricher.mjs — pure helper для чтения router-state-<session>.json; (c) parseTranscript обогащение primary_rationale 4 полями (recommended_node override + recommended_chain + chain_progress + chain_completed). 538 tools-тестов GREEN. Plan: docs/superpowers/plans/2026-05-24-router-stage3-three-fixes.md. CHECKPOINT B: дать warn-only накопить реальные наблюдения с починенным сторожем (план говорит «минимум 24 часа»), затем Task 9 — переключение в enforce + 2 новых метрики (domain-hit-rate / chain-completion). Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-3-enforcement.md.
    • Этап 4 (уборка устаревших правил, deprecation observer-classification-map.json → удаление) — не начат.

Длинные сессии

Ни одной сессии с >50 ходов сегодня (UTC).

Стоимость месяца

Компонент Токены (in/out) USD
Classifier (Sonnet 4.6) 3138/42903 $0.65
Self-assessment (Sonnet 4.6) 0/0 $0.00
Reviewer (Opus 4.7 + fallback) 0/0 $0.00
Итого $0.65

Аномалии классификатора

Аномалий нет.

Авто-ретроспектива

Last self-retrospect: never ⚠️ (542 эпизодов с последнего запуска, порог 10) Episodes since last run: 542 / threshold: 10

Reviewer: субагент vs fallback

0 эпизодов проверено из 638.

Reviewer findings

Проверено: 339 эпизодов. 51 actionable (wrong_skill + wrong_chain_order).

error_root_cause

cause count
n/a 261
wrong_skill 41
external_failure 23
wrong_chain_order 10
wrong_tool 4

Топ alternative_better

recommended count
#19 16
#25 15
#34 8
#18 6
#33 3

node_quality

judgment count
disputable 191
correct 113
wrong_node 31
underkill 2
overkill 2

Использование override-фраз

⚠️ Превышен порог override-использования сегодня (≥5/день)

Фраза За всё время За сегодня
recovery 1416 519 ⚠️
без скилов 333 155 ⚠️
ремонт инфраструктуры 310 125 ⚠️
срочно 219 126 ⚠️
memory dump 36 19 ⚠️
direct ok 6 0
быстрый коммит 3 0

System Health

Топ-3 процессов с CPU > 1ч:

PID Имя CPU-время Возраст
3464 MsMpEng 2.35ч 0.0ч
16128 Code 1.56ч 0.0ч

⚠️ Проверь, не «осиротевшие» ли это процессы от завершённых Claude-сессий.

Алерт-индикаторы

— норма ・ ⚠️ — внимание ・ 🔴 — действие требуется ・ — не запускалось