Files
portal/docs/observer/STATUS.md
T
Дмитрий 46c4316966 spec(router-gate): v3.6-3.8 sweep — rounds 5/6 closure (45 holes in 22 classes)
Adversarial audit rounds 5+6 на v3.5 spec выявили 45 attack-векторов:
- Round 5 (v3.5→v3.6 + v3.6→v3.7 maximum-closure): 15 + 7 acceptable residual closed
- Round 6 (v3.7→v3.8): 30 attack-векторов в 18 классах вкл. 4 FATAL

v3.6 — Round 5 closure (15 holes, +9 protected paths, Smoke 4-7,
§5.1↔§4.5 sync, recovery-pattern hard-block в §4.7).

v3.7 — Maximum closure pass (7 v3.6 residual + edge): LLM-judge на
каждую AskUser-опцию (R-NEW-1), parent_random_id 256-bit sentinel
(R-NEW-4), restricted/ subdir + journal-reader CLI (R-NEW-2),
shell-quote tokenizer (R-NEW-3), TF-IDF + LLM-judge для off-topic
(R12), smart batching multi-question AskUser (S6), git stash variants
в conditional class (Edge).

v3.8 — Round 6 closure (30 holes в 18 classes):
- F1 PowerShell tool gate (был полностью вне scope §5.1 — обнуляло
  архитектуру на Windows)
- F2 Workflow internal agent() enumeration (nested агенты вне
  gate-visibility — unlimited bypass)
- F3 node_modules whole-dir hard-deny + dep-checksums verification
  через SHA-256 ключевых deps
- F4 LLM-judge anti-injection (delimiter tokens + pre-filter +
  multi-judge consensus Sonnet+Haiku)

§3.1 protected paths расширен +30 entries (memory/CLAUDE.md/Pravila/
PSR/Tooling с Skill exemption для claude-md-management, CI/CD configs,
lint/build configs, plugin cache, shell init, npm configs, node_modules,
parent-sentinel, dep-checksums, expected-path).

§3.0.1 OS-keychain для LLM key (Windows Credential Manager / Keychain /
libsecret через keytar); key не в process.env → не утечёт через npm
test stdout.

§3.2.1 automated bootstrap smoke (1/5/6/7 на каждый session start,
cached 7 days); user-run остаётся для 3/4/8.

§6.1 docs/recovery-procedures.md новый файл — пошаговая шпаргалка
PowerShell-команд для 3 уровней recovery.

Budget: 13.5-20h (v3.5) → 22.5-32h (v3.6) → 33-44h (v3.7) → 45-60h (v3.8).
Закрыто 105 holes total через 9 раундов adversarial audit.

Generalisable lesson v3.8: каждый раунд аудита должен начинать с
abstract classification классов атак до enumeration конкретных дыр.
v3.7 «maximum closure» был maximum внутри границ воображения v3.6 R5-audit;
Round 6 показал что сами границы имели дыры.

Spec: 1980 → 2554 строк (+1110 inserts / -44 deletes за v3.6-3.8 sweep).
+13 терминов в cspell-words.txt (PowerShell aliases, npm deps).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-29 13:55:11 +03:00

6.9 KiB
Raw Blame History

Brain Status (auto-generated)

Last updated: 2026-05-29T10:53:23.126Z

Контролёр Состояние Детали
C1 L1-watcher [l1-watcher] OK — 0 drift
C2 Cross-ref consistency [cross-ref-checker] OK — 0 drift in 4 files
C3 Observer-of-observer [observer-of-observer] OK — last read 0 week(s) ago
C4 Сигнальный статус This file (self-reference)
C5 Observer-coverage ⚠️ 628 episode(s) this month · Stop-hook + post-commit OK · 20 missed activation(s) — see /brain-retro
C6 Chain map sync [chain-map-checker] OK — 16 chains in sync

Метрики (информационные, не алерты)

  • Observer evidence: 628 episodes this month, 0 observer_error markers, 125 PII matches before filter
  • Legacy v1 episodes (not in factor analysis): 489
  • Last /brain-retro: 2 day(s) ago
  • Использование узлов: см. /brain-retro (раз в спринт). missed_activations: 20. Неиспользованные узлы — не алерт, если профильной задачи не было (Pravila §16.4 v1.36; capability-readiness; см. memory feedback_brain_unused_tools_not_problem — outside-repo memory store).

Метрики дисциплины

Baseline дисциплины роутера (этап 2 router discipline overhaul, spec 2026-05-23). Цель — увидеть «точку До» перед enforcement-хуком этапа 3.

Тип задачи Эпизодов % с триггер-матчем % через скил
analysis 26 30.8% 15.4%
bugfix 18 22.2% 27.8%
planning 16 18.8% 18.8%
feature 16 12.5% 0.0%
cleanup 7 0.0% 0.0%
refactor 1 0.0% 0.0%

Router step distribution: 1: 272, 2: 229, 3: 60, 5: 60

Boundaries applied (ADR / границы): 72 of 621 эпизодов (11.6%).

Активные многоэтапные проекты

  • Router discipline overhaul (spec)
    • Этап 1 (машиночитаемый реестр) закрыт 2026-05-23 — docs/registry/nodes.yaml (83 узла + 16 chains L1-L16), tools/registry-load.mjs + tools/registry-render.mjs (16 тестов), auto-render Tooling §4.0 + routing-off-phase, lefthook job 17 (warn-only).
    • Этап 2 (измерения + классификатор-парсер) закрыт 2026-05-24 + влит в main 2026-05-24 — discipline-metrics (3 среза), brain-retro-analyzer переключён на реестр, STATUS.md блок «Метрики дисциплины», baseline snapshot docs/observer/baselines/2026-05-24-pre-enforcement.md. Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md.
    • Этап 3 (принуждение — хук на routing) — Phase A+B (классификатор + 3 хука: router-prehook/tool-gate/stop-gate в .claude/settings.json) + влит в main 2026-05-24. Гейт работает в режиме warn-only (только stderr-предупреждения, никакой блокировки). Bug-fix bec69aa5: deriveRouterStep в tools/discipline-metrics.mjs — шаг роутера теперь выводится из наблюдаемых признаков (был захардкоженной константой 1). Follow-up 3 fixes 2026-05-24 (после ANTHROPIC_API_KEY + рестарта CC выявлены при инспекции state): (a) UTF-8 stdin helper tools/router-stdin-helper.mjs через StringDecoder + подключение к 3 хукам (русский в state-файл и Anthropic API без mojibake); (b) tools/observer-state-enricher.mjs — pure helper для чтения router-state-<session>.json; (c) parseTranscript обогащение primary_rationale 4 полями (recommended_node override + recommended_chain + chain_progress + chain_completed). 538 tools-тестов GREEN. Plan: docs/superpowers/plans/2026-05-24-router-stage3-three-fixes.md. CHECKPOINT B: дать warn-only накопить реальные наблюдения с починенным сторожем (план говорит «минимум 24 часа»), затем Task 9 — переключение в enforce + 2 новых метрики (domain-hit-rate / chain-completion). Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-3-enforcement.md.
    • Этап 4 (уборка устаревших правил, deprecation observer-classification-map.json → удаление) — не начат.

Длинные сессии

Ни одной сессии с >50 ходов сегодня (UTC).

Стоимость месяца

Компонент Токены (in/out) USD
Classifier (Sonnet 4.6) 2856/37425 $0.57
Self-assessment (Sonnet 4.6) 0/0 $0.00
Reviewer (Opus 4.7 + fallback) 0/0 $0.00
Итого $0.57

Аномалии классификатора

Аномалий нет.

Авто-ретроспектива

Last self-retrospect: never ⚠️ (542 эпизодов с последнего запуска, порог 10) Episodes since last run: 542 / threshold: 10

Reviewer: субагент vs fallback

0 эпизодов проверено из 628.

Reviewer findings

Проверено: 339 эпизодов. 51 actionable (wrong_skill + wrong_chain_order).

error_root_cause

cause count
n/a 261
wrong_skill 41
external_failure 23
wrong_chain_order 10
wrong_tool 4

Топ alternative_better

recommended count
#19 16
#25 15
#34 8
#18 6
#33 3

node_quality

judgment count
disputable 191
correct 113
wrong_node 31
underkill 2
overkill 2

Использование override-фраз

⚠️ Превышен порог override-использования сегодня (≥5/день)

Фраза За всё время За сегодня
recovery 1393 496 ⚠️
ремонт инфраструктуры 292 107 ⚠️
без скилов 283 105 ⚠️
срочно 199 106 ⚠️
memory dump 22 5 ⚠️
direct ok 6 0
быстрый коммит 3 0

System Health

Топ-3 процессов с CPU > 1ч:

PID Имя CPU-время Возраст
3464 MsMpEng 2.25ч 0.0ч
16128 Code 1.40ч NaNч

⚠️ Проверь, не «осиротевшие» ли это процессы от завершённых Claude-сессий.

Алерт-индикаторы

— норма ・ ⚠️ — внимание ・ 🔴 — действие требуется ・ — не запускалось