Files

T

Дмитрий 8910ae6cd6 spec(router-gate): v3.8 → v3.9 Round 7 audit closure (13 классов, 3 фундаментальные плоскости)

Round 7 adversarial audit (через superpowers:brainstorming skill) выявил 13 классов
которые 9 предыдущих раундов не покрывали:
- 2 FATAL: F5 Read-leak parent_random_id через Glob+Read (R-NEW-4 обнулён),
  F6 subagent tool_result.content exfil
- 4 CRITICAL: C12 system DNS/config (/etc/hosts/~/.ssh/registry) вне §3.1,
  C13 || true exit-code spoof (per-token vs per-chain),
  C14 subagent state exfil,
  C15 §5.2 multi-language gap (PHP/Ruby/Go test runners)
- 5 SERIOUS: S22 Skill(claude-md-management) exemption backdoor,
  S23 Workflow args parameter payload,
  S24 path-equivalence (Unicode NFC/NFD + Windows 8.3 + hardlinks),
  S25 MCP filesystem/redis write tools classification,
  S26 stop-keywords morphology gaps
- 2 EDGE: E31 gate-error reason disclosure (probing pattern),
  E32 LLM-judge cache cross-session persistence

18 spec edits: header bump + TL;DR + Changes v3.8→v3.9 table + §3.1 system paths
+ parent-sentinel→restricted + §3.4 PostToolUse Task scanner + §3.6.2 normative-content
second-layer gate + §4.5 stop-keywords expanded + §4.7 cache per-session + §5 MCP
classification + §5.1 chain ANY-mutating + PostToolUse rev-parse verify + §5.1.2
PowerShell mirror + §5.2 multi-language scan + §6.3 redacted reason mode + §9 13 closures
+ §10.2 gate-config v3.9 fields + §11 v3.9 history entry.

Spec: 2554 → 2964 строк (+410 lines). Budget: 45-60h (v3.8) → 53-72h (v3.9).
Закрыто 118 holes total через 10 раундов adversarial audit.

cspell-words.txt +18 терминов (exfiltration/exfil/NFD/RCE/syscall/Inodes/PROGRA/
resolv/nsswitch/ics/HKCU/HKLM/fsutil/unstar/mvn/popen/брэйншторм/стопаем).

Generalisable formula R7 (новая): для каждого следующего audit задавать 3 вопроса
до enumeration — какие safe tools/paths/chains дают visibility/leverage; какие
границы scope подразумеваются но не enforce'ятся; где per-token vs per-chain
formulation gap есть в композиции.

§0 cross-refs не меняются — spec-only, не tooling-канон / не ADR / не off-phase
подкатегория.

Methodology: superpowers:brainstorming skill + AskUserQuestion scope choice
(user выбрал «Полное v3.9 closure всех 13»).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-29 14:36:36 +03:00

6.9 KiB

Raw Blame History

Brain Status (auto-generated)

Last updated: 2026-05-29T11:29:46.942Z

Контролёр	Состояние	Детали
C1 L1-watcher	✅	[l1-watcher] OK — 0 drift
C2 Cross-ref consistency	✅	[cross-ref-checker] OK — 0 drift in 4 files
C3 Observer-of-observer	✅	[observer-of-observer] OK — last read 0 week(s) ago
C4 Сигнальный статус	✅	This file (self-reference)
C5 Observer-coverage	⚠️	638 episode(s) this month · Stop-hook + post-commit OK · 20 missed activation(s) — see /brain-retro
C6 Chain map sync	✅	[chain-map-checker] OK — 16 chains in sync

Метрики (информационные, не алерты)

Observer evidence: 638 episodes this month, 0 observer_error markers, 130 PII matches before filter
Legacy v1 episodes (not in factor analysis): 499
Last /brain-retro: 2 day(s) ago
Использование узлов: см. /brain-retro (раз в спринт). missed_activations: 20. Неиспользованные узлы — не алерт, если профильной задачи не было (Pravila §16.4 v1.36; capability-readiness; см. memory feedback_brain_unused_tools_not_problem — outside-repo memory store).

Метрики дисциплины

Baseline дисциплины роутера (этап 2 router discipline overhaul, spec 2026-05-23). Цель — увидеть «точку До» перед enforcement-хуком этапа 3.

Тип задачи	Эпизодов	% с триггер-матчем	% через скил
analysis	27	29.6%	14.8%
bugfix	18	22.2%	27.8%
feature	18	11.1%	0.0%
planning	16	18.8%	18.8%
cleanup	7	0.0%	0.0%
refactor	1	0.0%	0.0%

Router step distribution: 1: 277, 2: 232, 3: 60, 5: 61

Boundaries applied (ADR / границы): 73 of 630 эпизодов (11.6%).

Активные многоэтапные проекты

Router discipline overhaul (spec)
- Этап 1 (машиночитаемый реестр) ✅ закрыт 2026-05-23 — docs/registry/nodes.yaml (83 узла + 16 chains L1-L16), tools/registry-load.mjs + tools/registry-render.mjs (16 тестов), auto-render Tooling §4.0 + routing-off-phase, lefthook job 17 (warn-only).
- Этап 2 (измерения + классификатор-парсер) ✅ закрыт 2026-05-24 + влит в main 2026-05-24 — discipline-metrics (3 среза), brain-retro-analyzer переключён на реестр, STATUS.md блок «Метрики дисциплины», baseline snapshot docs/observer/baselines/2026-05-24-pre-enforcement.md. Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md.
- Этап 3 (принуждение — хук на routing) — Phase A+B (классификатор + 3 хука: router-prehook/tool-gate/stop-gate в .claude/settings.json) ✅ + влит в main 2026-05-24. Гейт работает в режиме warn-only (только stderr-предупреждения, никакой блокировки). Bug-fix bec69aa5: deriveRouterStep в tools/discipline-metrics.mjs — шаг роутера теперь выводится из наблюдаемых признаков (был захардкоженной константой 1). Follow-up 3 fixes 2026-05-24 (после ANTHROPIC_API_KEY + рестарта CC выявлены при инспекции state): (a) UTF-8 stdin helper tools/router-stdin-helper.mjs через StringDecoder + подключение к 3 хукам (русский в state-файл и Anthropic API без mojibake); (b) tools/observer-state-enricher.mjs — pure helper для чтения router-state-<session>.json; (c) parseTranscript обогащение primary_rationale 4 полями (recommended_node override + recommended_chain + chain_progress + chain_completed). 538 tools-тестов GREEN. Plan: docs/superpowers/plans/2026-05-24-router-stage3-three-fixes.md. CHECKPOINT B: дать warn-only накопить реальные наблюдения с починенным сторожем (план говорит «минимум 24 часа»), затем Task 9 — переключение в enforce + 2 новых метрики (domain-hit-rate / chain-completion). Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-3-enforcement.md.
- Этап 4 (уборка устаревших правил, deprecation observer-classification-map.json → удаление) — не начат.

Длинные сессии

Ни одной сессии с >50 ходов сегодня (UTC). ✅

Стоимость месяца

Компонент	Токены (in/out)	USD
Classifier (Sonnet 4.6)	3138/42903	$0.65
Self-assessment (Sonnet 4.6)	0/0	$0.00
Reviewer (Opus 4.7 + fallback)	0/0	$0.00
Итого		$0.65

Аномалии классификатора

Аномалий нет.

Авто-ретроспектива

Last self-retrospect: never ⚠️ (542 эпизодов с последнего запуска, порог 10) Episodes since last run: 542 / threshold: 10

Reviewer: субагент vs fallback

0 эпизодов проверено из 638.

Reviewer findings

Проверено: 339 эпизодов. 51 actionable (wrong_skill + wrong_chain_order).

error_root_cause

cause	count
n/a	261
wrong_skill	41
external_failure	23
wrong_chain_order	10
wrong_tool	4

Топ alternative_better

recommended	count
#19	16
#25	15
#34	8
#18	6
#33	3

node_quality

judgment	count
disputable	191
correct	113
wrong_node	31
underkill	2
overkill	2

Использование override-фраз

⚠️ Превышен порог override-использования сегодня (≥5/день)

Фраза	За всё время	За сегодня
`recovery`	1416	519 ⚠️
`без скилов`	333	155 ⚠️
`ремонт инфраструктуры`	310	125 ⚠️
`срочно`	219	126 ⚠️
`memory dump`	36	19 ⚠️
`direct ok`	6	0
`быстрый коммит`	3	0

System Health

Топ-3 процессов с CPU > 1ч:

PID	Имя	CPU-время	Возраст
3464	MsMpEng	2.35ч	0.0ч
16128	Code	1.56ч	0.0ч

⚠️ Проверь, не «осиротевшие» ли это процессы от завершённых Claude-сессий.

Алерт-индикаторы

✅ — норма ・ ⚠️ — внимание ・ 🔴 — действие требуется ・ ⚪ — не запускалось

6.9 KiB Raw Blame History Unescape Escape