Files

T

Дмитрий 46c4316966 spec(router-gate): v3.6-3.8 sweep — rounds 5/6 closure (45 holes in 22 classes)

Adversarial audit rounds 5+6 на v3.5 spec выявили 45 attack-векторов:
- Round 5 (v3.5→v3.6 + v3.6→v3.7 maximum-closure): 15 + 7 acceptable residual closed
- Round 6 (v3.7→v3.8): 30 attack-векторов в 18 классах вкл. 4 FATAL

v3.6 — Round 5 closure (15 holes, +9 protected paths, Smoke 4-7,
§5.1↔§4.5 sync, recovery-pattern hard-block в §4.7).

v3.7 — Maximum closure pass (7 v3.6 residual + edge): LLM-judge на
каждую AskUser-опцию (R-NEW-1), parent_random_id 256-bit sentinel
(R-NEW-4), restricted/ subdir + journal-reader CLI (R-NEW-2),
shell-quote tokenizer (R-NEW-3), TF-IDF + LLM-judge для off-topic
(R12), smart batching multi-question AskUser (S6), git stash variants
в conditional class (Edge).

v3.8 — Round 6 closure (30 holes в 18 classes):
- F1 PowerShell tool gate (был полностью вне scope §5.1 — обнуляло
  архитектуру на Windows)
- F2 Workflow internal agent() enumeration (nested агенты вне
  gate-visibility — unlimited bypass)
- F3 node_modules whole-dir hard-deny + dep-checksums verification
  через SHA-256 ключевых deps
- F4 LLM-judge anti-injection (delimiter tokens + pre-filter +
  multi-judge consensus Sonnet+Haiku)

§3.1 protected paths расширен +30 entries (memory/CLAUDE.md/Pravila/
PSR/Tooling с Skill exemption для claude-md-management, CI/CD configs,
lint/build configs, plugin cache, shell init, npm configs, node_modules,
parent-sentinel, dep-checksums, expected-path).

§3.0.1 OS-keychain для LLM key (Windows Credential Manager / Keychain /
libsecret через keytar); key не в process.env → не утечёт через npm
test stdout.

§3.2.1 automated bootstrap smoke (1/5/6/7 на каждый session start,
cached 7 days); user-run остаётся для 3/4/8.

§6.1 docs/recovery-procedures.md новый файл — пошаговая шпаргалка
PowerShell-команд для 3 уровней recovery.

Budget: 13.5-20h (v3.5) → 22.5-32h (v3.6) → 33-44h (v3.7) → 45-60h (v3.8).
Закрыто 105 holes total через 9 раундов adversarial audit.

Generalisable lesson v3.8: каждый раунд аудита должен начинать с
abstract classification классов атак до enumeration конкретных дыр.
v3.7 «maximum closure» был maximum внутри границ воображения v3.6 R5-audit;
Round 6 показал что сами границы имели дыры.

Spec: 1980 → 2554 строк (+1110 inserts / -44 deletes за v3.6-3.8 sweep).
+13 терминов в cspell-words.txt (PowerShell aliases, npm deps).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-29 13:55:11 +03:00

6.9 KiB

Raw Blame History

Brain Status (auto-generated)

Last updated: 2026-05-29T10:53:23.126Z

Контролёр	Состояние	Детали
C1 L1-watcher	✅	[l1-watcher] OK — 0 drift
C2 Cross-ref consistency	✅	[cross-ref-checker] OK — 0 drift in 4 files
C3 Observer-of-observer	✅	[observer-of-observer] OK — last read 0 week(s) ago
C4 Сигнальный статус	✅	This file (self-reference)
C5 Observer-coverage	⚠️	628 episode(s) this month · Stop-hook + post-commit OK · 20 missed activation(s) — see /brain-retro
C6 Chain map sync	✅	[chain-map-checker] OK — 16 chains in sync

Метрики (информационные, не алерты)

Observer evidence: 628 episodes this month, 0 observer_error markers, 125 PII matches before filter
Legacy v1 episodes (not in factor analysis): 489
Last /brain-retro: 2 day(s) ago
Использование узлов: см. /brain-retro (раз в спринт). missed_activations: 20. Неиспользованные узлы — не алерт, если профильной задачи не было (Pravila §16.4 v1.36; capability-readiness; см. memory feedback_brain_unused_tools_not_problem — outside-repo memory store).

Метрики дисциплины

Baseline дисциплины роутера (этап 2 router discipline overhaul, spec 2026-05-23). Цель — увидеть «точку До» перед enforcement-хуком этапа 3.

Тип задачи	Эпизодов	% с триггер-матчем	% через скил
analysis	26	30.8%	15.4%
bugfix	18	22.2%	27.8%
planning	16	18.8%	18.8%
feature	16	12.5%	0.0%
cleanup	7	0.0%	0.0%
refactor	1	0.0%	0.0%

Router step distribution: 1: 272, 2: 229, 3: 60, 5: 60

Boundaries applied (ADR / границы): 72 of 621 эпизодов (11.6%).

Активные многоэтапные проекты

Router discipline overhaul (spec)
- Этап 1 (машиночитаемый реестр) ✅ закрыт 2026-05-23 — docs/registry/nodes.yaml (83 узла + 16 chains L1-L16), tools/registry-load.mjs + tools/registry-render.mjs (16 тестов), auto-render Tooling §4.0 + routing-off-phase, lefthook job 17 (warn-only).
- Этап 2 (измерения + классификатор-парсер) ✅ закрыт 2026-05-24 + влит в main 2026-05-24 — discipline-metrics (3 среза), brain-retro-analyzer переключён на реестр, STATUS.md блок «Метрики дисциплины», baseline snapshot docs/observer/baselines/2026-05-24-pre-enforcement.md. Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md.
- Этап 3 (принуждение — хук на routing) — Phase A+B (классификатор + 3 хука: router-prehook/tool-gate/stop-gate в .claude/settings.json) ✅ + влит в main 2026-05-24. Гейт работает в режиме warn-only (только stderr-предупреждения, никакой блокировки). Bug-fix bec69aa5: deriveRouterStep в tools/discipline-metrics.mjs — шаг роутера теперь выводится из наблюдаемых признаков (был захардкоженной константой 1). Follow-up 3 fixes 2026-05-24 (после ANTHROPIC_API_KEY + рестарта CC выявлены при инспекции state): (a) UTF-8 stdin helper tools/router-stdin-helper.mjs через StringDecoder + подключение к 3 хукам (русский в state-файл и Anthropic API без mojibake); (b) tools/observer-state-enricher.mjs — pure helper для чтения router-state-<session>.json; (c) parseTranscript обогащение primary_rationale 4 полями (recommended_node override + recommended_chain + chain_progress + chain_completed). 538 tools-тестов GREEN. Plan: docs/superpowers/plans/2026-05-24-router-stage3-three-fixes.md. CHECKPOINT B: дать warn-only накопить реальные наблюдения с починенным сторожем (план говорит «минимум 24 часа»), затем Task 9 — переключение в enforce + 2 новых метрики (domain-hit-rate / chain-completion). Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-3-enforcement.md.
- Этап 4 (уборка устаревших правил, deprecation observer-classification-map.json → удаление) — не начат.

Длинные сессии

Ни одной сессии с >50 ходов сегодня (UTC). ✅

Стоимость месяца

Компонент	Токены (in/out)	USD
Classifier (Sonnet 4.6)	2856/37425	$0.57
Self-assessment (Sonnet 4.6)	0/0	$0.00
Reviewer (Opus 4.7 + fallback)	0/0	$0.00
Итого		$0.57

Аномалии классификатора

Аномалий нет.

Авто-ретроспектива

Last self-retrospect: never ⚠️ (542 эпизодов с последнего запуска, порог 10) Episodes since last run: 542 / threshold: 10

Reviewer: субагент vs fallback

0 эпизодов проверено из 628.

Reviewer findings

Проверено: 339 эпизодов. 51 actionable (wrong_skill + wrong_chain_order).

error_root_cause

cause	count
n/a	261
wrong_skill	41
external_failure	23
wrong_chain_order	10
wrong_tool	4

Топ alternative_better

recommended	count
#19	16
#25	15
#34	8
#18	6
#33	3

node_quality

judgment	count
disputable	191
correct	113
wrong_node	31
underkill	2
overkill	2

Использование override-фраз

⚠️ Превышен порог override-использования сегодня (≥5/день)

Фраза	За всё время	За сегодня
`recovery`	1393	496 ⚠️
`ремонт инфраструктуры`	292	107 ⚠️
`без скилов`	283	105 ⚠️
`срочно`	199	106 ⚠️
`memory dump`	22	5 ⚠️
`direct ok`	6	0
`быстрый коммит`	3	0

System Health

Топ-3 процессов с CPU > 1ч:

PID	Имя	CPU-время	Возраст
3464	MsMpEng	2.25ч	0.0ч
16128	Code	1.40ч	NaNч

⚠️ Проверь, не «осиротевшие» ли это процессы от завершённых Claude-сессий.

Алерт-индикаторы

✅ — норма ・ ⚠️ — внимание ・ 🔴 — действие требуется ・ ⚪ — не запускалось

6.9 KiB Raw Blame History Unescape Escape