Files

T

Дмитрий 659f2b0757 feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

Brain-retro #5 за период 2026-05-24T13:18Z .. 2026-05-26T05:09Z (202 эпизода).
Первый ненулевой reviewer-pass в истории brain-governance (раньше 0/414).

Key findings:
  • 184 episodes reviewed via Opus 4.7 ProxyAPI, 18 errors (~$9 cost)
  • outcome_reviewed: success 24.5% / soft_success 64.1% / rework 11.4%
  • node_quality: correct 30% / disputable 59% / wrong_node 9% / over+under 1.6%
  • 93.5% no_self_assessment — confirms self-assessment bug fixed in 752d80af
  • Top ignored nodes (wrong_node): #19 Superpowers (5), #18 Pest (3),
    #33 claude-md-management (2), #25 Semgrep (2)
  • Discipline regressed in long session: regulated 19% → 4.5%

Artifacts:
  • tools/brain-retro-batch-reviewer.mjs (new) — direct API batch driver
    for retros >50 episodes (canonical Task() spawn impractical at scale).
  • docs/observer/notes/2026-05-26-brain-retro.md (new) — full retro note
    with 4 candidates A/B/C/D for owner review.
  • docs/observer/sanity-checks/2026-05-26.json (new) — sanity Q&A.
  • docs/observer/episodes-2026-05.jsonl — 184 episodes mutated with
    review.* / outcome_reviewed / outcome_reviewed_source fields.
  • docs/observer/STATUS.md — refreshed.
  • docs/observer/.pii-counters.json / .read-counter.json / .self-retrospect-counter.json
    — bumped by procedure.

Spec: brain-retro skill .claude/skills/brain-retro/SKILL.md.

2026-05-26 10:49:28 +03:00

baselines

fix(baseline): correct dangling SHA reference (final review minor)

2026-05-24 07:32:20 +03:00

notes

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

sanity-checks

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

.pii-counters.json

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

.read-counter.json

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

.self-retrospect-counter.json

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

active-projects.md

docs(continuity): stage 3 follow-up закрыт — 3 fixes + STATUS regen

2026-05-24 16:01:41 +03:00

dashboard-core.js

feat(brain): conflict three-layer panel (design / friction / correlation) +3 tests

2026-05-19 16:23:51 +03:00

dashboard.html

feat(brain): Forest polish + observer README entry for the dashboard

2026-05-19 16:23:52 +03:00

dashboard.js

feat(brain): conflict three-layer panel (design / friction / correlation) +3 tests

2026-05-19 16:23:51 +03:00

episodes-2026-05.jsonl

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

README.md

feat(brain): Forest polish + observer README entry for the dashboard

2026-05-19 16:23:52 +03:00

STATUS.md

feat(brain-retro): retro #5 — first reviewer pass (184/202) + batch-reviewer tool

2026-05-26 10:49:28 +03:00

README.md

Observer infrastructure

Passive evidence-loop for the Лидерра «brain» per ADR-011.

Files

episodes-YYYY-MM.jsonl — append-only JSONL, one line per Stop-event. Schema v2 (schema_version: 2): the 5 mandatory fields + decision_provenance (who chose the node), environment (economy_level / model / post_compaction / session_turn / parallel_session), task_size, task_ref, prompt_signal, and an outcome that is unknown at write time (refined by /brain-retro). On an internal hook failure a minimal observer_error marker line is written instead of a silent skip. Written by tools/observer-stop-hook.mjs via tools/observer-transcript-parser.mjs.
notes/YYYY-MM-DD-<slug>.md — optional MD notes for sessions with qualitative history.
STATUS.md — auto-generated dashboard. Regenerated per-commit by tools/status-md-generator.mjs.
.read-counter.json — C3 observer-of-observer counter. Updated on Read of observer files.
dashboard.html + dashboard.js + dashboard-core.js — Brain Dashboard: visualises the episode log over the automation-graph topology (4 views — Карта / Разбор / Лента / Агрегат). Run npm run brain:dashboard, open the printed localhost URL. dashboard-core.js is pure logic, unit-tested in tools/brain-dashboard-core.test.mjs.

Lifecycle

Write: every Stop-event appends one JSONL line, parsed from the session transcript (Stop-hook).
Aggregate: /brain-retro skill reads JSONL each sprint, proposes regulatory candidates.
Surface: STATUS.md shows controllers + monthly stats.
Self-prune: C3 warns if 54 weeks pass without any read of observer files.

Routing-tag discipline

When the user dictates a specific method/node (e.g. «запусти discovery-interview»), Claude must emit one line in its response:

<!-- routing: provenance=user_directed_method node=<chosen> counterfactual=<node Claude would have chosen autonomously> -->

The Stop-hook routing-gate (tools/observer-routing-detector.mjs + routingGateDecision) detects a dictated method; if the tag is missing it returns decision: block, so the turn cannot end without the tag. The gate fires at most once per turn (stop_hook_active guard). This makes decision_provenance reliable — factor analysis can separate a router error from a user-dictated one.

Privacy

PII filter (phone numbers, emails, tokens) is applied before every write — see tools/observer-pii-filter.mjs. gitleaks pre-push also scans observer files as part of full-history sweep.

Don't

Don't edit episodes-*.jsonl manually — it's append-only.
Don't write outside docs/observer/notes/ for hand-curated notes.
Don't change .read-counter.json manually — it's maintained by hooks.

HK1 pre-check (Pravila ADR-010) — verified 2026-05-19

Before registering tools/observer-stop-hook.mjs on Stop event (Task B5), verified collision against 6-component economy/skill-discipline architecture:

User-level ~/.claude/settings.json already has Stop hook: agent-type Sonnet-4.6 economy compliance verifier (analyzes transcript for claim-without-evidence violations).
Project-level .claude/settings.json — Stop slot empty.

Result: no overwrite. observer-stop-hook will be added as command-type entry in project-level Stop array. Project + user scopes are independent slots in Claude Code 2.x — both run on the same Stop event without conflict. The agent verifier (user scope) and the JSONL appender (project scope) have non-overlapping responsibilities.