Files
portal/docs/observer/baselines/2026-05-24-pre-enforcement.md
T
Дмитрий 6bd0eb59eb fix(baseline): correct dangling SHA reference (final review minor)
Snapshot "Commit:" field referenced 30b795c (dangling orphan from
amend cycle). Replaced with actual e239160a + 436284c5 (F1 fix).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-24 07:32:20 +03:00

3.8 KiB
Raw Blame History

Baseline дисциплины роутера — pre-enforcement snapshot

Дата: 2026-05-24 Источник данных: docs/observer/episodes-2026-05.jsonl Этап: Router discipline overhaul, Stage 2 (Measurements). Зафиксирован для сравнения с пост-enforcement цифрами этапа 3. Spec: docs/superpowers/specs/2026-05-23-router-discipline-overhaul-design.md Plan: docs/superpowers/plans/2026-05-24-router-overhaul-stage-2-measurements.md Commit: e239160a (snapshot creation) → 436284c5 (F1 top-5 nodes fix)

Объём данных

  • Эпизодов всего: 129 (124 v2+ + 5 v1)
  • v2+ эпизодов (анализируется): 124
  • v1 эпизодов пропущено: 5
  • Observer-error маркеров: 0

Цифры

Дисциплина по типам задач

Тип задачи Эпизодов % с триггер-матчем % через скил
bugfix 6 33.3% 33.3%
analysis 4 0% 25.0%
feature 5 0% 0%
planning 2 0% 0%
refactor 1 0% 0%
cleanup 1 0% 0%
monitoring 1 0% 0%

Распределение по шагам роутера

  • distribution: {"1": 124}
  • total: 124
  • suspicious: true — >90% эпизодов остановились на step=1; sentinel-bug парсера, требует исследования в этапе 3

Применение границ (ADR)

  • Total: 124
  • With boundaries: 13
  • Rate: 10.5%
  • By path_type:
    • improvised: 112 эпизодов, 11 с boundaries, 9.8%
    • regulated: 12 эпизодов, 2 с boundaries, 16.7%

Missed activations

  • Total: 17

By classification:

{
  "bugfix": 4,
  "feature": 5,
  "refactor": 1,
  "planning": 2,
  "cleanup": 1,
  "monitoring": 1,
  "analysis": 3
}

By node (top 5 по количеству):

{
  "#19": 12,
  "#34": 5,
  "#18": 4,
  "#25": 3,
  "#39": 3
}

(#53 также имеет count 3, следующие: #11:#12:#41:#42 = 2)

Контекст

Это «точка До» перед включением enforcement-хука этапа 3. После недели работы хука повторно снимем эти цифры и сравним.

Цели overhaul'а (из spec'а §acceptance criteria):

  • Дисциплина (% эпизодов с матченным триггером на классифицированных задачах): ≥75% (baseline зафиксирован выше — сейчас 33.3% лишь у bugfix, остальные 0%).
  • Missed activations: ≤5/неделю (baseline: 17 за месяц).
  • % feature/planning без skill: ≤10% (baseline: feature 0%, planning 0% — обе категории нарушают цель).

Заметка о suspicious-флаге

suspicious: true в routerStep указывает, что все 124 v2+ эпизода имеют step=1. Это означает, что парсер tools/observer-transcript-parser.mjs пока не enrich'ит фактический шаг роутера — поле primary_rationale.step сейчас постоянно 1 (sentinel default). Этот пропуск самой инструментовки наблюдателя — отдельный задел для этапа 3 (нужно либо расширить парсер, чтобы он различал шаги, либо явно вычислять step из контекста). До этого срез по router_step не информативен.

Воспроизводимость

node tools/brain-retro-analyzer.mjs docs/observer/episodes-2026-05.jsonl

Источник classificationMap + dormancy — docs/registry/nodes.yaml (через tools/registry-to-classification-map.mjs).