Files
brain/docs/adr/ADR-017-knowledge-graph-tooling.md
T

13 KiB
Raw Blame History

ADR-017: Knowledge-graph tooling formalization (graphify)

  • Status: Accepted
  • Date: 2026-05-27
  • Deciders: Дмитрий

Context

Spike spike/graphify-2026-05-27 (worktree .claude/worktrees/graphify-spike) отработал три фазы построения knowledge-graph портала через инструмент graphify (npm-обёртка graphifyy, бинарь graphify.exe, установлен через uv tool install graphifyy v0.8.20+):

  • Phase 1 (docs/): 1352 узла / 1455 рёбер / 147 communities — 271 markdown файл, deep semantic extraction через Claude subagent dispatch (~2.4M tokens, 275 messages из 5h-окна).
  • Phase 2 (.claude/): 1135 узлов / 1234 рёбер / 139 communities — 262 файла (66 code + 196 docs), deep semantic, ~2.0M tokens, 11 субагентов, retry потребовался после session-limit.
  • Phase 3 (app/): 3818 узлов / 4064 рёбер — 824 PHP/Vue/TS файла, pure AST extraction (БЕЗ субагентов, ~30 сек wall-clock, 0 LLM-токенов).
  • Ultimate combined (через graphify merge-graphs): 6305 узлов / 6753 рёбер / 1009 communities, 93% EXTRACTED / 7% INFERRED / 0% AMBIGUOUS.

Spike дал воспроизводимую методологию: subfolder + graphify merge-graphs — безопасно строить фазами с откатом по бэкапам без потери прежних узлов. Дополнительные узлы карты Лидерры — lib/graph_node:* для трёх фаз + ultimate, провенанс-связки к источникам.

graphify — off-phase инструмент (не входит в фазовую раскладку #1-#29): для knowledge-management проекта, а не для конкретной фазы разработки. Параллельный ряду существующих off-phase подкатегорий (debug-runtime / architecture-tooling / audit-security / project-management / design-tooling / integration-tooling / ml-ai-tooling / business-process / discovery-tooling / authoring-tooling / dev-support / finance-tooling / backend-tooling / infosec-tooling / marketing-tooling), но граничит с context7 (#60), Boost (#10), openapi-mcp-server (#47), Sentry MCP (#34) и adr-kit/mermaid (#36/#37) по семантике; границы фиксируются в Decision ниже.

NB: параллельная сессия завершает раздел A10 BI-tooling (feat/a10-bi-tooling, Tasks 1-4 из 19, 5 узлов #84-#88 — узлы агентов nodes.yaml уже заняли #84/#85, BI на feature-branch без merge). Порядок merge решит финальную нумерацию подкатегории (19-я или 20-я); счётчики закрываются normative-sync агентом после merge.

Альтернативный backend Ollama — отдельный установленный для 152-ФЗ-чувствительных задач инструмент; graphify его НЕ читает (graphify читает только GEMINI_API_KEY/ GOOGLE_API_KEY или fallback на Claude Code subagent dispatch).

Decision

Graphify формализуется как узел #86 graphifyy в реестре Tooling Прил. Н в новой девятнадцатой off-phase подкатегории «knowledge-graph-tooling».

Граничные правила (locked)

  1. graphify (#86) ↔ context7 (#60). Разные слои документации:

    • context7 — внешние библиотеки/SDK/фреймворки (актуальные docs от vendor). Первый выбор для «как использовать React/Laravel/Vue».
    • graphify — внутренний codebase + спеки + .claude/-артефакты Лидерры. Первый выбор для «как устроен наш модуль/где вызывается наша функция/ связан ли наш скил X с агентом Y». Не дублируют. context7 ничего не знает про наш код; graphify ничего не знает про публичные SDK.
  2. graphify (#86) ↔ Laravel Boost (#10). Разный grain:

    • Boost — MCP-сервер с Eloquent/DB/Laravel-docs query-апи (например, php artisan tinker --execute, query schema, search Laravel docs). Точечный ввод/вывод по конкретному запросу к app/.
    • graphify — статический knowledge graph через все слои (docs+config+code). Cross-layer навигация и «структурные карты», не runtime queries. Boost остаётся первым выбором для «выполни SQL» / «прочитай model» / «найди в Laravel-docs»; graphify — для «покажи связи между нашим спеком и кодом» / «какие концепты связаны с X».
  3. graphify (#86) ↔ openapi-mcp-server (#47). Разный объект:

    • openapi-mcp-server — introspection одного OpenAPI-спека (docs/api/ openapi.yaml), tools/resources MCP-сервера, READ-ONLY.
    • graphify — весь проект (docs+config+code), включая OpenAPI как часть более широкого графа. openapi-mcp-server остаётся первым выбором когда вопрос локализован в API- спеке («какие эндпоинты`?»); graphify — когда вопрос пересекает спек + реализацию + тесты + договорённости.
  4. graphify (#86) ↔ Sentry MCP (#34). Разная плоскость:

    • Sentry — runtime ошибки (что упало в проде), READ-ONLY.
    • graphify — структурные отношения (как код связан), статика. Для post-mortem «упало X, что с чем связано» — Sentry находит X, graphify показывает blast radius.
  5. graphify (#86) ↔ adr-kit (#36) + mermaid-skill (#37). Разная природа:

    • adr-kit / mermaid — manual authoring решений и диаграмм (декларативно заказчиком/Claude).
    • graphify — auto-discovery связей из исходников (deterministic AST + LLM semantic). Не пересекаются: ADR — нормативное решение; graphify-граф — наблюдаемая структура.

Узел #86 graphifyy — атрибуты

  • Категория: off-phase, knowledge-graph-tooling (19-я подкатегория).
  • Источник: npm graphifyy v0.8.20+ (через uv tool install graphifyy), binary graphify.exe.
  • Установка: uv tool install graphifyy; работает с user-level skill ~/.claude/skills/graphify/SKILL.md (через graphify install --platform claude).
  • Активация: explicit /graphify <команда>, не проактивно.
  • Артефакты: graphify-out/{graph.json,GRAPH_REPORT.md,graph.html,cache/} в CWD откуда запущен. Должны быть в .gitignore (graphify-out*/), чтобы build-артефакты не попадали в diff/commit.
  • LLM-backend: GEMINI_API_KEY/GOOGLE_API_KEY (если есть) или fallback на Claude Code subagent dispatch. НЕ читает ANTHROPIC_API_KEY, OPENAI_API_KEY, Ollama API.
  • Ollama compliance: Ollama установлен в проекте для 152-ФЗ чувствительных задач (локальный LLM без отправки в Anthropic), но graphify Ollama НЕ использует — это два независимых инструмента.

Стратегия обновлений (locked)

  • Manual update пока единственный безопасный режим: /graphify --update (LLM для doc/MD-изменений; AST-only для code-изменений).

  • Auto-update post-commit hook отложен. Spike-попытка 27.05 вечером: graphify update . от широкого scope разнесло граф 6305 → 41586 узлов (38 МБ bloat), потому что подхватил tools/ + root-level .mjs + другое за пределами трёх фаз. Откат через re-merge phase-бэкапов восстановил canonical 6305/6753/1009. Перед auto-update необходимо:

    • Спроектировать узкий scope или exclude-pattern (vendor/, tools/, node_modules/).
    • Узкий manifest, корректно покрывающий все 3 фазы.
    • Smoke-test перед wire-in lefthook.

    До этого момента — никакого автоматического обновления.

Spike worktree → main стратегия

  • Spike worktree (spike/graphify-2026-05-27) остаётся локально для повторяемых rebuild'ов через subfolder + merge-graphs методологию.
  • На main commit'ятся: эта ADR-017, обновления нормативки (CLAUDE.md/Pravila/ PSR_v1/Tooling/nodes.yaml/routing-off-phase.md), .gitignore add graphify-out*/. Phase 1+2+3 binaries (graph.json + ультимейт ~5MB) не коммитятся — пересобираются по запросу.
  • Spec/plan на main (docs/superpowers/specs/2026-05-27-graphify-spike-design.md
    • docs/superpowers/plans/2026-05-27-graphify-spike.md) — untracked, требуют revision (Ollama assumption в исходной spec ошибочен). Можно обновить post-формализации либо drop.

Consequences

+ Knowledge-graph для всего портала Лидерры — формализованный инструмент ответа на cross-layer вопросы («где наш скил X используется в коде / в каких спеках упоминается агент Y / какие концепты связаны с биллингом»).

+ Bридирует gap между документацией (docs/), конфигом (.claude/) и реализацией (app/) — единый граф для onboarding и architectural reasoning.

+ Subfolder + merge-graphs методология воспроизводима для дополнения графа без потери прежних узлов; provenance к источникам сохраняется.

+ Граничные правила фиксируют когда что использовать → нет дублирования с context7/Boost/openapi/Sentry/adr-kit.

Первичная сборка дорогая по subagent-токенам (Phase 1+2 = ~4.4M tokens). Регенерация графа не должна быть рутинной операцией.

Auto-update отложен → граф быстро устаревает между manual rebuild'ами. До wire-in safety review — этот риск осознанный.

Третий канал документации проекта (после CLAUDE.md/MEMORY.md и реестра Tooling) — нагрузка на дисциплину обновлений.

Размер canonical graph.json ~5 МБ — должен быть в .gitignore; иначе diff'ы будут шумные.

Compliance

  • Узел #86 graphifyy в реестре Tooling Прил. Н, 19-я подкатегория knowledge-graph-tooling.
  • CLAUDE.md §3.3 +строка #89; §0 cross-refs Pravila/PSR_v1/Tooling bumped; §6 + абзац о spike; §9 changelog entry.
  • Pravila §13.2 +абзац «Off-phase knowledge-graph-tooling».
  • PSR_v1 R10.1 Блок 1 note (graphifyy не UI → вне R6/R14); R15.6 +knowledge- graph-tooling в список off-phase подкатегорий.
  • nodes.yaml: узел #86 graphifyy с subcategory knowledge-graph-tooling.
  • routing-off-phase.md: trigger «knowledge graph / codebase structure / cross- layer concept query» → #86.
  • spike worktree .gitignore update: graphify-out*/.

Cross-refs

  • Spike spec (untracked, revision pending): docs/superpowers/specs/2026-05-27- graphify-spike-design.md.
  • Spike plan (untracked, revision pending): docs/superpowers/plans/2026-05-27- graphify-spike.md.
  • Memory (user-local): ~/.claude/projects/.../memory/project_graphify_phase3_ done.md — runtime handoff state, инцидент с auto-hook + откат.
  • Skill (user-level, через graphify install --platform claude): ~/.claude/skills/graphify/SKILL.md.