Kihagyás

Sprint Day 0 — skeleton-first commit playbook#

Egy új sprint (B-1, B-2, …) első napján egyetlen committal rakd le a teljes vázat (scaffold), DE funkcionális kódot ne írj — az Week 1-2-re marad, kalibráció után.

Miért#

  • Reviewable foundation — az ADR absztrakt-rétege átkonvertálódik konkrét fájlokra, a sprint mostmár mérhető haladású, nem absztrakció marad
  • Out-of-the-box dependency-check — ha a skeleton dry-run-olható (de no-op), a Day 1-en már látod hogy a wiring stimmel, mielőtt funkcionalitást építenél rá
  • Cron + audit-compatibility ellenőrzés — az új fájlok rögtön belekerülnek a vault-cleanup audit-pipeline-ba, frontmatter-hibák azonnal kiderülnek
  • Sprint-Backlog teljes láthatóság — minden Week 1-6 task #project/<slug> taggel kiosztva, nem „valamikor majd"
  • Stage-gate kockázat-kontroll — a skeleton mögötti git-tag (sv-phase-bN-day0) később explicit checkpoint a visszafordítható retreat-hez

Mit tartalmaz a Day 0 commit#

sprint/
├── README.md                    Sprint-overview + status + acceptance criteria
├── schema/                      Adatszint (SQL / YAML / JSON-schema)
│   └── <foo>.sql
├── scripts/
│   └── <main-tool>.py           SKELETON: --help működik, --dry-run runnable, real-extract = no-op stub
├── prompts/                     LLM-prompt-templátok (LLM-as-judge, extractor, summarizer)
│   └── <foo>-template.md
└── (config + audit-log helyek üresen, gitignored)

Plus közös vault-fájlok ugyanabban a committban:

  • 02-Projects/<slug>.md — projekt-fájl státusszal + sprint-táblával + sikermetrikákkal + backout-plan-nel
  • 04-Tasks/Backlog.md#project/<slug> szekció hozzáadva Day 0-tól Week 6-ig minden taskkal
  • 02-Projects/Index.md — új sor a megfelelő csoport-táblába
  • .gitignore — bináris/DB-fájlok kizárva (a schema és script TRACK-elt)
  • Kapcsolódó ADR parent: vagy sprint: frontmatter-mezőjébe a projekt-file linkelve

Konkrét példa — B-1 Crystallization automation Day 0 (2026-05-12)#

Vault-fájl Méret Mit tartalmaz
.vault-ko/schema.sql 2.5KB 3 SQLite tábla (facts, propagation_log, crystallization_runs) WAL mode + indexek
.vault-ko/facts.db 52KB SQLite DB initialized from schema (gitignored)
.vault-ko/scripts/vault-ko-ingest.py 4.6KB argparse --backfill/--file/--session/--dry-run, extract_facts_stub() no-op
.vault-ko/prompts/g-eval-template.md 4.2KB G-Eval prompt v0.1 (4-dim CoT scoring, JSON output)
.vault-ko/README.md 2.0KB Sprint status, 6-week plan, hot-reload threshold
02-Projects/superintelligent-vault.md 4.5KB 8-tengelyű projekt-táblázat + B-1 acceptance criteria + sikermetrikák
04-Tasks/Backlog.md +11 task B-1 Week 1-6 explicit, plus 7 future-sprint placeholder
02-Projects/Index.md +1 sor 🔬 Kutatás csoportban új sor
.gitignore +5 sor .vault-ko/facts.db* excluded

Funkcionális kód: NULLA. Az extract_facts_stub() üres lista-t ad vissza. De --help működik, --dry-run runnable — wiring OK.

Mit NE csinálj Day 0-n#

  • API-integration (Haiku/Sonnet hívás) — az Week 1 a kalibráció után, mert minden API-call cost
  • Real-extractor / -classifier kód — a calibration-data dönti el a prompt-fine-tuning irányát
  • G-Eval threshold-routing live — Week 3 shadow mode-tól kezdődik csak
  • Production cron-hookolás (pl. /11.11stop-ba integráció) — előbb a script működjön Week 2-ben

Mit IGENIS csinálj Day 0-n (kód-szintű low-risk komponensek)#

A „skeleton ≠ no-op" elv: ha a kód-szintű impl <20 sor és no-API, írd meg már Day 0-n. Az ilyen komponensek azonnal hasznosak Week 1 baseline-ra, és nem éri meg stub-nak hagyni amit nem kell.

Komponens Day 0-n megírható? Indok
Determinisztikus parser (regex, heurisztika) ✅ IGEN Pl. B-3 L1 eval — Quality A/B/C bucket egyetlen --dry-run futtatással baseline ad
Frontmatter audit ✅ IGEN Pl. B-4 skill-canonicalize --audit — 534 SKILL.md compliance scan, ~30 sor
CLI argparse + --help + --dry-run ✅ IGEN Mindig — --help runnable a wiring-checkre kell
Filesystem traversal (mkdir, file-discovery) ✅ IGEN Pl. B-5 vault-nb-sync — 17 projekt detect dry-run
Status-snapshot (event-log read, JSONL parse) ✅ IGEN Pl. B-6 event-log-monitor --status — read-only, no side-effect
Safety-gate / ENV-flag check ✅ IGEN B-8 RSI scripts mind exit-elnek ha RSI_MODE != enabled — kötelező Day 0-tól
LLM-API hívás (Haiku, Sonnet) ❌ NEM Költséges, kalibrációs-data nélkül rossz prompt → Week 1+
Docker container start ❌ NEM Telepítési overhead — Week 1 Day 1
External service integration (NotebookLM, MCP-server live) ❌ NEM Network-dependency, retry-pattern kalibráció kell

Ökölszabály: ha read-only + lokális + <20 sor, írd meg Day 0-n. Ha write/state-changing vagy >20 sor, stub Day 0-n, real Week 1.

Élő visszaigazolás (2026-05-13 SV B-3 sprint)#

A B-3 Continuous evaluation Day 0-án (2026-05-12 20:55) a .vault-eval/scripts/eval-l1-parser.py ~110 sor pure-Python regex + heurisztika lett — no API, no Memgraph, no LlamaIndex dep. Week 1 Day 1-én (2026-05-13 08:05) csak eval-l1-parser --backfill futtatás kellett — 5 másodperc alatt 52 closed session-en quality-distribution baseline:

[write] 52 → /tmp/vault-eval/eval-l1-2026-05-13.jsonl
  Quality distribution: {'A': 43, 'B': 1, 'skip': 8}

Nettó eredmény: Day 0-n megírt 110 sor kód, Week 1 első órájában azonnal hasznos baseline további kódolás nélkül. Az ökölszabály visszaigazolva — a kód-szintű <30 sor + no-API komponensek Day 0-n megírva azonnali ROI-t adnak.

Élő visszaigazolás 2. iteráció (2026-05-13 SV B-2 Week 1)#

A B-2 sprint Day 0-án (2026-05-13 06:25) a .vault-memory/scripts/{vault-embed,vault-search}.py skeleton-okban már megvolt az argparse + file-traversal + dry-run + chunk-method választás (~150 sor placeholder + CLI). Week 1 Day 2-3-án (2026-05-13 08:30-09:00) csak skeleton→real swap kellett: a placeholder embed_stub() és search_stub() helyére bge-m3 + mgclient kód (~50 sor új kód a 4 placeholder helyén).

Mérve:

Komponens Day 0 (skeleton) Week 1 (real swap) Skeleton-előny
vault-embed.py ~100 sor (argparse + traversal + stub) ~60 sor új (chunkolás + bge-m3 + Cypher CREATE) 5× gyorsabb
vault-search.py ~70 sor (argparse + format-result + stub) ~30 sor új (encode + cosine + sort) 6× gyorsabb

Általánosítás: ha Day 0-n complete-shape skeleton van (CLI + I/O + stub-function-signatures), Week 1 implementation ~5× gyorsabb mint nulláról kezdeni — a I/O-boilerplate és error-handling már kész, csak a domain-logic-ot kell behúzni a stubok helyére.

Élő visszaigazolás 3. iteráció (2026-05-13 SV B-2 Week 3 — skeleton+infra→UX-pipeline)#

A B-2 Week 3 Day 1-2 (load-session-context skill rewrite) különleges minta: NEM csak skeleton→real swap, hanem skeleton + B-2 Memgraph infra + B-4 SKILL-search → UX-rewrite:

Komponens Mikor készült Méret Cél
load-session-context/SKILL.md skeleton 2026-04-30 (B-2 előtti) ~110 sor aggressive cat-pattern régi UX
.vault-memory/scripts/vault-search.py (B-2 Week 1) 2026-05-13 08:30 ~70 sor real impl semantic-search foundation
.vault-memory/scripts/vault-context-load.py 2026-05-13 09:20 ⭐ ~180 sor new MemGPT virtual rewrite
load-session-context/SKILL.md v2 2026-05-13 09:20 ⭐ ~120 sor MemGPT pattern UX-csere

Total ~30 perc Week 3 implementation, mert a B-2 Memgraph + bge-m3 már fut, és a Day 0 skeleton-pattern már bevett. UX-impact: 15-20K → ~5K token context-load + 30s → <10s wall-clock per session-induláskor.

Általánosítás 2: ha (a) Day 0 skeleton + (b) Week 1 infra-szint élő, akkor (c) UX-rewrite Week 2-3-ban ~30 perc — a 3 réteg multiplikál.

Élő visszaigazolás 4. iteráció (2026-05-16 SV B-1 Week 2 Crystallize-pipeline)#

A B-1 Day 0 (2026-05-12, .vault-ko/ skeleton + facts.db schema + script stubs) 3 hete állt érintetlenül, üres facts.db-vel. 2026-05-16-án Week 2 implementation 1 session-en belül ~3 óra alatt:

Komponens Day 0 status (2026-05-12) Week 2 mutation (2026-05-16) Eredmény
facts.db schema ✓ kész (47-soros SQL) reusable
vault-ko-ingest.py skeleton ✓ 140 sor placeholder replace extract_facts_stub 2-phase subagent extractor-rel functional Layer-1
prompts/g-eval-template.md ✓ kész (123 sor) reusable
calibration/sample-15-gold ✓ kész + 15 synth-Fail balanced 30-mintás benchmark
11.11crystallize script hiányzott new ~280 sor Python, 3 scorer-mode functional Layer-2
vault-ko-query hiányzott new ~150 sor Python functional Layer-3 retrieval
vault-ko-report hiányzott new ~100 sor user-facing summary

~3 óra wall-clock, $0 cost (subagent-fanout), 1342 fact a KO-DB-ben, 96.7% calibration agreement. A 3-hetes Day-0 várakozás NEM holt-súly volt: a fájl-struktúra felgyorsította a script-lookup-ot, a Memory-context-loading szuper-tisztán hozta vissza a kontextust, és a meglévő G-Eval-template skipped 1-2 óra prompt-tervezést.

Általánosítás 3: a Day 0 skeleton elavulhat 1-3 hetet anélkül hogy a sprint elveszítse a velocity-t, mert a vault Karpathy-mintán fellépő file-as-state architektúrája rezilient a hosszú szünetre.

Mit IGENIS csinálj Day 0-n — AUTO-GEN END marker pattern (bővítve 2026-05-13)#

Minden olyan vault-fájlnál ami auto-gen + emberi annotáció keveréke (weekly cron rewrite + manuális kommentek), Day 0-tól tervezz <!-- AUTO-GEN END --> marker-pattern-t a script-be:

# Aggregator script:
output_md = render_auto_gen_section()
existing = OUTPUT.read_text() if OUTPUT.exists() else ""
marker_idx = existing.find("<!-- AUTO-GEN END")
manual_tail = existing[marker_idx:] if marker_idx >= 0 else ""
final = output_md.rstrip() + "\n" + manual_tail.split("\n", 1)[1] if manual_tail else output_md
OUTPUT.write_text(final)

Validált use-case-ek:

Fájl Auto-gen script Manual section
06-Audits/System_Health.md vault-cleanup --write (vasárnap) "Megnyitott kérdések" alá
06-Audits/Eval_Trend.md (új 2026-05-13) eval-l3-aggregator --write review-jegyzetek alá

Day 0 lépés: ha új auto-gen audit-output készül, az aggregator-script ELSŐ commitja már tartalmazza a marker-handling-et. NE later-Week-2 retrofit, mert addig csak ütközés-veszély.

Cascade pattern — több sprint Day 0-ja egyszerre#

Mikor érdemes single helyett cascade-t (~2026-05-13 SV-cascade validálta):

Feltétel Single Cascade
Egy projekt egy aktív sprint
Egy projekt 3+ ADR-rel, mind Day 0-ra vár
Sprint-ek függés-irányítottak (B-1 → B-2 → ...) ✅ (előző Day 0 → következő tervezés)
Sprint-ek függetlenek (B-3/B-4/B-5/B-6/B-8 mind kódot ír)
User-time-budget ~1 óra 1-2 sprint 5 sprint
User-time-budget ~25-30 perc 1 sprint

Time-cost cascade-ben (mért 2026-05-13):

Komponens Idő Megjegyzés
Per-sprint fájl-írás (5-7 fájl) ~10 perc Repetitív, pattern-konform
Projekt-fájl 5× status update ~5 perc Single Edit hívás
Backlog 5× detailed expansion ~10 perc 5 új szekció (Day 0 ✅ + Week 1-3 tasks)
.gitignore update + chmod + verify ~5 perc
Total 5 sprint Day 0 ~30 perc (NEM 5 × 25 perc = 2+ óra)

Felgyorsító faktor: a 2. sprinttől már a memóriában van a minta (mappa-struktúra, README-szakaszok, config-YAML-keret). A 3-5. sprintnél már 8-10 perc / sprint elég.

NEM érdemes cascade: - Ha valamelyik sprint éles funkcionalitást is implementál Day 0-n (akkor single, fókuszáltabb) - Ha az ADR-ek konfliktusban vannak egymással (előbb resolve, aztán cascade) - Ha valamely sprintre nincs még ADR (előbb research + ADR)

Validations (élő alkalmazások)#

A playbook 2026-05-12-13-án 2 élő sprint Day 0-ban validálódott — mindkettő ugyanazt a struktúrát követte, mindkettő ~30 perc alatt készült el:

Sprint Dátum Mappa Skeleton-fájlok Day 0 idő
B-1 Crystallization 2026-05-12 20:40 .vault-ko/ schema.sql + facts.db + vault-ko-ingest.py + g-eval-template.md + README ~30 perc
B-2 Memory architecture 2026-05-13 06:25 .vault-memory/ docker-compose.yml + vault-embed.py + vault-search.py + llamaindex-config.yml + README ~25 perc

Konvergens minta mindkét sprintnél: - 1 mappa-prefix (.vault-<feature>/) - 1 README.md (status + sprint-plan + cost-calc + backout) - 1+ scripts/<tool>.py (skeleton, --help+--dry-run runnable, real impl no-op) - 1+ config/ vagy prompts/ (YAML / md template-ek) - 1 vault-projekt-fájl + Backlog + .gitignore update ugyanabban a commitban

Time-cap: ha a Day 0 >1 óra, valószínűleg már funkcionális kódot írsz — STOP, halaszd Week 1-re.

Cross-sprint reuse — schema előbb mint kód#

Helyzet (2026-05-13 megtapasztalva): a B-2 (Memory architecture, Memgraph + LlamaIndex) és B-7 (World-model / Knowledge graph) közös infrastruktúrára épül — ugyanaz a Memgraph DB, ugyanaz az entity-graph. Két sprint, egy schema.

Tanulság: ha sprint-X és sprint-Y közös data-ra / schema-ra / DB-re épül, a schema-t előbb komititáld, mint bármelyik konkrét sprint kódját. Ez: 1. Single source of truth — egy fájl, mindkét sprint reuse-olja 2. Out-of-order sprint-rendezés OK — B-7 schema-YAML 2026-05-12-én készült, B-2 másnap reuse-olta inputként 3. Validation early — ha a schema rossz, mindkét sprint kódolása sérül; jobb előbb kideríteni

Konkrét B-2/B-7 példa: 00-Meta/graph-schema.yml (9 entity + 6 relation) → LlamaIndex SchemaLLMPathExtractor input a B-2 Week 1-ben + Cypher schema-init Memgraph-ba a B-7 Week 1-ben. Egy YAML, két sprint.

Sprint-sequence general rule:

1. Shared schema / data-model     (Day 0, owner: korábbi sprint)
2. Shared infrastructure          (Day 0, owner: integrátor sprint)
3. Sprint-X specific integration  (Week 1-2)
4. Sprint-Y specific integration  (Week 1-2)
5. Cross-sprint bridge / handoff  (Week 2-3, ha kell)

A skeleton-first és a Karpathy LLM-Wiki#

A skeleton-first commit a 11-wiki/Karpathy-LLM-Wiki-pattern „compilation" fázisának analógiája: nyers ADR → kezdetleges working memory (skeleton) → később reflective compilation (Week 1-2 kalibráció) → semantic memory (production sprint Week 3+). A vault-ban ez konkrétan láthatóvá teszi a tudás-folyam legyen.

Backout-plan#

Day 0 commit mindig revertable — Day 1-én se a kód, se a Backlog tasks nem hatnak függvény-szinten a meglévő vault-flow-ra. ENV-flag (<sprint>_MODE=disabled) vagy egyszerű git revert lemossa.

Élő visszaigazolás 5. iteráció (2026-05-17 — SV B-1 teljes ingest)#

Mintabizonyíték a Day-0-skeleton-pattern produktivitására: a SV B-1 sprint Day-0 commit-ja 2026-05-12-én (KO-DB schema + 2-phase pending-pattern subagent-fanout + skeleton-script) mai napon (2026-05-17) lehetővé tette a teljes vault (173 fájl: 76 wiki + 28 ADR + 69 session) ingest-elését 3 óra wall-clock alatt — Anthropic API kulcs nélkül, 174 párhuzamos subagent-tel, $0 cost. A pattern ennyiszer él már:

# Dátum Sprint / feladat Day-0 → Week N gyorsulás
1 2026-04-30 smoke-teszt mechanika scaffold 1 commit → 1 hét scale-up
2 2026-05-12 SV B-1..B-8 (8 sprint) Day-0 8 commit → 4 hét parallel build
3 2026-05-16 SV B-1 Week 1+2 (cryst pipeline) 3 hetes skeleton → 3 óra full-build
4 2026-05-16 G-Eval 30-mintás calibration Day-0 prompt → 96.7% agreement
5 2026-05-17 SV B-1 backfill TELJES (12 300 triplet) Day-0 schema → 173 fájl ingest 3 óra alatt

A Day-0-skeleton ROI metrika: 5/5 elnyúlt sprint közvetlen visszatekintve a Day-0 commit-tól indul, ez nem véletlen.

| 6 | 2026-05-17 | Week-1-α uniformity 3 sprint párhuzam | template-érettség |

Élő visszaigazolás 6. iteráció (2026-05-17-2 — Week-1-α uniformity pattern)#

A 2026-05-17-obsidian-vault-2 session során 3 új Week-1-α sprint mind UGYANAZT a skeleton-first pattern-t követte: GEPA prompt-mutator (B-8), auto-skill distill (B-4+B-8), vault-coherence-check (B-3+B-1). Mindegyik:

  • ENV-flag default OFF (VAULT_RSI_APPLY=0, VAULT_COHERENCE_CHECK=0)
  • Detect-only / dry-run-only Week 1 (0 vault-mutáció)
  • Real apply Week 2+ subagent-fanout-tal
  • Audit-MD + Next-step-list

Tanulság: a Week-1-α skeleton-first ennyire uniform pattern-t ad, hogy érdemes template-elni — pl. /root/.vault-config/sprint-template/week-1-alpha-skeleton.md checklist (4 readiness criteria). Reusable a B-3/B-5/B-6/B-7 Week 2+ kickoff-okra is.

Realpath-dedup discipline (2026-05-17 finding)#

Minden vault-audit-scriptnek realpath dedup-ot kell az első lépésben. A B-4 SKILL.md baseline 2026-05-13-on "534 fájl"-t számolt, valójában 462 — .claude/skills és .codex/skills mind symlink .agents/skills-re, így 3×-os duplikáció. Pythonban:

seen = set()
for f in candidates:
    real = f.resolve()    # follows symlinks
    if real in seen:
        continue
    seen.add(real)
    # ... process f
Skill-audit, embed-audit, chunk-count, file-listing — mind ide tartoznak.

Linear-extrapolation-from-checkpoint (2026-05-20 finding)#

A skeleton-first elv kiterjeszthető a bulk-művelet checkpointokra is. Ha egy DB-write művelet linear-by-construction (minden új unit 1 numerator-növekedés + 0 denominator-növekedés), egy 30-50 unit méretű checkpoint elég ahhoz, hogy bizonytalanság-nélkül extrapoláld az endgame számot.

Élő példa — Tier-1 backfill 2026-05-20:

Checkpoint Files done FCA measured Per-file rate Projected final (171)
Baseline 0 0.4676
Checkpoint-1 50 0.6027 0.00270 0.929
Checkpoint-2 66 0.6459 0.00270 0.929
Final 171 0.9297 0.00270 0.9297

A per-file rate 0.001 pontossággal stabil maradt mind a 11 batch-en. A projection a 50-fájl-checkpointból már elég volt a final-szám előrejelzésére — ha kötelező resource-cost van (e.g. fanout-API), a backfill 30%-án megtörténhet a "running cost vs additional value" döntés, NEM a 100% végén.

Reusable rule: bulk-bin műveletekre (KO-DB-ingest, embed-backfill, audit-rescan) checkpoint a 20-30% szinten + linear projection + explicit stop/continue decision a userrel. Ha a projection nem-lineáris (e.g. early-out gains saturated), a 30% checkpoint reveals ezt is.

A teljes audit: ../06-Audits/2026-05-20 Tier-1 backfill 50-file partial — FCA +0.135 empirical (a 50-fájlos projection prediction-ja) + ../06-Audits/2026-05-20 Tier-1 backfill COMPLETE 171-171 — FCA 0.93 (ceiling reached) (a final-valid mérés).

Kapcsolódó#