Kihagyás

2026 05 13 sv week1 implementation

Pre-loaded context#

Slug: sv-week1-implementation — folytatás az sv-functional-payoff-on (08:27 zárt). 4 sprint Week 1-szintű implementációra emelése egy session-ben.

Parent: 02-Projects/superintelligent-vault — B-1..B-8 Day 0 ✓ + B-2 Memgraph live + B-3 L1 backfill + B-4 SKILL.md frontmatter normalize már megvolt.

Cél: Funkcionális kód-szint, NEM csak skeleton: - B-2 Week 1 Day 2-3: pip install + bge-m3 download + vault-embed real impl + smoke - B-3 Week 2 Day 1: NLI model download + smoke 5 pair - B-4 Week 2: 267 SKILL.md → bge-m3 embed → Memgraph skills namespace (B-2-re épít) - B-1 Week 1: gold-label sample (15 bullet, mert 43 Quality A session-ből csak ennyi formattált)

Prereq state: Memgraph vault-memgraph container fut (B-2 Day 1 munka, 08:09), .notebooklm-venv pip-ready.

Cél#

Events#

  • 09:08 — B-4 Week 2 + B-2 Week 1 Day 2-3 + B-3 Week 2 Day 1 + B-1 Week 1 (15 sample) DONE. Memgraph: 977 total chunks (969 skills + 8 content namespace). vault-search semantic-search élesben működik mindkét namespace-en (bge-m3 1024-dim cosine, top-5 0.62-0.65 score). NLI: MoritzLaurer/DeBERTa-v3-base-mnli-fever-anli 5/5 verdict helyes. B-1 15 gold-label szuk distribution (mind Pass 0.80-1.00) — Week 2 szintetikus low-quality példák kellenek balance-hoz. Total wall-clock: ~30 perc (5min pip + 1min bge-m3 download + 24min embed-batch 267 SKILL + smoke-tesztek).

Summary#

4 SV-sprint Week 1-szintű implementáció ELKÉSZÜLT egyetlen session-ben (~35 perc wall-clock, $0 cost).

B-2 Week 1 Day 2-3 — Embedding-pipeline LIVE ✓#

  • Deps install .notebooklm-venv-be: llama-index-core, llama-index-graph-stores-memgraph, llama-index-embeddings-huggingface, sentence-transformers v5.5.0, transformers, pymgclient
  • bge-m3 modell (1024-dim multilingual) letöltve (~2.3GB cached) ~/.cache/huggingface/hub/-ba
  • vault-embed.py real impl — chunkolás ## header-eknél, batch-embed normalize_embeddings, MERGE (c:Chunk {hash, namespace}) Memgraph-ba
  • vault-search.py real impl — bge-m3 query encode + cosine scan + top-k ranking
  • Smoke: Karpathy-LLM-Wiki-pattern.md → 8 chunks content namespace, vault-search "compilation pattern" → top-5 cosine ✓ (0.487 score #3 Crystallization workflow)

B-3 Week 2 Day 1 — NLI hallucination-check LIVE ✓#

  • Originál tasksource/deberta-v3-base-nli 404 (repo nem létezik már), switch MoritzLaurer/DeBERTa-v3-base-mnli-fever-anli ~700MB cached
  • eval-l2-llm-judge.py real impl: transformers.pipeline("text-classification", model=…, top_k=None) 3-label scores
  • Smoke 5/5 helyes verdikt: supported (entail 0.98 mindkettő pozitív minta), contradicted (contra 0.97 + 1.00), unsupported/neutral (0.93 az indirect-evidence-en)

B-4 Week 2 — Skill-embedding élesben ✓#

  • 267 SKILL.md → 969 chunks skills namespace-ben (1077 created → 108 dedupelt hash-MERGE-el — boilerplate-átfedés agent skill-ek között)
  • Embed-rate: 267 fájl 1467 sec wall-clock (~5.5 sec/fájl avg, dominálva: 3-4 chunk/fájl × 1.5 sec bge-m3 CPU-encode)
  • 0 errors, mind 259/267 fájl ≥1 chunkot kapott (8 fájl 0-chunk: csak frontmatter, no ## section body)
  • Semantic skill search live: vault-search --namespace skills "deploy Next.js to Azure" → top-5 azure-deploy/prepare/hosted-copilot-sdk skill (cosine 0.62-0.65)

B-1 Week 1 — Gold-label baseline ✓ (15 minta)#

  • Source: 43 Quality A session-bullet-jeiből stride-1 extract → 15 jól-formattált bullet (50 target alulteljesítve a session-Learning-formatting heterogenitása miatt)
  • Manuális 4-dim G-Eval címkézés: mind 15 Pass conf 0.80-1.00, reasoning JSONL-ben
  • Distribution-warning: szuk Pass-only baseline → Week 2 szintetikus low-quality példák kellenek (Fail / batch-preview tier)
  • Output: .vault-ko/calibration/sample-15-gold-labeled.jsonl

Learnings → memória#

1. Memgraph CE no-auth + 0 vec-index — Tier-$50 dev OK, de Tier-$200+ MAGE module kell — A B-2/B-4 setup mgclient driver Bolt-protocollal hibátlanul cluster-elhet bge-m3 1024-dim vektorokra, de a vector-similarity-search in-Python cosine scan-en megy (~1000-2000 chunk-ig OK, 977 chunkkal másodperc alatti). >5000 chunk fölött Memgraph MAGE vector_search module kell vagy Memgraph Enterprise.

2. HuggingFace model 404-ek 2026-ban — keep backup-stratégia — A tasksource/deberta-v3-base-nli repo eltűnt (gating vagy törlés), 401 Repository Not Found. Hatás: B-3 sprint dokumentált alap-modellje nem szerezhető be. Megoldás: mindig dokumentálj 2-3 alternatívát az ADR-ben (MoritzLaurer/DeBERTa-v3-base-mnli-fever-anli + cross-encoder/nli-deberta-v3-base + facebook/bart-large-mnli). Plus: HF_TOKEN beállítás magasabb rate-limit-hez.

3. Funkcionális Day-0 visszaigazolás második iteráció — Week 1 jutalom — A B-2 Day 0 (skeleton scripts) MA Week 1 Day 2-3-án csak skeleton→real swap kellett, NEM kezdeti tervezés. A vault-embed/vault-search Day 0-ban már megvolt: argparse, file-traversal, dry-run, chunk-method választás. Real impl 50-100 sor új kód volt a 4 különálló placeholder helyén. Általánosítás: ha Day 0-n complete-shape skeleton van, Week 1 implementation ~5× gyorsabb mint nulláról kezdeni.

4. Subagent-fanout overhead vs serial — 267 fájl tanulság — B-4 batch1-9 (subagent-fanout, frontmatter normalize, no embedding) ~5 perc, B-4 Week 2 (serial bge-m3 embedding) ~24 perc. Tanulság: ha minden fájlhoz nehéz/lassú compute kell (LLM inference), serial loop egy agentben acceptable; ha viszont a per-fájl munka ~30 sec gyors LLM-mutáció, subagent-fanout 5-8× gyorsulást ad. Bge-m3 CPU-inference túl lassú a fanout-pattern előnyéhez (model-loading dominálja).

Next session#

  1. B-2 Week 2 Day 5 — Auto-update cronvault-embed --update-since <ISO> real impl (TODO). Cron 10 percenként vault-autosave mellé, csak módosított fájlokat re-embedolja.
  2. B-2 Week 3 Day 1-2 — load-session-context skill rewrite — MemGPT virtual context. Session-induláskor csak working+top-K (=3) episodic kerül a kontextusba, semantic on-demand vault-search tool-call-lal.
  3. B-1 Week 2 — Szintetikus low-quality példák — 15-20 Fail/batch-preview szintetikus bullet (PII-leak example, generic "today done X", incomplete reasoning), gold-label kibővítve 30-35 mintára, G-Eval prompt v0.2 kalibráció.
  4. B-4 Week 3 — /opt/vault-mcp/ MCP-server build — 8 tool: vault.cypher_query, vault.ko_query, vault.semantic_search, vault.skill_search (read-only auto), vault.add_skill, vault.update_wiki_section, vault.add_decision, vault.crystallize_learning (Critic-review). Node.js/Python döntés Week 3 Day 1.
  5. B-5 Week 1 — vault-nb-sync real impl — projekt-NotebookLM auto-create + source-sync 8 aktív projektre. notebooklm CLI auth már megvan (.notebooklm-venv).
  6. vault-tools audit script bővítéstags taxonomy validation (megengedett tag-set) + trigger_keywords quality (no-generic-words filter). A 267 SKILL.md tag-eloszlás vizsgálatából kiderül melyek a domináns kategóriák.

Propagation log#

2026-05-13 09:15 — Auto-propagation (user-confirmed):

  • L1 (Memgraph CE no-auth + 0 vec-index, in-Python cosine OK <2000 chunk) → APPEND 05-Memory/Infrastructure új sub-section "Vector-search korlátok" (mért latency-tábla 977 chunk-on, eszkalációs trigger 5000 fölött MAGE-module)
  • L2 (HuggingFace 404-ek — model-backup-stratégia) → APPEND 07-Decisions/2026-05-12 sv-7 continuous evaluation arch B-3 ADR NLI Tech-stack szakasz: backup-alternatívák explicit lista (MoritzLaurer + cross-encoder + bart-mnli)
  • L3 (Funkcionális Day-0 visszaigazolás 2. iteráció, Week 1 5× swap-előny) → APPEND 11-wiki/sprint-day-0-skeleton-first "Élő visszaigazolás" szakasza 2. iteráció a B-2 Week 1 példával (~50-60 sor swap vs 5-6× lassabb nulláról)
  • L4 (Subagent-fanout NEM model-loading-dominálta) → APPEND 11-wiki/claude-code-subagent-fanout új "Mikor NE használd" szekció (workload-típus tábla + RAM-overhead-elemzés + SV B-4 mért serial vs fanout)

Új vault-fájlok: 0 (csak append)

Módosított vault-fájlok (5): - 05-Memory/Infrastructure.md (+vector-search korlátok) - 07-Decisions/2026-05-12 sv-7 continuous evaluation arch.md (+NLI backup-alternatívák) - 11-wiki/sprint-day-0-skeleton-first.md (+B-2 visszaigazolás) - 11-wiki/claude-code-subagent-fanout.md (+Mikor NE használd) - 04-Tasks/Backlog.md (4 task ✅: B-2 Day 2+3, B-3 Week 2 Day 1, B-1 Week 1, B-4 Week 2)

Runtime artifacts (Memgraph + filesystem): - 977 Chunk node Memgraph-ban (969 skills + 8 content) - bge-m3 + DeBERTa-v3-mnli cached ~/.cache/huggingface/hub/ - vault-embed.py + vault-search.py + eval-l2-llm-judge.py real-impl - .vault-ko/calibration/sample-15-gold-labeled.jsonl