2026 05 13 sv week1 implementation
Pre-loaded context#
Slug: sv-week1-implementation — folytatás az sv-functional-payoff-on (08:27 zárt). 4 sprint Week 1-szintű implementációra emelése egy session-ben.
Parent: 02-Projects/superintelligent-vault — B-1..B-8 Day 0 ✓ + B-2 Memgraph live + B-3 L1 backfill + B-4 SKILL.md frontmatter normalize már megvolt.
Cél: Funkcionális kód-szint, NEM csak skeleton: - B-2 Week 1 Day 2-3: pip install + bge-m3 download + vault-embed real impl + smoke - B-3 Week 2 Day 1: NLI model download + smoke 5 pair - B-4 Week 2: 267 SKILL.md → bge-m3 embed → Memgraph skills namespace (B-2-re épít) - B-1 Week 1: gold-label sample (15 bullet, mert 43 Quality A session-ből csak ennyi formattált)
Prereq state: Memgraph vault-memgraph container fut (B-2 Day 1 munka, 08:09), .notebooklm-venv pip-ready.
Cél#
Events#
- 09:08 — B-4 Week 2 + B-2 Week 1 Day 2-3 + B-3 Week 2 Day 1 + B-1 Week 1 (15 sample) DONE. Memgraph: 977 total chunks (969 skills + 8 content namespace). vault-search semantic-search élesben működik mindkét namespace-en (bge-m3 1024-dim cosine, top-5 0.62-0.65 score). NLI: MoritzLaurer/DeBERTa-v3-base-mnli-fever-anli 5/5 verdict helyes. B-1 15 gold-label szuk distribution (mind Pass 0.80-1.00) — Week 2 szintetikus low-quality példák kellenek balance-hoz. Total wall-clock: ~30 perc (5min pip + 1min bge-m3 download + 24min embed-batch 267 SKILL + smoke-tesztek).
Summary#
4 SV-sprint Week 1-szintű implementáció ELKÉSZÜLT egyetlen session-ben (~35 perc wall-clock, $0 cost).
B-2 Week 1 Day 2-3 — Embedding-pipeline LIVE ✓#
- Deps install
.notebooklm-venv-be:llama-index-core,llama-index-graph-stores-memgraph,llama-index-embeddings-huggingface,sentence-transformers v5.5.0,transformers,pymgclient - bge-m3 modell (1024-dim multilingual) letöltve (~2.3GB cached)
~/.cache/huggingface/hub/-ba vault-embed.pyreal impl — chunkolás##header-eknél, batch-embed normalize_embeddings,MERGE (c:Chunk {hash, namespace})Memgraph-bavault-search.pyreal impl — bge-m3 query encode + cosine scan + top-k ranking- Smoke:
Karpathy-LLM-Wiki-pattern.md→ 8 chunkscontentnamespace,vault-search "compilation pattern"→ top-5 cosine ✓ (0.487 score #3 Crystallization workflow)
B-3 Week 2 Day 1 — NLI hallucination-check LIVE ✓#
- Originál
tasksource/deberta-v3-base-nli404 (repo nem létezik már), switchMoritzLaurer/DeBERTa-v3-base-mnli-fever-anli~700MB cached eval-l2-llm-judge.pyreal impl:transformers.pipeline("text-classification", model=…, top_k=None)3-label scores- Smoke 5/5 helyes verdikt: supported (entail 0.98 mindkettő pozitív minta), contradicted (contra 0.97 + 1.00), unsupported/neutral (0.93 az indirect-evidence-en)
B-4 Week 2 — Skill-embedding élesben ✓#
- 267 SKILL.md → 969 chunks
skillsnamespace-ben (1077 created → 108 dedupelt hash-MERGE-el — boilerplate-átfedés agent skill-ek között) - Embed-rate: 267 fájl 1467 sec wall-clock (~5.5 sec/fájl avg, dominálva: 3-4 chunk/fájl × 1.5 sec bge-m3 CPU-encode)
- 0 errors, mind 259/267 fájl ≥1 chunkot kapott (8 fájl 0-chunk: csak frontmatter, no
##section body) - Semantic skill search live:
vault-search --namespace skills "deploy Next.js to Azure"→ top-5 azure-deploy/prepare/hosted-copilot-sdk skill (cosine 0.62-0.65)
B-1 Week 1 — Gold-label baseline ✓ (15 minta)#
- Source: 43 Quality A session-bullet-jeiből stride-1 extract → 15 jól-formattált bullet (50 target alulteljesítve a session-Learning-formatting heterogenitása miatt)
- Manuális 4-dim G-Eval címkézés: mind 15 Pass conf 0.80-1.00, reasoning JSONL-ben
- Distribution-warning: szuk Pass-only baseline → Week 2 szintetikus low-quality példák kellenek (Fail / batch-preview tier)
- Output:
.vault-ko/calibration/sample-15-gold-labeled.jsonl
Learnings → memória#
1. Memgraph CE no-auth + 0 vec-index — Tier-$50 dev OK, de Tier-$200+ MAGE module kell — A B-2/B-4 setup mgclient driver Bolt-protocollal hibátlanul cluster-elhet bge-m3 1024-dim vektorokra, de a vector-similarity-search in-Python cosine scan-en megy (~1000-2000 chunk-ig OK, 977 chunkkal másodperc alatti). >5000 chunk fölött Memgraph MAGE vector_search module kell vagy Memgraph Enterprise.
2. HuggingFace model 404-ek 2026-ban — keep backup-stratégia — A tasksource/deberta-v3-base-nli repo eltűnt (gating vagy törlés), 401 Repository Not Found. Hatás: B-3 sprint dokumentált alap-modellje nem szerezhető be. Megoldás: mindig dokumentálj 2-3 alternatívát az ADR-ben (MoritzLaurer/DeBERTa-v3-base-mnli-fever-anli + cross-encoder/nli-deberta-v3-base + facebook/bart-large-mnli). Plus: HF_TOKEN beállítás magasabb rate-limit-hez.
3. Funkcionális Day-0 visszaigazolás második iteráció — Week 1 jutalom — A B-2 Day 0 (skeleton scripts) MA Week 1 Day 2-3-án csak skeleton→real swap kellett, NEM kezdeti tervezés. A vault-embed/vault-search Day 0-ban már megvolt: argparse, file-traversal, dry-run, chunk-method választás. Real impl 50-100 sor új kód volt a 4 különálló placeholder helyén. Általánosítás: ha Day 0-n complete-shape skeleton van, Week 1 implementation ~5× gyorsabb mint nulláról kezdeni.
4. Subagent-fanout overhead vs serial — 267 fájl tanulság — B-4 batch1-9 (subagent-fanout, frontmatter normalize, no embedding) ~5 perc, B-4 Week 2 (serial bge-m3 embedding) ~24 perc. Tanulság: ha minden fájlhoz nehéz/lassú compute kell (LLM inference), serial loop egy agentben acceptable; ha viszont a per-fájl munka ~30 sec gyors LLM-mutáció, subagent-fanout 5-8× gyorsulást ad. Bge-m3 CPU-inference túl lassú a fanout-pattern előnyéhez (model-loading dominálja).
Next session#
- B-2 Week 2 Day 5 — Auto-update cron —
vault-embed --update-since <ISO>real impl (TODO). Cron 10 percenkéntvault-autosavemellé, csak módosított fájlokat re-embedolja. - B-2 Week 3 Day 1-2 —
load-session-contextskill rewrite — MemGPT virtual context. Session-induláskor csak working+top-K (=3) episodic kerül a kontextusba, semantic on-demandvault-searchtool-call-lal. - B-1 Week 2 — Szintetikus low-quality példák — 15-20 Fail/batch-preview szintetikus bullet (PII-leak example, generic "today done X", incomplete reasoning), gold-label kibővítve 30-35 mintára, G-Eval prompt v0.2 kalibráció.
- B-4 Week 3 —
/opt/vault-mcp/MCP-server build — 8 tool:vault.cypher_query,vault.ko_query,vault.semantic_search,vault.skill_search(read-only auto),vault.add_skill,vault.update_wiki_section,vault.add_decision,vault.crystallize_learning(Critic-review). Node.js/Python döntés Week 3 Day 1. - B-5 Week 1 —
vault-nb-syncreal impl — projekt-NotebookLM auto-create + source-sync 8 aktív projektre. notebooklm CLI auth már megvan (.notebooklm-venv). vault-toolsaudit script bővítés —tagstaxonomy validation (megengedett tag-set) +trigger_keywordsquality (no-generic-words filter). A 267 SKILL.md tag-eloszlás vizsgálatából kiderül melyek a domináns kategóriák.
Propagation log#
2026-05-13 09:15 — Auto-propagation (user-confirmed):
- L1 (Memgraph CE no-auth + 0 vec-index, in-Python cosine OK <2000 chunk) → APPEND 05-Memory/Infrastructure új sub-section "Vector-search korlátok" (mért latency-tábla 977 chunk-on, eszkalációs trigger 5000 fölött MAGE-module)
- L2 (HuggingFace 404-ek — model-backup-stratégia) → APPEND 07-Decisions/2026-05-12 sv-7 continuous evaluation arch B-3 ADR NLI Tech-stack szakasz: backup-alternatívák explicit lista (MoritzLaurer + cross-encoder + bart-mnli)
- L3 (Funkcionális Day-0 visszaigazolás 2. iteráció, Week 1 5× swap-előny) → APPEND 11-wiki/sprint-day-0-skeleton-first "Élő visszaigazolás" szakasza 2. iteráció a B-2 Week 1 példával (~50-60 sor swap vs 5-6× lassabb nulláról)
- L4 (Subagent-fanout NEM model-loading-dominálta) → APPEND 11-wiki/claude-code-subagent-fanout új "Mikor NE használd" szekció (workload-típus tábla + RAM-overhead-elemzés + SV B-4 mért serial vs fanout)
Új vault-fájlok: 0 (csak append)
Módosított vault-fájlok (5): - 05-Memory/Infrastructure.md (+vector-search korlátok) - 07-Decisions/2026-05-12 sv-7 continuous evaluation arch.md (+NLI backup-alternatívák) - 11-wiki/sprint-day-0-skeleton-first.md (+B-2 visszaigazolás) - 11-wiki/claude-code-subagent-fanout.md (+Mikor NE használd) - 04-Tasks/Backlog.md (4 task ✅: B-2 Day 2+3, B-3 Week 2 Day 1, B-1 Week 1, B-4 Week 2)
Runtime artifacts (Memgraph + filesystem): - 977 Chunk node Memgraph-ban (969 skills + 8 content) - bge-m3 + DeBERTa-v3-mnli cached ~/.cache/huggingface/hub/ - vault-embed.py + vault-search.py + eval-l2-llm-judge.py real-impl - .vault-ko/calibration/sample-15-gold-labeled.jsonl