Kihagyás

Auto-propagation confidence-gate mintázat#

TL;DR#

A crystallization-pipeline NEM minden Learning bullet-et propagál automatikusan — confidence-threshold döntés (shadow=1.0 / conservative=0.95 / aggressive=0.85) eldönti, hogy auto-prop, batch-preview (manual), vagy discard. Cross-source: 19+ fact, 3 source-type. A gate aszimmetrikus: false-positive (rossz propagáció) >> false-negative (manual-review-be esik).

Háttér (3+ source-evidence)#

Mintázat#

Learning bullet ──> G-Eval scoring (LLM-as-judge)
                ┌───────────────┴───────────────┐
                │                                │
        confidence >= threshold        confidence < threshold
                │                                │
                ▼                                ▼
        ┌───────────────┐               ┌──────────────────┐
        │ pre-state git │               │ batch-preview to │
        │ commit + audit│               │ user / discard   │
        │ + atomic write│               │  (Layer 1 hard   │
        │ + Critic-rev. │               │   stop)          │
        └───────────────┘               └──────────────────┘

Aszimmetrikus risk-budget:

Failure mode Cost Mitigáció
False-positive auto-prop (rossz tény bekerül evergreen wiki-be) HIGH Threshold magas + Critic-review + revert-able
False-negative manual-review (jó tény user-elé kerül) LOW User 1 kattintással OK-ézi

Architektúrális szabályok#

  1. Layered eval cascade előzze meg a confidence-számolást ([layered-eval-cascading-pattern]])
  2. Bias-mitigated G-Eval prompt (v0.3, opt-in) — self-enhancement bias-kontroll
  3. Threshold hot-reloadable~/.vault-config/crystallize-threshold.txt ([hot-reload-config-pattern]])
  4. Audit-log append-only minden döntésre ([audit-log-append-only-pattern]])
  5. REAL-mode külön ENV-flagVAULT_CRYSTALLIZE_APPLY=1 VAULT_CRYSTALLIZE_REAL=1 ([env-flag-default-disabled-gate]])
  6. Sandbox-branch defaultcrystallize-sandbox-* branchen futhat REAL, main-en csak VAULT_CRYSTALLIZE_ALLOW_MAIN=1 (CLAUDE.md)
  7. Revert-rate monitor kötelező — vault-crystallize-monitor heti riport

Ramp-protokoll mérés#

Week N → Auto-rate (%)  → Revert-rate (%)  → Threshold-lépés
W21    → ~50%           → <2%               → 1.0 → 0.95 OK
W22-23 → ~62%           → <2%               → 0.95 → 0.90 OK
W24+   → ramp up        → folyamatos        → 0.90 → 0.85 ramp

Buktatók#

  • ⚠️ Confidence-bias — Self-enhancement bias nélkül a threshold de-facto 0.05-tel alacsonyabb; v0.3 bias-mitigated prompt kötelező auto-prop-hoz
  • ⚠️ MIN_VOLUME guard — kis batch (≤3 bullet) NE ramp-eljen; smoketest-noise → false-positive cascade (auto-disable-min-volume-guard)
  • ⚠️ Predicate-dump előbb fix-eld (19.8% generikus has_value) — confidence-score-okat torzítja
  • ⚠️ Per-target threshold — wiki-target lazább, ADR-target szigorúbb (PR-fontosság szerint)

Kapcsolódó#