„Don't Hallucinate, Abstain" — Multi-LLM Collaboration abstain-pattern#

TL;DR#

A „Don't Hallucinate, Abstain" pattern (arXiv:2402.00367) multi-LLM cooperative-vs-competitive framework: ha egy egyetlen modell nem tudja a választ, a hagyományos megoldás konfabulál; ez a pattern explicit „knowledge gap" detection-t épít: 2-3 modell egymás válaszait keresztezi, és ha nem egyezik, az aggregátor inkább ABSTAIN-t ad vissza, NEM kompromisszum-választ. ~19.3% javulás az abstain-pontosságban a baseline-hoz képest.

Háttér (3+ source-evidence)#

sv-08-notebooklm-cognitive-layer — "„Don't Hallucinate, Abstain" (arXiv:2402.00367) Multi-LLM Collaboration framework a NotebookLM synthesis-minőségének auditálására (~19,3% javulás abstain-pontosságban)"
sv-08-notebooklm-cognitive-layer — "Synthesis-minőség evaluation — kooperatív/kompetitív „knowledge gap" tesztelés"
superintelligent-vault-research — multi-LLM consensus-pattern mint NotebookLM eval-réteg
sv-07-continuous-evaluation — abstain-stratégia az LLM-judge bias-ai mellett

Mintázat#

3 fő ötlet kombinációja:

Multi-model query: ugyanaz a kérdés 2-3 különböző modell-családra (Claude + GPT + Gemini, NEM 3× ugyanaz). Ez biztosítja, hogy a self-favoritism torzítás ne dominálja.
Cooperative-vs-Competitive judging: a modellek vagy egyetértésre törekszenek (cooperative — átlagolás, RAG-fúzió), vagy egymást kritizálják (competitive — debate). A pattern azt mutatja: ha competitive módban a 3 modell <2/3 többségben egyezik, valószínűleg knowledge-gap van, és érdemes abstain-elni.
Explicit ABSTAIN-token: a meta-aggregátor output-schema-jában ABSTAIN | LOW_CONFIDENCE | ANSWER 3-state, NEM csak ANSWER | ERROR. A user UI meg tudja jeleníteni, hogy a rendszer tudja, hogy nem tudja.

A vault-kontextusban ez a NotebookLM synthesis-output auditjához használható: 8 párhuzamos subagent (claude-code-subagent-fanout) ugyanazt a research-kérdést kapja, és ha 6/8 nem konvergál, az output ABSTAIN_WITH_DISAGREEMENT-et kap, nem force-pick-et.

Anti-pattern#

2 modell consensus = igazság: 2-ből 2 egyezés nem statisztika. Min. 3 modell, lehetőleg eltérő családból.
ABSTAIN-ot hibaként logolni: ha az ABSTAIN drága incidensként megy a metric-dashboard-ra, az operator nyomást érez, hogy "kapcsolja le" a feature-t. Az ABSTAIN siker, ha a tényleges hallucination-elkerülésért jött.
Cooperative-only (consensus-átlag) production-re: az átlagolás eltünteti a discrepancy-jelet, és a hibás konfidencia-érzetet adja. A competitive (vita-stílusú) mód a hallucination-katcher.
Self-favoritism kompenzálatlan: ha mindhárom modell Claude-családból van, a self-favoritism vissza-tér. Eltérő architektúra/training-data kell.

Reusable szabályok#

3+ eltérő-modell-családú judge (cross-vendor), nem 3× ugyanaz.
Competitive debate-stílus kötelező a final abstain-döntéshez. Cooperative csak proposal-szinten.
ABSTAIN explicit return-state a schema-ban (Answer | Abstain | LowConfidence).
Disagreement-küszöb: <66% multi-model egyezés → ABSTAIN. Per-domain hangolható (medical: 90%, casual: 50%).
ABSTAIN-rate monitoring: ha <2% vagy >25%, valószínűleg a küszöb rosszul van állítva. 5-15% tipikus production-tartomány.
Knowledge-gap reporting: minden ABSTAIN-hez 1-mondatos rationale ("nem találtam evidence-t X-ről") — ez a debugging-jel.

Buktatók#

Cost-explosion: 3 modell-hívás minden query-re = 3× cost. Csak high-stakes kérdésekre, vagy cached-eval baseline-on.
Latency-explosion: párhuzamosítva is a leglassabb modell dominál; ha 1 modell timeout-ol, az egész abstain-decision blokkol — defensive timeout kell.
Self-RAG-zavar: ha a 3 modell ugyanazt a vektor-retrieve-d-context-et kapja, a context maga lehet hallucinált, és nem segít a multi-model. RAG-szinten is multi-retriever kell, ha komolyan veszed.
Tie-break-anomaly: 1 modell ANSWER + 1 ABSTAIN + 1 LOW_CONFIDENCE = ambivalens. Definiálj előre tie-break-rule-t (pl. „bármilyen ABSTAIN → ABSTAIN" majority-vagy precision-prefer).
Cooperative-bias-leak: ha cooperative-mód közben a 3 modell share-eli a köztes válaszait, a 2. modell már anchored az 1.-re. NEM consensus, hanem anchoring. Independent-parallel kötelező a competitive-mode-hoz.

Mikor használd / mikor NE#

Use-case	„Abstain" érdemes?	Miért
High-stakes RAG (orvosi, jogi, pénzügyi)	IGEN	A hibás válasz költségesebb, mint az "nem tudom"
Casual chatbot UI	RÉSZBEN	A user-experience leromolhat 25% ABSTAIN-rate-en
Code-generation	NEM (általában)	A test-suite a jobb gate, nem a confidence-vote
Faktoid-question-answer	IGEN	A faktoid jól-definiált, abstain-érték magas
Creative-writing	NEM	Nincs „helyes válasz", a vote-disagreement zaj

Kapcsolódó#

sv-08-notebooklm-cognitive-layer — NotebookLM eval-architektúra
g-eval-bias-mitigation-pattern — komplementer single-judge bias-szigorítás
nli-hallucination-check-pattern — alternatív/komplementer hallucination-gate
claude-code-subagent-fanout — multi-agent-implementáció parallel-szintű
sv-07-continuous-evaluation — eval-roadmap szélesebb