# Miért nem emlékezet a RAG: a visszakeresés és az emlékezés különbsége

**Sorozat**: Az amnézia probléma (B.2)
**Megjelenés**: 2026-05-10
**Szerző**: Peres Levente
**Olvasási idő**: ~13 perc
**Nyelv**: EN / HU (kétnyelvű)

---

A bemutatón az AI „emlékezik”. Éles üzemben csak előkeres. A különbség nem akadémiai — tokenekben, téves válaszokban és bizalomban kerül pénzbe, és minden egyes alkalommal újra kifizetjük, amikor összekeverjük a kettőt.

## A bemutató és az éles üzem szakadéka

A pre-sales mérnök megnyit egy chat-ablakot, és begépeli: „Jegyezd meg, hogy a metrikus mértékegységet kedvelem.” A rendszer válaszol: „Megjegyezve.” Öt perccel később, ugyanazon a bemutatón, egy követő kérdésre helyesen, metrikusban válaszol. A teremben mindenki bólint. A szerződés megy a maga útján.

Három hónap múlva ugyanez a termék éles üzemben fut. Egy felhasználó frissíti a beállítását. A következő válaszban a régi és az új preferencia *ugyanabban a bekezdésben* szerepel. Egy másik felhasználó — teljesen más fiók — feltesz egy független kérdést, és olyan választ kap, amelyben halkan ott motoszkál az első felhasználó beállítása. Az ügyfélszolgálat eszkalál. A gyártó elmagyarázza, hogy a rendszer „releváns kontextust keres vissza”, és hogy az „időnkénti következetlenségeket” a következő release fogja kezelni.

A rendszer pontosan azt csinálja, amire építették. A rendszert sosem építették emlékezésre. Visszakeresésre építették. A kettő összemosása a 2026-os vállalati AI egyik legdrágább félreértése, és van neve: **RAG**.

## Mit csinál valójában a RAG

A Retrieval-Augmented Generation — a RAG — egy minta, nem egy emlékezetrendszer. A minta annyi: amikor a modellnek válaszolnia kell, megnéz egy vektor-tárat, kiválaszt néhány, a kérdéshez szemantikailag legközelebbi szövegrészletet, beilleszti a promptba, és onnan a modell dolgozik tovább.

A RAG hasznos. Lehorgonyozza a modellt a saját dokumentumainkban. Csökkenti a hallucináció bizonyos típusait. Skálázódik. Statikus referenciaanyaghoz — termékkézikönyvhöz, jogszabályszöveghez, tudásbázis-cikkhez — ez a megfelelő eszköz, és immár az alapeszköz is.

Amit a RAG **nem**: állapot. A RAG csak **olvas**. Nincs API, amin keresztül a modell visszaírhatna. Nincs olyan fogalom, hogy „ez a tény mostantól igaz, az a korábbi tény pedig már nem”. Nincs nyilvántartás arról, mit tanult a modell a beszélgetés során, nincs mód a preferenciák frissítésére, nincs mechanizmus, amelyre az egyik munkamenet építhetne a másik fölé. Minden lekérdezést úgy válaszol meg, mintha aznap reggel nullá­ról ébredt volna.

A 2026-os szakmai konszenzus, ami az akadémián és az iparban összeállt, egyetlen jól terjedő mondatba sűríthető: **a RAG a padló, nem a plafon.** Ahonnan elindulunk. De nem amire a termelési AI ágenseknek ténylegesen szükségük van.

## Mit jelent valójában az „emlékezet”

A kognitív tudomány régóta tudja, hogy az emlékezet nem egyetlen dolog. Van **szemantikus emlékezet** — általános tények a világról, az, ami egy tankönyvben áll. Van **epizodikus emlékezet** — konkrét események, kontextussal, sorrenddel, kimenetelekkel; az, ami egy személyes naplóban áll. És van **procedurális emlékezet** — készségek és szokások, amelyek úgy alakítják a viselkedést, hogy nem is gondolunk rájuk tudatosan.

A RAG elsősorban a szemantikus emlékezet egy szeletét célozza — pontosabban azt a részét, amit valaki már leírt. Az epizodikus és a procedurális emlékezet — pont az a kettő, ami egy *tanulni képes* ágenst megkülönbözteti egy pusztán *informált* ágenstől — hiányzik.

Egy működő emlékezetrendszerben — abban az értelemben, ahogyan a 2026-os szakirodalom használja a kifejezést — öt dolog van, ami a RAG-ból nem:

1. **Írási útvonalak.** Az új információ kontrollált módon kerül be a tárba. A rendszer észleli az ellentmondásokat. A régi tényeket a rendszer felülírja — de szándékosan, követhetően, nem csendesen.
2. **Reflexió és konszolidáció.** Az események sorozatából a rendszer újrahasznosítható mintákat desztillál — ez az ágens megfelelője annak, hogy „azt vettem észre, hogy ez a felhasználó mindig a késleltetésről kérdez, mielőtt az áteresztőképességhez érne”.
3. **Felejtés és elhalványulás.** Vannak tények, amiknek lejárati idejük van. Egy működő emlékezetrendszer tudja, mi az, hogy „ez most aktuális” és mi az, hogy „ez három negyedéve volt igaz”.
4. **Kormányzás (governance).** Eredet, hatókör, naplózás, törlés-ellenőrzés. Ugyanazok az alap-építőkövek, amelyek minden szabályozott tudásrendszerben évtizedek óta megvannak.
5. **Futási idejű tanulás.** A következő munkamenet nem az első munkamenet. Az ágens viselkedése azért változik, mert *megjegyezte*, amit korábban tapasztalt — nem csak azért, mert vissza tudja keresni.

A legrövidebb megfogalmazás: **a RAG visszakeres, az emlékezet emlékezik.** A visszakeresés passzív — ugyanaz a kérdés ugyanazokat a szövegrészleteket adja vissza, függetlenül attól, ki kérdezi, mi változott, mit tanult a rendszer múltkor. Az emlékezés aktív — a rendszer karbantart és frissít egy folyamatosan fejlődő modellt arról, hogy mit tud, ki mondta, és mikor szűnt meg igaz lenni.

## Hogyan jön elő a szakadék éles üzemben

Az amnézia tüneteit ismerik mindazok, akik egynegyedévnél tovább üzemeltettek nem-triviális AI rendszert:

- **Preferencia-csúszás.** A felhasználó átállít egy beállítást. A modell a következő lekérdezésnél a régi és az új verziót egyaránt visszahozza. Mindkettő „releváns” koszinusz-hasonlóság szerint. A válaszban mindkettő benne van.
- **Munkamenetek közötti felejtés.** A felhasználó múlt héten elmagyarázta a projekt feltételeit. Ezen a héten újra elmagyarázza. Az ágens nem mondja, hogy „ezt korábban már említetted”. Nem tudja, hogy említetted.
- **Felhasználók közötti átszivárgás.** Egy visszakeresés betölt egy szövegrészletet egy másik felhasználó beszélgetéséből, mert a beágyazások véletlenül közel kerülnek. Az új felhasználó olyan választ kap, amelyben olyan információ szerepel, amit ő sosem adott meg. (Nem hipotézis: 2026-os klinikai és munkahelyi adathalmazokon végzett kutatás 57–71% felhasználók közti szennyeződést mért jóindulatú multi-ágens munkafolyamatokon, és a hibás válaszok 84%-a magabiztosnak tűnt.)
- **Elavult tények aktuálisként szolgáltatva.** Egy dokumentum márciusban indexelődött. A benne állított tény áprilisban változott. A vektor-index erről nem tud. A modell ugyanolyan magabiztossággal mondja a márciusi választ, mint amilyennel a maival szolgálna.
- **Több-lépéses összeomlás.** A kérdés megválaszolásához két, egymással szemantikailag *nem* hasonló, de mindkettő releváns információdarabot kellene összekapcsolni. A RAG vagy csak az egyiket találja meg, vagy mindkettőt megtalálja, de összefüggéstelen szövegrészletekként. A szintézis elromlik.
- **Token-felfúvódás az újrakontextualizálásból.** Minden új munkamenet azzal kezdődik, hogy az ágensnek újra elmondják, miről van szó. Minden vállalati AI-számla mérhető hányada — a friss benchmarkok 60 és 80 százalék közé teszik a hosszan futó munkafolyamatokon — annak az ára, hogy az ágenseknek elmondják azt, amit emlékezniük kellene.

A sorozat nyitódarabja, [Az újrafelfedezés ára](/blog/the-rediscovery-tax/), erre a költségre adott nevet a szervezeti szinten. A RAG-mint-emlékezet az a műszaki mechanizmus, amelyen keresztül az újrafelfedezés árát minden ágens-hívásnál újra megfizetjük.

## Öt hallucinációs minta, ami kifejezetten a RAG-mint-emlékezetből jön

A hallucinációról gyakran úgy beszélünk, mintha egyetlen jelenség volna. Pedig nem az. Amikor a RAG-ot emlékezetként használjuk, öt különálló hibatípus jelenik meg, mindegyiknek megvan a maga aláírása:

1. **Kontextus-szennyeződés.** A visszakeresett szövegrészletek ellentmondanak egymásnak. A modell úgy oldja fel az ellentmondást, hogy kitalál egy szintézist, amely egyiket sem elégíti ki.
2. **Időbeli magabiztosság-felfúvódás.** A visszakeresett szövegrészlethez nem tartozik érvényességi időablak. A modell aktuálisként mutatja be, mert visszakerült — és mert a promptban semmi sem mond mást.
3. **Részlet-szintézis kudarc.** A felső k visszakeresett részlet pontos töredékeket tartalmaz. Az elbeszélés, amit a modell ezekből épít, nem pontos — a kötőanyag találmány.
4. **Eredet elvesztése.** A modell nem tudja megkülönböztetni, hogy „ez a hivatalos belső kézikönyvből van” vagy hogy „ez egy gyakornok által negyedévvel ezelőtt feltöltött piszkozatból”. Mindkettő szövegként érkezik a promptba.
5. **Egylövéses személyre szabási kudarc.** A felhasználóra vonatkozó releváns tény epizodikus — valami, *ami történt*, nem valami, *ami a témáról szól*. A koszinusz-hasonlóság nem hozza fel. Az ágens úgy válaszol, ahogy bárki másnak válaszolna.

A jogi AI hallucinációs aránya — kereskedelmi, retrieval-augmented architektúrájú rendszereken 17 és 33 százalék között mérve — jelentős részben pontosan ezt a mintát mutatja. A visszakeresés csökkentett egy hallucináció-osztályt, és láthatóvá tett egy másikat.

## Amit a 2026 már épített a szakadék zárására

A jó hír: a szakadék elég régóta látszik ahhoz, hogy mára létezzen egy valódi termékkategória — a vektor-tár-mint-emlékezet mintától elkülönülve. A vezető rendszereket érdemes név szerint ismerni, mert mindegyik más-más architekturális döntése világítja meg, mit is igényel valójában az emlékezet.

- **Mem0**: az emlékezetet felhasználó/ügynök/munkamenet hatókörű atomi tényekként és preferenciákként kezeli. Az írás pillanatában LLM-pipeline kivonatol, deduplikál és frissít — így a második alkalommal, amikor a felhasználó „metrikust kedvelek”-et mond, a tárban nem két bejegyzés keletkezik. Hibrid vektor + gráf + kulcs-érték tárolás. A jelenlegi mezőny legszélesebb ipari elterjedtsége.
- **Zep**, a nyílt forráskódú Graphiti motorra építve: az emlékezetet *időbeli* tudásgráfként kezeli. Az epizódok elsőosztályú objektumok. Minden tény hordoz egy „érvényes-ettől” és egy „érvényes-eddig” jelölést, az ellentmondásokat pedig felülírás helyett *felülrétegezéssel* kezeli — a régi verzió lekérdezhető marad, csak felülrétegzettként van megjelölve. Ez az, amit a kétidős (bi-temporális) modellezés a gyakorlatban jelent.
- **Letta** (a korábbi MemGPT projekt): magát az ágenst teszi az emlékezet kezelőjévé. Tartós alapblokkok (személyiség, célok) folyamatosan a promptban élnek; a *recall* tár a kereshető előzményt tartalmazza; az archív tár a hosszabb távú anyagot. Az ágens *eszközöket* használ ahhoz, hogy az emlékezetet ki- és belapozza a saját kontextusába.
- **Cognee**: strukturált tudásgráfok építésére fókuszál strukturálatlan és multimodális forrásokból — közelebb áll egy emlékezet-tudatos beillesztési pipeline-hoz, mint egy beszélgetés-tárhoz, de erős intézményi tudás esetében.
- **MemPalace**: a filozófiai ellenpólus. Mindent tárolj el szó szerint, térben szervezett hierarchiában (szárnyak / termek / szobák), és a visszakeresés majd megtalálja, ami számít. A tét: az agresszív LLM-oldali kivonatolás minőséget veszít.
- **A-MEM**: kutatási irány (NeurIPS 2025), amelyben az ágens maga szervezi az emlékezetet — Zettelkasten-ihletésű hálózatba kapcsolódó atomi jegyzetekbe, amelyeket folyamatosan bővít és átszerkeszt.

Ezek nem a RAG kisebb variánsai. Egy más architekturális tét: hogy az emlékezet **„írás majd olvasás”** — komoly munka történik az írási lépésnél (kivonatolás, deduplikáció, ellentmondás-feloldás, érvényesség kijelölése), hogy az olvasási lépés gyors, többstratégiás és bizalomra méltó lehessen.

## Az öt minta, ami alapkövetelmény lett

Aki elég ideig nézi a 2026-os mezőnyt, észrevesz egy konvergenciát. Öt minta jelenik meg eredetileg egymástól függetlenül tervezett rendszerekben:

1. **„Írás majd olvasás”.** A nehézségek a beillesztésnél vannak — kivonatolás, strukturálás, reflexió —, hogy az olvasások gyorsak legyenek, és több stratégiát kombinálhassanak (szemantikus vektor + gráfbejárás + időbeli + kulcsszavas + újrarendezés).
2. **Az események mint elsőosztályú objektumok.** Az epizódok — *mi történt, mikor, mi változott* — objektumként tárolódnak, nem csak szövegrészletekként.
3. **Hibrid gráf + vektor.** A pusztán vektoros tárolás már nem state-of-the-art. A gráfok a relációkat, az időbeli lekérdezéseket és a precíz kereséseket kezelik; a vektorok a fuzzy szemantikus hasonlóságot. A vezető rendszerek többsége mindkettőt használja, és sokan még egy kulcs-érték vagy relációs réteget is hozzátesznek a strukturált mezőkhöz.
4. **Kétidős érvényesség és ellentmondás-kezelés.** Tényenként két időbélyeg — mikor lett igaz a világban, és mikor szerzett róla tudomást a rendszer —, felülrétegezéssel, nem felülírással. A naplóbejegyzés a hivatalos rekord.
5. **Reflexiós rétegek.** Az epizódok periódikus konszolidációja magasabb szintű mintákká. A minta közvetlenül leszármazott a 2023-as Generative Agents tanulmányból, és ma valamilyen formában megjelenik szinte minden komoly éles rendszerben.

Vegye észre, mi az, ami *még nem* alapkövetelmény: a **kormányzás**. A naplózás, a hatókör-kezelés, a szerep-alapú hozzáférés, a humán felülvizsgálat — amik a szabályozott iparágakban evidenciák — az emlékezetrendszerek többségében még mindig egyedi fejlesztések. Erről a hiányról szólt [A bizalmi lánc problémája](/blog/the-trust-chain-problem/), és ennek a hiánynak a multi-ágens vetületéről [A 3. fázis problémája](/blog/the-phase-3-problem/). A RAG-mint-emlékezet az alap, amin ezek a hiányok nyugszanak. Lecserélni valódi emlékezetre — ez az előfeltétele annak, hogy a többit egyáltalán be lehessen zárni.

## Mit jelent ez a vásárlónak

Ha az ön szervezete 2026-ban „emlékezettel rendelkező AI”-ajánlatot mérlegel, a kérdés nem az, hogy van-e a rendszerben emlékezet. Ezt szinte mindenki állítja. A kérdés, amit fel kell tenni, az emlékezet *alakjáról* szól.

- **Hol van az írási útvonal, és ki ellenőrzi?** Egy írási jogosultság nélküli rendszer nem emlékezet. Egy jegyzetfüzet, amibe bárki firkálhat.
- **Hogyan oldódnak fel az ellentmondások?** Felülírás, felülrétegezés, vagy „mindkettő benne marad, és reméljük, a prompt majd elrendezi”? Csak a második válasz tartós.
- **Van-e *érvényességi idő* a *létrejöttkori* időbélyegen kívül?** Ha nincs, minden tény aktuálisnak minősül. A valóság nem így működik.
- **Mi a felejtés egysége?** Egy sor, egy dokumentum, egy tény, egy kapcsolat? És ellenőrizhető-e a felejtés, vagy csak egy jelölés, amit a visszakeresés időnként mégis visszahoz?
- **Ki mit lát?** A hatókör nélküli emlékezet kiszivárgásra váró emlékezet.
- **Hol végződik az ágens, és hol kezdődik az emlékezetrendszer?** Az ágens-vezérelt emlékezet (Letta, A-MEM) önállóságot ad cserébe késleltetésért. A rendszer-vezérelt emlékezet (Mem0, Zep) működési átláthatóságot ad cserébe önállóságért. Egyik sem rossz. A választás legyen tudatos.

Éles üzemben ezek a rendszerek ritkán állnak egymagukban. A nyerő minta réteges: vékony ágens-oldali jegyzetfüzet a futási állapothoz, rendszer-oldali emlékezet-tár a kormányzott intézményi tudáshoz, RAG a statikus referenciaanyaghoz, ami nem fejlődik. Az egész réteget hívni „emlékezetnek” rendben van. Egyedül a RAG-ot „emlékezetnek” hívni nincs.

## A beszélgetés, amit már folytatunk

A sorozat, amelyhez ez a cikk tartozik, abban szokatlan, hogy őszintén beszél arról, melyik problémát oldja meg az ipar éppen ténylegesen. [Az újrafelfedezés ára](/blog/the-rediscovery-tax/) az állapot nélküli ágensek költségére adott nevet. [A bizalmi lánc problémája](/blog/the-trust-chain-problem/) az intézményi szintű kormányzási vákuumra. [Az árnyékemlékezet](/blog/shadow-memories/) arra, mi történik, amikor az emlékezet láthatatlanul gyűlik a szervezetben. [A 3. fázis problémája](/blog/the-phase-3-problem/) arra, mi történik, amikor ezek az emlékezetek kezdenek átnyúlni az ágensek között.

Mindegyik cikk feltételezett valamit, amit ez a mostani teszi explicitté: amit a vállalatok többsége ma „emlékezetnek” hív, az nem emlékezet. Visszakeresés. Az eltérés a forrása az újrafelfedezés árának, a bizalmi lánc hézagjának, az árnyékemlékezet halmozódásának és a multi-ágens szennyeződési láncolatnak. A szakadék lezárása nem opcionális. Ez a vállalati AI következő két évének munkája.

Ezt a gyakorlatból mondjuk, nem elméletből. Olyan rendszereket építünk, amelyek komolyan veszik a megkülönböztetést, és láttuk, mi történik a működési költséggel és a bizalmi felülettel akkor, amikor az ágensek alatti alap megszűnik egy magabiztos hangú vektor-tár lenni.

Ha az ön szervezete „emlékezettel rendelkező AI”-ajánlatokat mérlegel — vagy maga épít ilyet —, és a vásárlói szakaszban felsorolt kérdések azok a kérdések, amelyekre a gyártótól szerette volna a választ, szívesen meghallgatnánk. Lehet, hogy van valami, amit megmutathatunk.

---

**Sorozat**: [Az újrafelfedezés ára (B.1)](/blog/the-rediscovery-tax/) → Miért nem emlékezet a RAG (B.2) → [A bizalmi lánc problémája (B.4)](/blog/the-trust-chain-problem/) → [Az árnyékemlékezet (B.5)](/blog/shadow-memories/) → [A 3. fázis problémája (B.6)](/blog/the-phase-3-problem/).
**Kapcsolódó**: [Tervezés minden értelemnek (C.3)](/blog/designing-for-all-intelligences/) · [A partnerségi paradigma (C.1)](/blog/the-partnership-paradigm/)

*Peres Levente, 2026. ICS - Sheridan. https://sheridan.hu/blog/why-rag-isnt-memory/*
