# Miért teljesít rosszabbul az AI délután háromra: a context rot és a hosszú munkamenet határai

**Sorozat**: Együttműködés az AI-val (C.4)
**Megjelent**: 2026-06-27
**Szerző**: Peres Levente
**Olvasási idő**: ~13 perc
**Nyelv**: EN / HU (kétnyelvű)

---

Délután háromkor mindannyian lassabbak vagyunk egy kicsit. Furcsa belegondolni, de a mesterséges intelligenciával is történik valami hasonló — csak egészen más okból. Reggel az asszisztens éles: követi a gondolatmenetet, fejben tartja a részleteket, pontosan arra válaszol, amit kérdeztünk. Órákkal később, ugyanabban a hosszú beszélgetésben valami megcsúszik. Ellentmond egy döntésnek, amit egy órája lezártunk. Újra előáll egy ötlettel, amit már elvetettünk — ugyanazzal a lelkesedéssel, mint először. Elkever egy számot, amit kétszer is megadtunk. Semmi sem fagyott le. Hibaüzenet sem jött. A modell egyszerűen, csendben egyre rosszabb lett a munkamenet során.

Nem fáradt el. Nincs délutánja, nincs vércukra, nincs akaratereje, ami kimerülhetne. Ami történt, az gépiesebb — és ha egyszer meglátjuk, sokkal kiszámíthatóbb: a működő kontextusa megtelt magával a beszélgetéssel, és a jel, ami fontos volt, elveszett minden más zajában, ami időközben elhangzott. A szakma erre azt mondja: context rot, vagyis a kontextus fokozatos eróziója. 2026-ban ez az egyik leghasznosabb dolog, amit egy intenzív AI-használó megérthet — mert abban a pillanatban, hogy megértjük, ki is tudjuk kerülni.

## A zseniális tanácsadó, akinek sosem pakolják le az asztalát

Képzeljük el a legélesebb eszű tanácsadót, akivel valaha dolgoztunk. Reggel kilenckor tiszta az asztal, friss a feladat, és minden válasz pontos. Aztán telik a nap. Minden e-mail, minden vázlat, minden elvetett ötlet, minden „ezt inkább felejtsd el" rákerül az asztalra — és ott is marad. Senki nem pakol le. Délutánra a tanácsadó még mindig zseniális, de már egy olyan asztal fölött dolgozik, amelyet órák papírhalma borít, fele már túlhaladott, némelyik egymásnak ellentmond, és az a bizonyos reggeli, döntő cetli ott lapul valahol a kupacban.

Most kérdezzünk valamit — a válasz lassabban és bizonytalanabbul érkezik. Nem azért, mert a tanácsadó elfelejtett gondolkodni, hanem mert a megfelelő lapot megtalálni száz fölösleges között lett a nehéz rész. Az értelem érintetlen. A visszakeresés fuldoklik.

Pontosan így néz ki egy hosszú AI-munkamenet belülről. A modell kontextusablaka — az eddigi beszélgetés teljes, folyó átirata — ez az asztal. A nagy nyelvi modelleknek nincs külön, rendezett memóriájuk, amelyhez fordulnának; minden egyes válasznál újraolvassák az egész asztalt. Minél tovább beszélgetünk, annál nagyobb kupacot kell átolvasniuk, hogy válaszoljanak — és annál nagyobb része ennek a kupacnak már nem a lényeg.

## A jelenségnek már neve is van: context rot

Sokáig ez amolyan tapasztalati tudás volt — a gyakorlott felhasználók tanácsokat cseréltek arról, hogy „kezdj új beszélgetést, ha furcsulni kezd", de nem volt mire hivatkozniuk. Ez 2025 júliusában változott meg, amikor a Chroma kutatói közzétettek egy tanulmányt a találó *Context Rot: How Increasing Input Tokens Impacts LLM Performance* címmel. Tizennyolc vezető modellt futtattak végig — a GPT, a Claude, a Gemini és a Qwen családból —, és olyasmit találtak, aminek át kellene formálnia, ahogyan bárki a hosszú beszélgetésekre gondol: a modellek nem egyenletesen használják a kontextusukat. A teljesítményük egyre megbízhatatlanabb lesz, ahogy a bemenet hosszabbodik — és nem csak a nehéz feladatoknál. Megjelent olyan feladatoknál is, amelyek rövid hosszon szinte triviálisak: egy releváns mondat megtalálásánál vagy egy szövegrész szó szerinti visszaadásánál.

Két részlet megjegyzésre érdemes ebből. Először: a romlás fokozatos, és korán elkezdődik — jóval azelőtt, hogy elérnénk az ablak hirdetett határát. Másodszor: legalább annyira számít, *mi* tölti meg a kontextust, mint az, hogy mennyi. Amikor a fölösleges szöveg témájában hasonló volt ahhoz, amit kerestünk, esett a legnagyobbat a pontosság — mert épp a majdnem-találatokat nehéz a modellnek megkülönböztetnie. Egy beszélgetés, amely végig „témánál marad", paradox módon az egyik legrosszabb eset lehet, mert benne minden hihetően relevánsnak látszik.

Itt forog a fejünkben fordítva a dolog. A veszély nem az, hogy kifogyunk a helyből. Hanem hogy jóval azelőtt, hogy kifogynánk, a hely megtelik zavaró tényezőkkel.

> Az AI nem felejtett. Maga alá temette a saját beszélgetése — és a reggel lényege ott lapul valahol a kupacban.

## A közepén vész el minden

Van egy másik, régebbi eredmény, amely tetézi az előzőt. Még 2023-ban egy emlékezetes című tanulmány — *Lost in the Middle* — megmutatta, hogy a modellek a hosszú bemenet elejére és végére figyelnek a legjobban, a közepére a legkevésbé. Ha a döntő tényt az első vagy az utolsó bekezdésbe tesszük, megbízhatóan felhasználja; ha egy hosszú kontextus közepébe temetjük, a pontosság leszakadhat. Ennek a figyelmi görbének U alakja van, és makacsul túlélte az óriási kontextusablakok korszakát is.

Aztán 2025 elején egy NoLiMa nevű benchmark kézzelfoghatóvá tette a szakadékot, méghozzá úgy, hogy nehéz utána nem észrevenni. Ahelyett, hogy kulcsszóegyezéssel kerestetett volna meg egy mondatot — ami könnyű, és amit a marketinges mérések többsége mér —, egy apró következtetést kívánt a modelltől, hogy összekösse a kérdést a válasszal, ahogy a valódi munka is teszi. A teljesítmény jóval hamarabb omlott össze, mint amit az adatlapok sugallnak. A vizsgált modellek többsége nagyjából 32 000 tokennél a rövid kontextusú pontosságának fele alá esett — a hirdetett kapacitásuk töredékénél. Egy vezető modell, amely rövid bemeneten 99% fölött teljesített, mintegy 70%-ra esett 32 ezer tokennél.

A gyakorlati fordítás: a dobozon szereplő szám — „200K kontextus!", „1M kontextus!" — az asztal mérete, nem pedig annak a résznek a mérete, amelyet a modell egyszerre fókuszban tud tartani. A *tényleges* működő kontextus, az a rész, ahol a gondolkodás megbízható marad, jóval kisebb a hirdetettnél. A nagy számot tekintsük tartaléknak, ne ígéretnek.

## Ez nem felejtés, hanem interferencia

Érdemes pontosnak lenni a mechanizmust illetően, mert a megoldás ebből következik. A modell nem úgy „felejti el" a korábbi köröket, ahogy az ember elfelejt egy nevet. Minden ott van még az átiratban. A baj az interferencia, és több irányból érkezik egyszerre.

A figyelem véges keret. Minden körben a modell egy rögzített mennyiségű „fókuszt" oszt szét mindenen, ami a kontextusban van. Ha több szöveg kerül bele, mindegyik vékonyabb szeletet kap. A reggeli döntő mondat még jelen van, de most már több ezer szóval verseng a figyelemért, amely időközben érkezett — a figyelem pedig majdnem zéró összegű játék.

A régi és elvetett anyag tovább szavaz. Az ötlet, amit egy órája elvetettünk, még mindig az átiratban van, a modell minden körben újraolvassa, és még mindig maga felé tereli. A javításaink nem törlik azt, amit javítottunk; ott ülnek *mellette*. Minél hosszabb a munkamenet, annál több egymásnak ellentmondó szavazat gyűlik össze, és annál jobban inog a modell köztük.

A modell a saját kimenetére épít. Minden, amit kimond, része lesz a kontextusnak, amelyet utána olvas. Ha egy órája kicsit elcsúszott, ez az elcsúszás most már bizonyíték, amellyel a további elcsúszást igazolja. A kis hibák nem csupán megmaradnak; fel is halmozódhatnak, mert a modell a saját korábbi szavait megállapított tényként kezeli.

Mindez nem hiba, amit a következő kiadásban kijavítanak. Az architektúra működésének következménye. Épp ezért a válasz nem az, hogy „várjunk egy jobb modellre" — hanem hogy rendben tartsuk az asztalt.

## Nem old meg mindent egy nagyobb ablak?

Ez a kézenfekvő ellenvetés, és az őszinte válasz az, hogy nem — a nagyobb ablak elhalasztja a problémát, és csendben ronthat is rajta. A Chroma vizsgálata a legnagyobb elérhető ablakokat is tesztelte, és még mindig romlást látott a kapacitás töredékénél: komoly megcsúszást több tízezer tokennél egy sokszor akkora ablakban. A nagyobb kontextus nem ad a modellnek több *fókuszt*; a beszélgetésnek ad több helyet, hogy zajt halmozzon, mielőtt bárki észrevenné.

Csábító „milliós token-délibáb" lakik a marketingben: ha elég nagy az ablak, biztos elég mindent belezúdítani, és a modell majd kibogozza. Az elmúlt két év bizonyítéka az ellenkezőjét mondja. Épp a mindent-belezúdítás váltja ki a rothadást. A több hely több hely a zavaró tényezőknek is — és a plusz tokeneket késleltetésben és költségben fizetjük meg, miközben a válaszaink *kevésbé* lesznek megbízhatók, nem jobban.

Az ablak mérete plafon, nem stratégia.

## Jogos-e a „délutáni fáradtság" hasonlat?

A délutáni holtpont hasonlata hasznos — és érdemes őszintének lenni abban is, hol sántít. A *görbe* leírásaként — reggel friss és éles, tartós terhelés után pongyolább és hibázósabb — valóban jól illik, és 2026-ban már egy kutatási cikk is a „kognitív fáradtság" nyelvét kölcsönzi, hogy leírja, ahogy ezek a modellek egy hosszú generálás során leromlanak. Az emberek azonnal felismerik a formát, és épp ezért jó módja annak, hogy beszéljünk róla.

De az ok nem az emberi, és ha úgy teszünk, mintha az lenne, rossz döntésekhez vezet. A mi délutáni holtpontunk biológiai: cirkadián ritmus, vércukor, valódi fáradtság. A modellben semmi ilyen nincs. A romlása determinisztikus interferencia: vékonyra osztott figyelem, pozíciófüggő torzítás, felgyűlt ellentmondások, önmagára épülő gondolatmenet. (Még az emberi oldal is vitatott; a népszerű elképzelés, hogy az akaraterő egy kifogyó üzemanyag, nem állta jól a tudományos próbát.) A hasonlatot tehát arra használjuk, hogy *észrevegyük* a bajt — „késő van már ebben a beszélgetésben, valószínűleg romlik" —, de a gépi magyarázathoz nyúljunk, amikor eldöntjük, mit tegyünk. A modellnek nem adhatunk egy kávét. Az asztalát viszont lepakolhatjuk.

## Mit tehetünk valójában ellene?

Itt jön a jó hír, és az ok, amiért ezt érdemes megérteni, nem csak elszenvedni: minden egyes hibamódra van gyakorlati, gyártófüggetlen ellenszer, és egyikhez sem kell senki következő kiadására várni.

- **Dolgozzon fókuszált munkamenetekben, ne maratonban.** Egyetlen beszélgetés, amely egy egész projektet próbál cipelni, a rothadás ideális táptalaja. Bontsa a munkát világosan körülhatárolt feladatokra. A tiszta kontextus éles kontextus.
- **Kezdjen újat — szándékosan —, és adjon át egy összefoglalót.** Amikor a válaszok inogni kezdenek, a legolcsóbb megoldás egyben a leginkább meglepő is: nyisson új beszélgetést. De ne nulláról induljon. Vigyen tovább egy rövid, tudatos összefoglalót arról, mi dőlt el és miért — a következtetéseket, nem az egész vitát. Kézzel azt teszi, amit egy jó memória-infrastruktúra automatikusan: megtartja a lényeget, elhagyja a zajt.
- **A fontos dolgokat tartsa a széleken.** Mivel a közepén vékonyodik el a figyelem, a soha el nem hagyható utasításokat és tényeket tegye a kérése legelejére vagy legvégére — ne egy hosszú beillesztés közepébe temetve.
- **Külsőzze ki a tudást, ahelyett, hogy a beszélgetésbe tömné.** Az átirat a legrosszabb hely egy projekt tartós tényeinek tárolására. A döntéseket, specifikációkat és a mögöttük lévő *okokat* tegye valami stabil, lekérdezhető helyre, és hagyja, hogy az asszisztens csak azt húzza be, amire az adott feladatnak szüksége van. A megfelelő bekezdés visszakeresése jobb, mint minden körben az egész előzményt újraolvasni.
- **Figyelje az árulkodó jeleket.** Ismétlés, már lezárt kérdések újratárgyalása, világosan megadott részletek összekeverése, lassan terjedő ködösség — ezek a context rot műszerfali jelzőfényei. Amikor meglátja őket, az nem a továbbnyomás pillanata. Hanem az újrakezdésé.

Ha a sorozat előző írása azt kérdezte, mit jelent, hogy egy AI [aludjon rá egyet](/blog/why-your-ai-needs-to-sleep-on-it/) — hogy a háttérben konszolidáljon, és reggelre bölcsebben térjen vissza —, akkor ez ugyanannak az igazságnak a nappali változata. A modellt nem tudjuk megpihentetni, de megakadályozhatjuk, hogy egy olyan asztal fölött dolgozzon, amelyet már nem lát át.

## A csendes költség egy hosszú projektben

Egyetlen leromlott beszélgetés bosszúság. Ugyanez a hatás egy egész szervezeten át már költségvetési sor. A sorozat egy [korábbi írása](/blog/the-rediscovery-tax/) az AI munkamenetek közti amnéziájának árát az *újrafelfedezés adójának* nevezte — annak az ára, hogy újra el kell magyaráznunk a kontextust, amit a rendszernek meg kellett volna őriznie. A context rot ugyanez az adó, a munkameneten *belül* kivetve: az ingó válaszokra, a meg nem maradó javításokra, a tíz perce még meglévő tények újbóli rögzítésére elvesztegetett idő. Szorozzuk meg minden munkatárssal, aki egész nap AI-t használ, és minden ágenssel egy automatizált folyamatban, amely ugyanezt teszi anélkül, hogy bárki észrevenné — és a kis délutáni holtpontból szerkezeti fékerő lesz.

Csendben ez is az egyik oka annak, hogy annyi nagyratörő AI-pilot eldől a bemutató után. Egy forgatókönyvezett bemutató rövid, tiszta kontextus — a reggel kilences asztal. A valódi munka hosszú, kusza és ellentmondásos. Egy eszköz, amely az első öt percben elkápráztat, de az első öt órában leromlik, épp ott okoz csalódást, ahol szállítania kellene. Azok a szervezetek jutnak tartós értékhez, amelyek felhagynak azzal, hogy a beszélgetőablakot memóriaként kezeljék, és valódi memóriát adnak az AI-juknak: külsőt, irányítottat, lekérdezhetőt — olyan helyet, ahol a fontos megmarad, a zaj pedig félrekerül.

## Tudatosan kezelni, nem vakon bízni

A context rotot nem lehet kikapcsolni. Ez a meglévő eszközeink anyagmintázata, és még jó ideig velünk marad. De nem rejtélyes, és nem a mi hibánk, amikor délután háromkor bekövetkezik. A modell nem árult el minket, és nem lett lusta. Maga alá temetődött — és hogy ne temetődjön, abban nagyon sok múlik rajtunk.

Kezeljük tehát a hosszú munkamenetet úgy, mint amit irányítani kell, nem mint amiben vakon bízhatunk. Tartsuk tisztán az asztalt. Kezdjünk újat, amikor a válaszok csúszni kezdenek. A tartós tudást tegyük valami szilárdabb helyre, mint egy beszélgetésgörgeteg. Ha ezt tesszük, az asszisztens, amely kilenckor éles volt, háromkor is éles lehet — nem mert megtanult ébren maradni, hanem mert nem kérjük többé, hogy egy olyan asztal fölött gondolkodjon, amelyet már nem tud elolvasni.

Olyan AI-memóriát építünk, amely megtartja a jelet, és félreteszi a zajt — hogy a válasz azt tükrözze, ami fontos, ne mindent, amit valaha kimondtak. Ezt a munkát végezzük. Ha az AI-ja reggel kilenckor zseniális, délután háromra pedig megbízhatatlan, az a szakadék nem a működés elkerülhetetlen ára. Szívesen megmutatjuk a különbséget.

---

**Sorozat**: [Az újrafelfedezés adója (B.1)](/blog/the-rediscovery-tax/) → [Miért nem emlékezet a RAG (B.2)](/blog/why-rag-isnt-memory/) → [Miért kell az AI-nak is aludnia rá egyet (B.8)](/blog/why-your-ai-needs-to-sleep-on-it/) → Miért teljesít rosszabbul az AI délután háromra (C.4)
**Kapcsolódó**: [Amit 160+ munkamenet tanított nekünk (C.2)](/blog/what-160-sessions-taught-us/) · [Tervezés minden intelligenciának (C.3)](/blog/designing-for-all-intelligences/)

*Peres Levente, 2026. ICS - Sheridan. https://sheridan.hu/blog/why-your-ai-gets-worse-at-3pm/*