„A történeti kutatások felgyorsítását és az archív források feldolgozását célzó új mesterséges intelligencia rendszert, a Chronost mutatták be az Oxfordi Egyetem és a Fraunhofer HHI kutatói – derül ki a szakemberek által az arXiv preprint szerveren közzétett legújabb tanulmányból. A technológia lehetővé teszi, hogy a történészek programozói tudás nélkül, természetes nyelvi utasításokkal nyerjenek ki adatokat a digitalizált elsődleges forrásokból.
A Lorenz Hufe, Niclas Griesshaber és kutatótársaik által fejlesztett Chronos rendszer első modulja a gépi látást és nyelvi feldolgozást ötvöző vizuális-nyelvi modelleken (VLM) alapul. A közzétett műszaki jelentés szerint a szoftver a „Pi” nevű ágens-keretrendszerre épül, amelynek segítségével a felhasználók egy egyszerű csevegőfelületen keresztül hozhatnak létre testreszabott adatkinyerési folyamatokat.
A rendszer különlegessége, hogy nem egy előre rögzített informatikai struktúrát kényszerít a kutatókra, hanem képes alkalmazkodni a rendkívül heterogén történelmi források – például 19. századi városi címtárak, szabadalmi lajstromok vagy kézzel írt összeírások – egyedi elrendezéséhez és archaikus szóhasználatához.
A kutatóknak csupán le kell írniuk a feladatot, a Chronos pedig önállóan azonosítja a releváns oldalakat, teszteli az adatkinyerési szabályokat, majd a jóváhagyást követően kötegelve dolgozza fel a dokumentumokat, végül strukturált adatbázist hoz létre a beszkennelt iratokból.
A digitális bölcsészet új korszaka
A mesterséges intelligencia tudományos alkalmazása az elmúlt években rohamosan terjedt a természettudományok, például a fizika, az orvostudomány és a biológia területén, a történettudományban azonban az adaptáció eddig jelentősen elmaradt. A történeti kutatás módszertana – amely a források folyamatos kritikáján, a primer iratok interpretációján és a tágabb történelmi kontextus értelmezésén alapul – alapvetően eltér a természettudományos, kvantitatív kísérletektől.
Bár a nagyszabású nemzetközi digitalizációs projektek révén az elmúlt két évtizedben levéltári iratok milliói váltak online elérhetővé, ezeknek a puszta képi másolatoknak a strukturált, számítógépes elemzésre alkalmas adatokká alakítása hagyományosan rendkívül lassú, nagy emberi erőforrást igénylő manuális munkát követelt meg a tudományos intézetektől.
A most kifejlesztett AI-történész asszisztens ezt a módszertani akadályt hárítja el, áthidalva a hagyományos forrásfeldolgozás és a modern számítástechnika közötti szakadékot. A technológia nemcsak felgyorsítja a kutatást, hanem olyan hatalmas iratanyagok (úgynevezett big data) elemzését is lehetővé teszi, amelyek puszta kiterjedésük okán eddig feldolgozhatatlanok voltak az egyes történészek vagy kisebb kutatócsoportok számára.
A fejlesztő kutatók a tanulmányban ugyanakkor a technológia korlátaira és hosszú távú etikai kihívásaira is felhívják a figyelmet. A vizuális-nyelvi modellek a bonyolult szerkezetű vagy rossz fizikai állapotú archív dokumentumok esetében továbbra is hajlamosak a „hallucinációra”, azaz a téves vagy nem létező adatok generálására.
További aggályokat vet fel a nagy, zárt forráskódú kereskedelmi modellektől való függőség, amely adatvédelmi és szuverenitási kérdéseket, valamint anyagi egyenlőtlenségeket teremthet a kutatóintézetek között. A tanulmány szerzői hangsúlyozzák: a módszertani átláthatóság biztosítása kritikus fontosságú, hiszen ahogy a történészek a jövőben egyre inkább mesterséges intelligenciára bízzák a primer adatbázisok építését, úgy ezek az algoritmusok közvetve a múltról alkotott tudományos képet és a történelmi narratívákat is formálni fogják.”
Forrás:
AI gyorsítja a levéltári kutatást; 2026. április 8.
Towards the AI Historian: Agentic Information Extraction from Primary Sources; Lorenz Hufe, Niclas Griesshaber, Gavin Greif, Sebastian Oliver Eck, Philip Torr; arXiv; 2026. április 4.