„A Szegedi Tudományegyetem Informatikai Intézete 2026. január 29-én és 30-án huszonkettedik alkalommal rendezte meg a Magyar Számítógépes Nyelvészeti Konferenciát. A konferencián Csibi Zsolt, Gortka Bence György, Gyöngyössy Natabara, Nagy Kornél, Nemeskey Dávid Márk, Sallai Martin, Simonyi András, Szekeres András Márk és Palkó Gábor Efficient Hungarian LLM Adaptation on Academic Infrastructure címmel tartottak előadást.
A konferenciára benyújtott cikkben a szerzők a Racka nevű, „lightweight” nagy nyelvi modellt mutatták be, amelyet úgy terveztek, hogy hatékonyan támogassa a nagy nyelvi modellek magyar nyelvre történő adaptálását akár akadémiai már szintű, nagy teljesítményű számítástechnikai (HPC) infrastruktúrán is. A fejlesztés célja olyan módszertan kidolgozása volt, amely képes erőforrás-hatékonyan javítani az elérhető nyelvi modellek magyar nyelvű képességeit, miközben biztosítja, hogy a magas erőforrású nyelveken (különösen az angolon) meglévő képességek se sérüljenek.
A szerzők a tanulmányért és a prezentációért Best Paper elismerésben részesültek.
A konferencia teljes programja elérhető: https://rgai.inf.u-szeged.hu/mszny2026/program
A konferenciakötet: https://rgai.inf.u-szeged.hu/sites/rgai.inf.u-szeged.hu/files/mszny2026.pdf”
Forrás:
Best Paper díjat nyertek kutatóink a Racka modell bemutatásával az MSZNY 2026 konferencián; ELTE Digitális Örökség Nemzeti Laboratórium (DH-LAB); 2026. február 10.
Lásd még:
Racka: Efficient Hungarian LLM Adaptation on Academic Infrastructure; Csibi Zsolt, Gortka Bence György, Gyöngyössy Natabara, Nagy Kornél, Nemeskey Dávid Márk, Sallai Martin, Simonyi András, Szekeres András Márk és Palkó Gábor; arXiv; v2; 2026. február 12.
Szerkesztői megjegyzés:
Kevesebb magyar szöveg (és kevesebb könnyen felhasználható, minőségi magyar adat) áll rendelkezésre, mint angolul vagy németül – mert a magyarul beszélők lélekszáma sokkal kevesebb, és ennek következtében a modell tanítására használható szövegek mennyisége is sokkal kisebb. De nem csak a darabszámról van szó: ugyanilyen fontos a minőség, változatosság, annotációk, párhuzamos adatok és a teljes eszköz-ökoszisztéma mennyisége is. A RACKA alkotói erre a problémára találtak megoldást, hogy a végeredmény ugyanolyan jó minőségű legyen, mint az angol és német nyelvek esetében.