Skip to main content
Uncategorized

MI – nagy nyelvi modellek fejlesztésért kötött együttműködést az Országos Széchényi Könyvtár és a Nyelvtudományi Kutatóközpont

Szerző: 2023. június 25.One Comment

„2023. június 21-én együttműködési megállapodást írt alá Prószéky Gábor, a Nyelvtudományi Kutatóközpont (NYTK) főigazgatója és Rózsa Dávid, az OSZK főigazgatója a mesterséges intelligencia hazai fejlesztéséről.

A megállapodás értelmében az OSZK a Nyelvtudományi Kutatóközpontnak számos nagy méretű szövegállományt átad, úgymint a Magyar Elektronikus Könyvtárban (MEK) és az Elektronikus Periodika Archívumban (EPA) elérhető szöveges dokumentumokat, a webarchívumok szöveges állományait, valamint az OSZK Digitális Bölcsészeti Központ dHUpla adatbázisában szereplő anyagokat. A kutatóközpont ezeket a szövegeket felhasználva nagy nyelvi modelleket épít, amelyek finomhangolásával különböző nyelvfeldolgozó eszközöket lehet fejleszteni. A kutatóközpontnak már van tapasztalata a nyelvi modellek fejlesztése terén; a nevéhez fűződik a Puli-GPT, amely csak magyar nyelvű szöveges anyagokon tanult, és a ChatGPT-hez hasonló funkcionalitással bír. A nyelvfeldolgozó eszközök segítségével számos feladatot lehet automatizálni – például a nyelvfelismerést –, ami rengeteg emberi munkát, időt és hozzáértést igényel.

Emellett a nemzeti könyvtár és az NYTK kooperációban dolgozza fel és teszi elérhetővé a Magyar Nagylexikon tizenkilenc kötetének anyagát, amely a legfrissebb magyar nyelvű, Magyarországon készített egyetemes enciklopédia. A dokumentum egyrészt olvasható és kereshető lesz egy webes lekérdezőfelületen a felhasználók számára, másrészt származtatott erőforrások készülnek belőle, amiket a mesterségesintelligencia-kutatással foglalkozó szakemberek kiválóan tudnak majd hasznosítani egyéb eszközök fejlesztéséhez.

Az aláíráson részt vett továbbá Tamásné Kovács Adrienn, a Digitális Bölcsészeti Központ igazgatója, Mihály Eszter és Simon Eszter, a DBK munkatársai, Lipp Veronika, a Lexikológiai Intézet igazgatója, Váradi Tamás, főigazgató-helyettes, a Nyelvtechnológiai és Alkalmazott Nyelvészeti Intézet igazgatója, valamint Simon László, a Lexikai tudásreprezentáció kutatócsoport vezetője is.

További képek Facebook-oldalunkon

Forrás:
A mesterséges intelligencia hazai fejlesztése; Országos Széchényi Könyvtár; 2023. június 21.