informatikaközigazgatás: magyartudomány

Az állam feladatai a magyar nyelvtechnológia fejlesztéséért

Szerző: 2017. április 24.No Comments

„É. Kiss Katalin személyében először nyerte a legrangosabb magyar tudományos díjat női kutató. A leginkább természettudományos nyelvészeti irányzat képviselőjéről azt mondják, megújította a magyar nyelvtant, kutatásai nemzetközileg is alapvetőek. Különleges nyelv-e a magyar? Milyen mondatokban beszéltek az ősmagyarok? Kell-e félteni a magyar nyelv jövőjét, lesznek-e magyarul tökéletesen csacsogó gépek, és mi az alapvető baj az unalmas nyelvtanórákkal? A Bolyai-díj, a „magyar Nobel” újdonsült birtokosa az Indexnek adta első interjúját.

Területe, a generatív nyelvészet akkor még alig létezett Magyarországon.
Chomsky akkor már nemzetközi gurunak számított, de az irányzat Magyarországon még nem nagyon volt ismert, csak a hatvanas évek vége felé kezdett bejönni. Debrecenben egy kis kör kezdett modern nyelvészettel foglalkozni, Papp Ferenc körül. Ő volt az első magyar számítógépes nyelvész, még szobányi gépekkel dolgozott. Nehéz volt egyedül megérteni akkor, hogy mi is a generatív nyelvészet lényege, nekem az segített, amikor kikerültem egy évre Montrealba.

A magyar nyelv presztízse itthon is veszélyben lenne?
A jelenleg beszélt 7000 nyelv 90 százaléka száz éven belül ki fog halni becslések szerint. Egy nyelv csak akkor tud megmaradni, ha minden információ elérhető rajta. Még azt is mondanám, hogy az interneten keringő minden tudásnak is elérhetőnek kell lennie magyarul. Fontos az is, hogy alapvetően a magyar maradjon a tudományos szaknyelv. Persze a tudomány nemzetköziesedik, és természetes, hogy egyre több az egyetemeken az angol nyelvű kurzus, erre is szükség van, de arra is, hogy mindenről tudjunk magyarul beszélni. Nem kell új nyelvújító mozgalom, nem azon kell erőlködni, hogy minden kifejezés magyar szótövű legyen – de az cél, hogy mindent el lehessen mondani magyarul is.

Van itt az államnak tennivalója, illetékességi területe?
Például támogatnia kell a magyar nyelvű folyóiratok és tudományos könyvek, szakszótárak kiadását – de ilyen lenne a számítógépes technológia is, hogy minden lefordítódjon magyarra. Ezt célozta a MorphoLogic Kft. webfordító projektje. A webforditas.hu még ma is működik – de miután az állami finanszírozása abbamaradt, abbahagyták a fejlesztést.

Nehezebb megtanítani egy gépet magyarul, mint angolul? A számítógépes nyelvészet, a fordító- és beszélőprogramok a legprosperálóbb mai alkalmazásai a generatív nyelvészetnek.
Nem hiszem, hogy az egyik nyelv könnyebben algoritmizálható, mint a másik. Van persze, ami az angolban könnyű, például ott nem nagyon van morfológia. A magyarban Papp Ferenc számításai szerint egy főnévnek 714 lehetséges alakja van (házaimból, házatoknak, stb.), de hiába sok, ha egy nyelv jól le van írva – és a magyar elég jól van leírva – ez azért elég könnyen algoritmizálható. Nagyon sokat merítenek a statisztikából is: ha van egy 500 millió szavas korpuszunk, ami megvan magyarul és angolul is, akkor a számítógépes nyelvészek rengeteg kész fordulatot, mondattöredéket tudnak használni.

Ami nagyon jó nálunk, az a számítógépes beszédgenerálás, már észre sem vesszük, hogy automata beszél a telefonban vagy a hangosbemondóban. A beszédfelismerés egy kicsit nehezebb, könnyebb az írott beszédet hangzóvá tenni, mint a hangzót írottá, de szerintem ezekben jól állunk, és ha többet finanszíroznának, még jobban állnánk. 2015-ben azonban sajnálatos módon megszüntették a digitális bölcsészet mesterszakot. Ennek a Pázmányon a számítógépes nyelvészet volt az egyik szakiránya. Ezt nagyon sajnálom, ez a terület mindenhol abszolút felfutóban van. Indoklás nem volt.

Mennyire jellemző, hogy a jobb hallgatókat elszipkázzák az appfejlesztő cégek? Mennyire vonzó egy tehetséges PhD-hallgatónak Magyarországon a tudományos pályafutás?
A számítógépes nyelvészeknél nagyon nagy gond, hogy elviszik a legjobb embereket. Anyagilag egy magyarországi tudományos karrier nem versenyképes, sem a piaci szférához, sem Nyugat-Európához képest. Ezt a kutatási témaválasztással és a munkaidővel járó nagyobb szabadság kompenzálná némileg a bölcsészeti területen, de az anyagi ajánlatokkal nem tudunk versenyezni…”

Forrás:
A magyar nyelv logikája külföldön is érdekes; Kolozsi Ádám; Index.hu; 2017. április 23.