Skip to main content
gazdaságközigazgatás: magyarközigazgatási informatikapolitikatudomány

MI-vel egy igazságosabb társadalomért (Vágujhelyi Ferenc, NAV)

Szerző: 2022. szeptember 11.No Comments

„A megalapozott közpolitikai döntések alapját a gazdasági és társadalmi folyamatok pontos ismerete jelenti, mondja Vágujhelyi Ferenc, a Nemzeti Adó- és Vámhivatal vezetéséért felelős államtitkár, aki kormánybiztosként irányítja és felügyeli a NAV és a MÁK adatvagyonának optimalizálását. A hasznosításban komoly szerepet szánnak a mesterséges intelligenciának.

Hasznosítható gazdasági adatvagyon

– Évek óta beszél a kormányzat a nemzeti adatvagyon fontosságáról. Ennek fényében mi a jelentősége annak, hogy idén a NAV Mesterséges Intelligencia Munkacsoportját kormányhatározat hozta létre, mint ahogy önt is kormányhatározat nevezte ki a NAV és a Magyar Államkincstár adatvagyonának optimalizálására?

– A kormány ezzel azt akarja jelezni, hogy kulcsfontosságúnak tartja a közvagyon részét képező hazai adatvagyont, és az abban rejlő értékek kiaknázását. A világ megismerése mindig az adatok gyűjtésén és elemzésén alapult, csak míg régebben az új adatokért sokszor messzire kellett utazni, a 21. században az a szerencsés helyzet állt elő, hogy az adatok helybe jönnek. A digitális térben minden gazdasági eseményről, minden ellátási cselekményről keletkezik adat, és ezek Magyarországon tranzakciós szinten a NAV és a Magyar Államkincstár rendelkezésére állnak. A NAV az online pénztárgépekből, az étel- és italautomatákból, az elektronikus közúti árufuvarozási rendszerből, az online számlázásból vagy az építőipari és turisztikai rendszerekből elemi szinten gyűjti a gazdaság legtöbb adatát. A MÁK a támogatások és a kifizetett ellátások tekintetében rendelkezik nagy mennyiségű adattal.

Ráadásul hozzánk a valóságos és következményekkel járó adatok jutnak el, nem egy olyan kép, amit a felhasználó láttatni szeretne magáról, ahogy ez a közösségi média esetében történik. Egy befizetett számla után áfát lehet visszaigényelni, a munkabér után járulékokat kell fizetni, és így tovább. Ezekből az adatokból megbízható képet alkothatunk a gazdaság és társadalom pillanatnyi állapotáról és folyamatairól. Minél pontosabb ez a kép, annál megalapozottabb közpolitikai döntéseket lehet hozni. Végső soron ez a kormányzat célja, és ennek adott hangsúlyt az említett két kormányhatározat is.

– A nagy mennyiségű adat elemzésére léteznek jól bevált eszközök és módszerek. Mit tud ezekhez hozzátenni a mesterséges intelligencia?

– Valóban felmerülhet, nem csak nagyzási hóbort-e, hogy MI-t használunk elemzési feladatokhoz, hiszen végül is a hagyományos adattárházi és Big Data elemzési technológiának mind az adóigazgatásban, mind a vám- és pénzügyőrségnél komoly története van. Ezzel együtt az MI jelentős előrelépést kínál ezen a téren, mert a módszerei jelentősen különböznek a korábbiaktól.

– Melyek a legfontosabb különbségek?

– Az adattárházak kialakításánál az emberi intelligencia alapján felállítunk egy koncepciót arra, hogy mit és hogyan akarunk elemezni. A modellt az ember állítja össze, és megnézzük, hogy milyen eredményt ad. Ehhez a tranzakciós adatbázisokban tárolt adatokat átforgatjuk analitikus adatbázisokba, majd ezekből aggregátumokat, többdimenziós adatkockákat képzünk, és megvizsgáljuk, hogy modellünk alátámasztja-e az eredeti elképzelést. A mesterséges intelligencia esetében nem sok energiát fektetünk az adatok előkészítésébe. Az összeset bezúdítjuk egy adattóba (data lake-be), majd prekoncepciók felállítása nélkül különféle szempontok szerint, gépi tanulási módszereket alkalmazva elemezni kezdjük azokat. Itt is kiválasztunk persze bizonyos tulajdonságokat, metrikákat hozunk létre, de a modelleket már a gép alkotja meg, nem az ember. A modellek alapján felismerhetünk bizonyos szabályszerűségeket, például bizonyos jelenségek különböző gazdasági tevékenységek esetén is előfordulnak, hasonló viselkedést mutatnak. Ha ezek valódi jelentéssel bírnak, megtartjuk, és tovább finomítjuk a modellt, ha pedig nem, eldobjuk azt. Fontosnak tartom megjegyezni, hogy az MI alapú elemzések is anonimizált adatokon történnek, az adatvédelmi elvek és szabályok legszigorúbb betartása mellett.

– A mindennapi életre lefordítva milyen következtetéseket lehet levonni ezekből az elemzésekből?

– Kiderülhet például, hogy melyek a legmagasabb és legalacsonyabb adóteljesítményű vállalkozások. Megvizsgálhatjuk, hogy az előbbi csoportban nem méltánytalan-e, hogy a közteherviselésből ilyen aránytalanul veszik ki a részüket, míg az utóbbiaknál megnézhetjük, hogy az adóoptimalizálás során nem lépték-e túl a jogszabályi kereteket, így szabályozási javaslattal élhetünk a Pénzügyminisztérium felé.

– Mire kell figyelni adatmenedzsment szempontból az MI alapú adatelemzésnél?

– Fontos feladatunk, hogy meg kell teremteni a különféle adatbázisok közötti szemantikus interoperabilitást, vagyis jelentés szerint kategorizálnunk kell minden egyes bemenő paramétert. A mesterséges intelligencia ugyan képes felismerni a szemantikus azonosságot két adatbázis között, de jobb ezt előtte elvégezni. Oda kell figyelni a túlillesztés elkerülésére is.

– Ez mit takar?

– Azt, amikor két entitás, például két cég között bizonyos szempontból valódi korreláció van, és a tanító adatbázis alapján ezt az algoritmus meg is tanulja. Ám ha ez speciális eset volt, például csak Nyugat-Magyarországra jellemző, és mi mégis belevesszük a modellbe, akkor a modellünk nem lesz kellően általános. Valós, de korlátozott összefüggésből hamis következtetéseket vonunk le, és hibázunk, ha olyan körzetben is alkalmazni akarjuk a modellt, ahol az nem releváns.

– A NAV és a MÁK adatainak hasznosításának hol lesz a súlypontja? Elsősorban belső célokat szolgál, az államigazgatási döntéshozatal támogatja vagy a magánszemélyeket, a vállalkozásokat segíti?

– Amikor 15 évvel ezelőtt az akkori APEH-ben megkezdődtek az adattárház-építések és az azokra épülő elemzések, azok a belső munkafolyamatokat, a kockázatkezelést támogatták. Az én kormánybiztosi munkám ma alapvetően egy igazságosabb társadalom létrejöttét szolgálja. A NAV és a Kincstár adatai alapján megnézzük, hogy ki mennyit tett a közösbe, és ki mennyit vett ki onnan. Nem igazságtalan-e, ha valaki túl sokat tesz be, de keveset vesz ki? Mi az oka annak, ha valaki keveset tesz be, de sokat vesz ki? Az élethelyzetéből adódik vagy valamilyen csalárd tevékenység áll mögötte? Mi az ilyen elemzésekhez akarunk adatokat szolgáltatni, miközben nyilvánvalóan bezárjuk a kiskapukat, felszámoljuk a csalási lehetőségeket.

– A NAV a rendelkezésére álló adatok alapján már számos szolgáltatást kínál. Várható-e a jövőben újabb szolgáltatások elindítása?

– Azt az elvet követjük, hogy ha az adatok alapján teljesíthető az adatszolgáltatási kötelezettség, azt tegyük meg mi magunk, s minél kisebb feladatot hagyjunk az ügyfeleinkre. Amikor erre lehetőség van, elkészítjük az szja- vagy az áfa-bevallást az adózó helyett, de azt például nem tudjuk, hogy használták-e a cégautót magáncélra. Ezért inkább két másik fronton erősítjük szolgáltató jellegünket. Az első a támogató eljárások: ha valahol eltérést találunk, az adózóval együtt megnézzük, hogy mi az oka a devianciának, és ha gond van, büntetés nélkül javítható a bevallás. A másik, hogy szakítunk a hagyományos, nyomtatványokon alapuló gondolkodásmóddal. A nyomtatványok mindig a hivatal munkáját könnyítették meg, de az ezek alapján történő ügyintézés a 21. században már a társadalom elleni merényletnek tekinthető. Előbb-utóbb átállunk egy kérdezz-felelek típusú módszerre, ahol az ügyféllel közösen, élethelyzetek alapján, szekvenciálisan megyünk végig a folyamatokon, és úgy készítjük el a bevallásokat.”

Forrás:
MI-vel egy igazságosabb társadalomért; IT Business; 2022. szeptember. 8.