„Világszenzációvá vált a beszélgetni, kérdésekre akár magyarul is válaszolni képes mesterséges intelligencia megjelenése. Az OpenAI által mindenki számára megnyitott ChatGPT percek alatt letette az orvosi szakvizsgát, az ausztrál egyetemisták ötöde pedig már ezzel írja az esszéit, talán ezért egyes oktatási intézményekben be is tiltották a használatát. Az intelligens csetrobotról és a mesterséges intelligencia (MI) hatásáról Rab Árpáddal, az NKE Információs Társadalom Kutatóintézet vezető kutatójával beszélgettünk.
Most egy hagyományos helyzetben vagyunk: újságíróként önt mint kutatót egyetlen témáról kérdezem, találkozásunk célja pedig az, hogy megszülethessen egy ismeretterjesztő cikk. Meddig lesz szükség arra, hogy mi így beszélgessünk? Avagy: kinek a munkáját veszi el hamarabb az MI?
Erre azért nem könnyű válaszolni, mert a folyamatot mi magunk alakítjuk. Ha nem figyelünk oda, nem vagyunk nagyon tudatosak, akkor termékekké válhatunk, így már nem mi döntjük el ezt a kérdést. De legyünk derűsek! Az MI ebben a pillanatban is nagyon sokat segít nekünk: figyeli a levelezésünket, javítja e beszélgetés felvételének hangminőségét, azt is segített megszervezni, hogy találkozzunk. Ezért is lenne pontosabb, ha a mesterséges intelligenciák kifejezést használnánk. Azt is fontos látni, a mesterséges intelligencia csak úgy csinál, mintha okos lenne. Hú, de jól tudta, hogy én most kocogok, milyen szuper, hogy eltárolja, elemzi a mozgásom. De valójában csak számsorokat adok meg, hogyha innen indulok és oda érek, ha ilyen sebességgel haladok és a testem ritmusban mozog, akkor az a kocogás. Az MI így egyszerre intelligens és egyszerre ostoba. Hogy az eredeti kérdésre is válaszoljak: bármi is ma a mesterségünk, gondolkodjunk el azon, hogy mit szeretünk benne. Amit nem szeretek, arra rögvest nézzem meg, hogy az MI hogyan képes elvégezni. Amit szeretek, abban viszont nagyon jónak kell lennem. Nagyon sok olyan tulajdonságot, amit eddig munkahelyi értékként definiáltunk, a mesterséges intelligencia kiüresít. Ilyen például a monotóniatűrés. A mesterséges intelligencia a monoton feladatokban egyszer sem hibázik, hiszen túl buta ahhoz. Ha a saját munkám nézem: igen, elolvas másfél millió dokumentumot, és ír belőle egy oldalt, ami nekem egy hét lenne. De a fő kérdés mégis az, hogy mi zajlik le bennem azalatt az egy hét alatt, miközben kutatok. Hiszen az olvasás során én gondolkodom is az olvasottakon, formálgatom a szöveget, közben kíváncsi leszek valamire vagy épp nem.
Transzparencia és a felhasználók felelőssége
Milyen lenne az olyan mesterséges intelligencia, ami társadalmilag is hasznos?
A MI kutatása legalább annyira társadalomtudományi, mint technológiai kérdés. Két nagyon fontos attribútumot emelek ki. Az egyik az, hogy legyen az MI transzparens. Tehát értsük, hogy miért mondja: Árpád, most kanyarodj balra. Ha a miérteket nem kérdezzük meg, akkor termékké válunk. A második fontos cél, hogy sok apró mesterséges intelligencia legyen. Jelenleg óriási részvénytársaságok fejlesztik az MI-t, az ő céljuk inkább az, hogy egyetlen nagy mesterséges intelligencia legyen, mert akkor az egy platform, és én függővé válok tőle. A társadalomnak viszont ez nem érdeke, jobb a sok kicsi: legyen egy, ami megmondja, hogy így kanyarodjak balra a biciklivel, legyen egy, ami lefordít valamit és így tovább. Ha sok kicsi van, akkor tudom szabályozni, akkor mondhatom: nézd, te nyelvfordító mesterséges intelligencia vagy. Miért vagy kíváncsi a súlyomra? Ne szóljál bele a tanulásomba! Csak fordítsd le! Azt csináld jól!
Ezt jogi eszközökkel el lehet érni?
Szerintem nem elég azt mondani, hogy a szabályozó hatóságok majd ezt megoldják. A jog nagyon le van maradva; a jognak előbb jogesetek kellenek, ezeket fel kell dolgoznia, meg kell néznie, hogy lett-e valakinek sérelme. Azt viszont nagyon nehéz megfogalmazni, hogy ért-e kár azzal, hogy az útvonaltervező egy bizonyos útra vitt. Mert lehet, hogy amiatt nem láttam egy olyan kávézót, amit szerethetnék, helyette azt láttam, amelyért valaki fizetett, hogy lássam. De a hiányt magát nem fogom megtudni. A jognak persze hatalmas a szerepe e kérdésben. Ugyanilyen hatalmas a szerepe az üzleti világnak, hogy felelősen viselkedjen. Amiben viszont hiszek, hogy a legnagyobb szerepünk nekünk, felhasználóknak van abban, hogy minél okosabban használjuk a gépeket. Ha erre képesek vagyunk, könnyebben lehet majd szabályozni, és egyre inkább a helyére kerül. Jómagam nagyon fontosnak tartom még a magyar mesterséges intelligenciák fejlesztését, illetve azt, hogy demisztifikáljuk a jelenséget. Lássuk, hogy bármennyire is összetett, mégiscsak egy gép.
Ez miért fontos? Mondana erre példát?
Nagyon sokszor előkerül, hogy a közösségi média lehallgat minket. Mindenkinek van egy olyan sztorija, hogy beszélgettem valakivel a fűszernövényekről, és egy órával később fűszernövényeket dobott föl reklámként. Bármennyire is úgy tűnhet, nem hallgatnak le minket. Technikailag nagyon strapás lenne: egynapi lehallgatás százötven megabájt hangfájl, azt feltölteni, harminc nap alatt máris egy giga, észreveszi a felhasználó. A másik oldalon meg lenne 20 petabájt anyag naponta. Nem ez az út, hanem az, hogy az MI megismer minket a viselkedésünk alapján, és úgy, hogy összekapcsolja az adatokat. Az MI azt látja, hogy egy ismerősöm a fűszernövényekre keresgél naponta. Látja a geolokációs adatokból, hogy mi találkoztunk. Ezért bedob tíz reklámot a barátom keresési előzményeiből. Én kilencet nem fogok tudatosan észrevenni, de a fűszeres beüt. Ott megáll a kezem, abban a pillanatban a gép már tudja, hogy ez valamiért érdekel. Ezért dob még egy fűszernövényt, hátha működik. Persze ehhez az is kell, hogy valaki fizessen azért, hogy fűszernövényeket dobjon be.
„Írj verset piros mobiltelefonról Shakespeare stílusában!”
Ahogy említette is, nagyon sokféle MI vesz bennünket körül. A sajtóban azonban most az igazi sztár a ChatGPT. Mitől más vagy miért lett más a híre, mint az eddig szinte észrevétlen régi segítőinknek?
Hogy a mesterséges intelligencia fejlesztés itt tart, már lehetett látni, csak eddig a társadalom nem találkozott vele. Mi itt, az NKE Információs Társadalom Kutatóintézetében is már egy-két éve beszélünk arról, hogy ez a helyzet el fog jönni. A Google-nél valószínűleg öt éve beszélnek róla és készülnek rá. Hogy ilyen sokan felkapták rá a fejüket, az a technológia köré épített szolgáltatáson múlott. Nagyon fontos azt is látni, hogy a mesterséges intelligenciának sokféle fejlesztési módja van, s mindegyiket egyszerre használják. Az egyik eleme a jó programozás, meg az adatok, a másik pedig, hogy viselkedéseket gyűjtünk, tehát a gépet használni is kell. Az önvezető autót úgy fejlesztem, hogy egyrészt programozom, meg tesztpályán futtatom, harmadrészt pedig kiküldöm a forgalomba, megtesz kétszázezer kilométert, és így lesz okos. Az MI fejlesztése tavaly ért el egy olyan állapotba, hogy nyílt tesztüzemben elérhetővé tegyék.
Tehát tesztelők vagyunk mindannyian?
Voltaképpen igen, e célból tette közzé OpenAI a nyílt forráskódú mesterséges intelligenciát, a ChatGPT-t. Ez egy weblap, amely regisztráció után bárki számára elérhető, ingyenesen használhatjuk. A felhasználó egy chatablakot lát, amellyel eddig is találkozhatott már más felületeken. Először mindenki csak kíváncsiságból ír be ide egy-két szót, egy mondatot. Aztán rájön, hogy bármilyen kérdésre választ kaphat. Azt mondom neki: írjál a piros mobiltelefonról Shakespeare stílusában. És megírja a szonettet. Ha kell, lefordítja magyarra. Sőt, eleve magyarul beszélgetek vele, ő a háttérben átfordítja magának angolra, majd visszafordítja. Nagyon összetetten és gyakran jól válaszol. Ha azt kérdem tőle, mi az e-learning, akkor pontokba szedve szépen válaszol. Ez nagy kihívás a Google-nak.
Hogyan jutott el a Google idáig, milyen működési elv áll a háttérben?
A Google anno egy nagyon innovatív keresési algoritmust hozott létre, melynek a teljes kódját senki sem ismeri, de azt tudjuk, hogy azokkal az információkkal gazdálkodik, amit az emberek felértékeltek. Azt nézi, hogy ez az oldal látogatott, ide sok link mutat, tehát én arról az oldalról hozok adatot. Mi magunk, emberek validáltuk a kereséseket, és az egyre jobb lett az idők során. Ám a Google-nél az van, hogy beírom a kérdést a keresőbe, betöltődik a találati oldal, ráklikkelek, és ott van a szöveg. Lehet, hogy a „Mi az e-learning?” kérdésemnél csak a tizedik helyen szerepel az a cikk, amit egy valóban jó kutató írt, előtte az első kilenc reklám vagy épp felületes. A ChatGPT esetén viszont egyetlen lépés van csak, beírom a kérdést, majd egyből ott van előttem a válasz. Nem kell forrásokkal, linkeléssel foglalkozni. Ha bízom a fejlesztőkben, akkor azt mondom, hogy tényleg ez az e-learning.
„Van-e egy olyan ügyem, amit csak én akarok?”
A bizalomhoz talán nem árt átlátni, hogyan működik. Erről mit lehet tudni?
Kétféle generatív mesterséges intelligencia jelent most meg a piacon. A generatív MI azt jelenti, hogy én adok neki parancsokat, ő pedig végrehajtja. Az egyik a szöveges változat, a másik csoport pedig az, ahol beírok szavakat, és azokból képet alkot nekem. Ezt hívjuk prompt programozásnak vagy prompt mérnökségnek. Sokat fogunk ezzel foglalkozni a jövőben. A szolgáltatás mögött egy hatalmas adatbázis van, ami egyrészt az interneten keres, másrészt össze tudja szöveggé rakni a találatokat. Ehhez az kell, hogy megértse, hogy te mit akarsz, illetve, hogy olyan választ adjon, amit szeretnél. Az, hogy megérti, mit akarsz, a prompt rész. Tehát beírom azt, hogy írjál Shakespeare szonettet egy piros mobiltelefonról. Ugye, intelligensen ostoba, egyik szót sem érti, de megnézi az adatbázisban. A több milliárd weblapról, amit lát, előkeresi a Shakespeare szonetteket, leírja algoritmikusan, hogy ezek hogyan néznek ki, milyen szavakat használnak. Visszajön a piros mobiltelefonhoz, megnézi az összes mobilos reklámot, megnézi a mobilos képeket, megnézi a piros színt, megnéz egy csomó verset, hogy milyen kontextusban használták a pirosat, mindezt tizedmásodpercek alatt. Én annyit látok, hogy beírtam a kérdést, leütöm az entert, s szinte azonnal visszaadja nekem az összerakott szavakat Shakespeare modorában. Erre én azt mondom, hogy wow, de okos. Neki persze fogalma sincs, mit írt ki. Én, az ember vagyok az, aki azt mondom, hogy ez egy vers. És akkor elkezdek azon gondolkodni, hogy ez azért igen, csoda, de valahogy mégis értelmetlen. Most még itt tart.
Valami furcsaság mindig van ezekben a gépi válaszokban, vagyis József Attilával szólva „Ugy szállong a semmi benne, / mintha valaminek lenne / a pora…
Igen, ez egyrészt ezért van, mert még nincs személyre szabva. Másrészt pedig ez egy teljesen nyílt teszt, ahol nagyon kemény feltételek állítottak be a fejlesztők, hogy senki számára ne legyen sértő vagy bántó a válasz. Ha megkérdem tőle, hogy a piros vagy a kék szín a jobb, akkor egy alap semleges választ ad, hogy ez szubjektív, ízlés kérdése ésatöbbi. Ha viszont mindenkinek más adatbázisa van, és én fejlesztőként valamiért azt szeretném, hogy ne szeressék mások a kék színt, akkor azt mondom, hogy erre a kérdésre legyen az a válasz, hogy a piros jobb és kék rosszabb. A jövőben egyre inkább azt fogjuk elvárni a mesterséges intelligenciától, hogy ne legyen ennyire semleges.
Például?
Mondjuk szeretnénk, hogy legyenek gépi orvosaink. Nem az orvosoktól akarjuk elvenni a munkát, hanem az ő munkájukat akarjuk segíteni, illetve pótolni őket olyan helyzetekben, ahol nem kell emberi jelenlét. Viszont ebben a szituációban a gép nem maradhat semleges. Nem mondhatja, hogy szerintem akár le is fogyhatnál, de ez a te döntésed. Egy orvosnak ki kell mondania, hogy nézd, Árpád, te túlsúlyos vagy. Neked ennyit le kell fogynod. Ennyi időd van rá. Ezt pedig nem lehet szépen mondani. Nagyon lényeges az is, hogy ezeket az eszközöket ne használjuk cél nélkül. Szerintem az különböztet meg minket a termékektől, hogy amikor leülünk használni egy eszközt, legyen az egy motorbicikli, okostelefon, bármi, van-e kérdés a fejünkben. Van-e egy olyan ügyem, amit csak én akarok? Vagy csak azt várom, hogy valaki csináljon velem valamit. Ha csak azért görgetem a közösségi médiát, mert unatkozom, akkor termékké válok, mert le fogja kötni a figyelmemet. De ha én arra vagyok kíváncsi, mi történt a legjobb barátommal, máris van egy ügyem. Néha persze lehetünk kényelmesek, mondjuk napi tíz helyzetben nyolcszor. Elindítom a zenei streaminget, válogasson össze zenét a hangulatomtól függően. Nem érdekel, hogy valaki fizetett azért, hogy az ő száma bekerüljön a listába, hanem csak szól. A tudatosság első lépése az, hogy rájöjjünk, mikor kell tudatosnak lenni. Mikor számít az, hogy amit lefordított az online fordító, azt nézzem meg én is? Nem számít tíz levélből kilencszer, most az én munkámról beszélve, mert ezek operatív levelek. Szia, ezt csináld, azt csináld, lefordítja angolra, oké. De van a tizedik, amit mondjuk egy új ügyfélnek írok vagy egy olyan konferencia meghívója, ahol egyetlen betű elütése is problémás lehet, akkor már nem bízom meg a gépi fordításban teljesen.
A felhasználói tudatosság nagyon sokat számít
A bizalom mellett engem az is foglalkoztat, mi lesz azokkal, akik a bemeneti adatokat adják. A Google keresése ilyen szempontból még transzparens, mert ott találatként tényleg linkek vannak, azaz megnézhetem azt az ember által generált tartalmat, ami a válasz az én kérdésemre. A ChatGPT esetén fogalmam sincs, ki hozta a választ létre.
Ez nagyon komoly probléma. Nem tudunk forráskritikával élni, azaz eldönteni, hogy tényleg az-e a jó válasz, amit a gép ad. A szerzői jog szempontjából rémálom. Persze meg lehetne oldani: akár például azzal, hogy mindig, amikor válaszol, egy külön fájlban odateszi a forrásait. Egy letölthető fájl, tehát nem kell feltétlenül elolvasnom, de ha fontos, megnyomom a gombot. A másik nagy kérdés: miért hozzak én létre valamit az interneten, amikor nem tudom, hogy azt ki használja föl. Például írok egy verset, és lehet, hogy a ChatGPT abból tanul. Nem pontosan azt a versemet adja majd ki a felhasználóknak, de ha a stílusom vonzó, akkor felhasználja a saját válaszához. Így mégiscsak elloptak tőlem valamit, ám nem a konkrét versemet, ezért még beperelni se tudom. Erre szerintem a már említett töredezettség lesz a válasz, amikor azt mondom, hogy ezt az MI-t csak erre lehet használni.
Oktatóként hogyan lehet ezt a jelenséget kezelni, mondjuk, a szakdolgozatírók esetében?
Valóban, nagyon sok szakdolgozó már most a ChatGPT-vel írja a szakdolgozatát. A diákok nagyon szeretik a technológiai innovációkat, azt gondolják, hogy az a tanáruknak még nem ismerős, ezért meg fogják úszni. Én megpróbálhatom kitalálni, hogy milyen kérdést tett fel a hallgató. Beírom a gépbe, és ha kijön ugyanaz a szöveg, akkor ráírhatok a hallgatóra, hogy jó, ez csalás volt. De végül azon kapjuk majd magunkat, hogy ahelyett, hogy a diákkal tudtam volna egy órát beszélgetni, digitális eszközökön keresztül küzdöttünk egymás ellen. Tehát nem az a megoldás, hogy egy gép felismerje a más gépek által megírt szöveget, hanem lehet, hogy az, hogy nem kell negyven oldalas szakdolgozatokat kérnünk. Lehet, hogy elég öt oldal vagy akár csak egy szóbeli prezentáció, amiből kitűnik, mi a diák saját gondolata.
Voltaképpen akkor jó vagy nem jó, hogy gépekkel tudunk beszélgetni?
Személy szerint én, mondjuk, tíz tényezőre lebontva legalább hét előnyét látom a mesterséges intelligenciának, de ott van az a három is, ami nagyon nagy kockázat. És pont ezen dolgozunk itt, az intézetben is, hogy ezt a hármat csökkentsük kettőre vagy egyre. A felhasználói tudatosság nagyon sokat számít. Például, ha kíváncsi vagyok, hogy mikor született Michael Jackson, már nem a Google-ban keresek rá, hanem megkérdem a ChatGPT-t. Ám a fontos döntéseknél nem hagyatkozhatok csak erre az eszközre, hanem visszatérek oda, ahol látom a forrásokat és az embert a tartalom mögött. Ha így viselkedünk, akkor a fejlesztő cégek is azt fogják mondani, hogy jó, akkor inkább mi is beletesszük a forrásokat. Ha mi nem így viselkedünk, nem fogják beletenni soha. Szerintem a mesterséges intelligencia nem úgy veszi el a munkánkat, hogy nem lesz holnap. Hanem úgy veszi el, hogy azt érezzük, erodálódik minden. Már nem kapok annyi pénzt a munkámért, mert annak egy részét robot csinálja. Már nem tudok pénzt keresni a kreatív elmémmel, az írásaimmal, a fotóimmal, mert már minden fent van az interneten.
Törvényszerű, hogy ez így legyen vagy gátat lehet szabni? Hogyan védhetjük meg a szellemi termékeinket?
Erre egy válasz lehet például a visszatérés a fizikai világba. Visszatérünk oda, hogy nem digitálisan festünk, s reméljük, hogy lesz valaki, aki a képet, amelyből tényleg csak egy van, megfizeti. Ha én újságíró vagyok, akkor elfogadom, hogy a cikkem nem az egész világon látszódik, hanem csak egy papíralapú újságban, de ott fogják tudni, hogy a cikket én írtam, és azok az emberek fogják olvasni, akiknek szántam. Tehát kicsit falakat húzunk magunk köré. Persze azt se feledjük el, hogy most még csak egy ingyenes tesztszolgáltatást kapunk, ami egyébként nagyon nagy rezsiköltséggel működik. Voltaképpen bármennyit lehet a használatáért kérni, a mai árakon ez 20–30–40, de akár 200 ezer forint is lehetne. Hogy rászoktassanak minket, most ingyen kapjuk, de ez a jövőben nem így lesz.
A pénzügyi rész, s ami azon is túlmutat
Úgy képzeljük el a gazdasági részét, hogy lesz egy fizetős keresés is az ingyenes mellett, ami, mondjuk, havi 20 dollár, mellyel az MI kiegészítőt vásároljuk meg?
Ez már most is így van. Mondok egy példát: azért fejlődtek nagyon sokat az online fordítók, mert sokat levelezünk és csetelünk. Ma már a Google fordítója, ami ingyenes, egészen elfogadhatóan fordít. De van olyan fizetős szolgáltatás is a piacon, ami még jobban fordít. Nem sokkal, egy picivel jobban – ez néha megérheti az árát. Attól függ, kivel levelezünk. De ugyanígy: a mindenkinek ingyenes Google útvonaltervező képes elosztani az autókat a városban. Ám ha én VIP ügyfél leszek, azt mondja majd, hogy téged osztalak el először, így te mindig két perccel hamarabb odaérsz. Nem tűnik ez soknak nekem, aki egy nap egyszer megyek autóval, de, mondjuk, egy taxitársaság már tízezerszer megy. Nekik, 1000 autónál az előny már munkanapokat jelenthet, amiért a társaság azt mondja, hogy rendben, kifizetem a szolgáltatás árát. Szerintem ingyenesen használható mesterséges intelligencia mindig lesz. De az, hogy megnézi-e, mondjuk, a Scopus társadalomtudományi folyóirat adatbázist is arra a kérdésre, hogy mi az e-learning, vagy csak az internetes blogokat, az már árazási kérdés lesz. Azt fogom mondani, hogy én a teljes körű szolgáltatást kérem. Azt mondja, jó, de ez így 600 forint lesz. Nekem megéri, mert azt mondom, ezt most a szakdolgozatomra áldozom. És akkor a gép ezeket a közleményeket is végignézi, ha tudja. Az árból néhány száz forint az lesz, amit a szolgáltató azért fizet, hogy azt az adatbázist is használhassa, és jó esetben az adatbázis tulajdonosai fizetnek annak, aki a tartalmat létrehozta. Ez nem így van jelen pillanatban a tudományos életben, de akár lehetne így is.
Úgy érzem, ez az egész jelenség jóval túlmutat az árazás kérdésén…
Persze! Emlékezzünk vissza, hogy mondjuk öt vagy tíz évvel ezelőtt hogyan oldottunk meg dolgokat, hogyan kerestünk információkat vagy hogy terveztük meg a nyaralásunkat. Ha belegondolunk, hogyan tesszük ezeket ma, akkor kiderül, hogy tényleg a jövőben élünk. A mesterséges intelligencia itt van, nem csak gazdasági kérdés, nem csak egy érdekesség és nem a jövő. Hanem a ma. Jó, hogy van, mert a segítségével talán fenn tud maradni az emberi faj. De senki ne érezze úgy, hogy ez olyasvalami, ami másokkal történik meg. Ne gondoljuk, hogy ez biztos csak a jogászok problémája, vagy csak az egyetemisták, a könyvelők, az újságírók problémája. Nem, ez mindenkit érint. Ma Magyarországon közvetlenül hatszázezer munkahelyet érinthet a mesterséges intelligencia. Ez úgy értem, hogy ezeket az állásokat már most is betölthetné egy gép. Ez nagyon sok. A jövő munkája a mechanikus ismételgetés helyett sokkal inkább a jól kérdezés, a jó megfogalmazás lesz, egy pontosabb, precíziós aggyal. Ezért kérem, hogy mindenki vegye komolyan a mesterséges intelligenciát, gondolkodjon el rajta, fejlessze magát és közben kísérletezzen, játsszon a ChatGPT-vel. ”
Forrás:
„A jövő munkája a jól kérdezés lesz”; Aula Magazin (NKE); 2023. február 2.