informatikapolitikaszakirodalom

Prediktív magánszféra: az adatelemzés alkalmazott etikája felé

Szerző: 2021. szeptember 26.No Comments

„Blogunkban rendszeresen szemlézünk ezentúl érdekes és fontos dilemmákat felvető szakcikkeket, köteteket. Rainer Mühlhoff 2021 júliusában megjelent cikkében a prediktív magánszféra kihívását járja körül.

Az adatelemzések és az adatvezérelt megközelítések a gépi tanulásban (ML) ma már az egyes gazdasági ágak területén a gyakran alkalmazott eljárások közé tartoznak. Az egyik fő alkalmazás az emberi viselkedés algoritmikus előrejelzése. A prediktív adatelemzés (Predictive Analytics – PA) során viselkedési jellemzők nagy adathalmazait használják arra, hogy az adatkorrelációk alapján egyéneket osztályozzanak a jövőbeli kockázatok, gazdasági fejlemények, vagy a várható költségek és hasznosság szerint. Közismert példái közé tartoznak az online célzott hirdetések, a differenciált biztosítási árképzések, a munkaerő felvételénél alkalmazott algoritmusok, vagy az Egyesült Államokban a bűncselekmények ismételt elkövetésének veszélyére figyelmeztető „COMPAS” rendszer.

Ugyanakkor etikai természetű aggályok fogalmazódnak meg ezeknek az alkalmazásoknak kapcsán. Ezeket a kérdéseket az algoritmus etika és az MI etikája tárgyalja. Problémát okozhat például az algoritmikus elfogultság és megkülönböztetés: az algoritmusok tükrözhetik és megerősíthetik a meglévő társadalmi problémákat, vagy újakat hozhatnak létre. Problémák lehetnek továbbá az algoritmikus döntések átláthatóságával, azaz nem lehet kielégítően megindokolni az ilyen döntéseket. Úgy tűnik továbbá, hogy a prediktív adatelemzés adatvédelmi problémáinak kezelése nehézséget jelent az adatvédelem (például az EU általános adatvédelmi rendelete) számára is.

A bemutatott tanulmány mindezt nem tartja elfogadhatónak, ezért bevezeti a prediktív magánszféra (predictive privacy) fogalmát, mint a prediktív adatelemzés alkalmazott etikáját, amely tartalmazza az algoritmus etika szokásos témáit, de túl is mutat rajtuk. A prediktív magánszféra elve a szerző szerint megvéd attól, hogy olyan információk felhasználásával, amelyek pusztán mások viselkedésével kapcsolatos statisztikai összefüggések felhasználásával alkotnak előrejelzéseket, megsértsék az egyének tisztességes bánásmódhoz és autonómiához való jogát. Az egyén (vagy csoport) prediktív magánszféráját akkor éri sérelem, ha a rájuk vonatkozó érzékeny információkat akaratuk ellenére vagy tudtuk nélkül statisztikailag becsülik meg sok más személy adatai alapján, feltéve, hogy ezek az előrejelzések eltérő bánásmódhoz vagy olyan döntésekhez vezetnek, amelyek befolyásolják bárki szociális, gazdasági, pszichológiai, fizikai jólétét vagy szabadságát. Ezt a tételt a szerző a tanulmány normatív hozzájárulásának tekinti a vitához. Elemzési szempontból azt a többletet nyújtja, hogy részletesen (alkalmasint formalizáltan) elemzi a prediktív adatelemzés menetét az adatbeviteltől a prediktív rendszerek adatkimenetéig. Így lehetővé válik, hogy az adatfeldolgozási ciklus egyes pontjaihoz kapcsolódó etikai aggályok széles spektrumát lehessen megvitatni.

A szerző szerint az egyes egyént érintő téves előrejelzések a probléma kollektivista megközelítését igénylik, egyéni, individuális alapon nem kezelhetők. A végkövetkeztetésben a prediktív magánszféra fogalmát az emberi méltóság alapvető etikai elvéhez kapcsolja a tanulmány, és arra tesz javaslatot, hogy a prediktív adatelemzést egyáltalán nem lenne szabad alkalmazni, mert meglehetősen korlátozott az etikai szempontból kifogástalan informatikai, technológiai eszközök száma.

Kiemelendő a tanulmány által bevezetett új szempont, nevezetesen az, hogy az adatvédelem itt egy új, különleges kihívással szembesül. Prediktív adatelemzés segítésével lehetséges az egyénekre vagy csoportokra vonatkozó érzékeny információk megjóslása – potenciálisan az érintettek tudta nélkül – a kevésbé érzékeny vagy könnyebben hozzáférhető információkból (proxy adatok), más felhasználók millióinak adataiból. Ez új kihívást jelent az adatetika és az adatvédelmi szabályozás számára, mert itt a magánélet védelmét nem az alany által nyilvánosságra hozott információk veszélyeztetik, hanem a nagyon sok, más, az alanytól és ügyeitől teljesen független embertől származó információ. Ezek segítségével meg lehet becsülni érzékeny információkat egy olyan emberről, akinek az adatai nem is szerepelnek az algoritmikus elemzés alapjául szolgáló adatbázisban.”

Forrás:
Prediktív magánszféra: az adatelemzés alkalmazott etikája felé; ludovika.hu, ITKI Blog; 2021, szeptember 24.
Lásd még: Predictive privacy: towards an applied ethics of data analytics; Rainer Mühlhoff; Ethics and Information Technology; DOI: 10.1007/s10676-021-09606-x; 2021
(A cikk szabadon hozzáférhető.)