„A „Big Data” szóról általában az intelligens hálózatokhoz kapcsolódó eszközök által generált, és a közösségi médiában keletkezett adatok jutnak eszünkbe, valamint a nevezetes (és elcsépelt) „3/4/5V-definíció”. Így nem tűnik triviálisnak, hogy az állami szervezetrendszer termelte, legtöbbször „open data”-ként (nyílt hozzáférésű adatként) is emlegetett különféle adatok szintén ebbe a körbe sorolhatók, hiszen ugyanúgy rendkívül sokféle forrásból származnak, különféle formátumúak, hatalmas mennyiségben termelődnek, és további komoly feldolgozásra, értelmezésre szorulnak ahhoz, hogy bármire is használni lehessen őket, ami az eredeti, keletkezéskori céljuktól eltér. Ezek között találhatunk relációs adatbázisokból származó adatokat épp úgy, mint szöveges állományokat.
A következőkben röviden ismertetem egy 2012-ben lefolytatott kutatásomat, amely a nyilvános bírósági ítéleti adatbázist, mint szövegkorpuszt használta kiindulópontként (Ződi [2014]). Az ismertetést megpróbálom tágabb kontextusba helyezni, és részben szólni a hasonló Big Data-alapú, „szövegempirikus” kutatások helyéről és szerepéről a jog területén, részben pedig néhány tanulságot megfogalmazni…”
Forrás:
A bírósági ítéletek adatbázisa mint Big Data; Zôdi Zsolt; Statisztikai Szemle; 95. évfolyam, 5. szám; 2017. május; 505-513. oldalak (pdf)