„A klasszikus statisztikai adatgyűjtés kérdőívezésen alapul. Ez a mai napig gyakran használt adatfelvételi módszer viszonylag alacsony elemszám mellett, bizonyos korlátokon belül megbízható, érvényes adatokat „produkál”, és állandó, magas adatminőséget garantál – ami a hivatalos statisztikában kulcsfontosságú. Problémát jelent azonban, hogy a válaszok nem minden esetben tükrözik a valóságot, az információk feldolgozása esetenként lassú, így egy-egy adat már akkorra elveszti az aktualitását, mire a döntéshozók elé kerül. E hátrányok kiküszöbölésére kiváló megoldást nyújthat a Big Data, amelynek statisztikai célú alkalmazásakor viszont számos nehézséggel kell megküzdeni. Jelen tanulmányban a szerzők arra tesznek kísérletet, hogy bemutassák, az akadályok ellenére e hatalmas adatállományok miként integrálhatók a hivatalos statisztikába. Feltárják és rendszerezik azokat a módszertani dilemmákat, amelyek kezelése elengedhetetlen a megfelelő adatminőség biztosítása érdekében, ismertetik a Big Data lehetséges felhasználási területeit a hivatalos statisztikában, végül pedig felvázolják a Központi Statisztikai Hivatal egyik projektjét, amelyben Big Data-forrásokat használnak egy hivatalos statisztikai adat előállítása érdekében.”
Forrás:
Hivatalos statisztika és a Big Data; Giczi Johanna, Szőke Katalin; Statisztikai Szemle; 95. évfolyam, 5. szám; 461-490. oldalak (pdf)