gazdaságszakirodalomszervezet

A nagy adatok jelentősége mellett folyamatosan növekszik a kicsi és széles adatok fontossága

Szerző: 2021. augusztus 9.No Comments

„A szervezetek hetven százalékánál 2025-re a big data helyett a kicsi és széles adat kerül a figyelem középpontjába. Az előrejelzést adó Gartner szerint a fordulat annak tudható be, hogy a felhasználók igyekeznek mélyebb kontextusba helyezni elemzéseiket, miközben az adatéhes mesterséges intelligenciát is szeretnék diétára fogni.

Felforgató erejű változások idején, amilyennek a COVID-19 is bizonyult, a múlt állapotot tükröző, történeti adatok gyorsan elavulnak, ami a mesterséges intelligencia (AI) és a gépi tanulás (ML) sok, éles üzemben alkalmazott modelljét használhatatlanná teszi – mondta Jim Hare, a Gartner kutatásvezető alelnöke. Ráadásul mostanra az emberi döntéshozás AI-támogatása is bonyolulttá és erőforrás-igényessé vált, mert túl nagy mértékben épít a mélytanulás adatéhes módszereire.

A vállalati adatvagyon kezeléséért és hasznosításáért felelő D&A- (data and analytics) vezetők ezért új analitikai technikák felé fordulnak, amelyek kis adat (small data) és széles adat (wide data) néven váltak ismertté. A két módszer együttes alkalmazásával a szervezetek hatékonyabban használhatják adataikat – mutatott rá az elemző -, akár az AI-modellek tanításához szükséges mennyiséget csökkentenék, akár értékesebb felismeréseket nyernének nem strukturált, változatos adatforrásokból.

Robusztusabb analitika és AI

A kis adat olyan megközelítés, amellyel kevesebb adatból is hasznos betekintés kapható, többek között idősoros analitikai technikákat vagy pár lépésben történő (few-shot) tanulást, szintetikus adatokat vagy önfelügyelt (self-supervised) tanulást alkalmaz. A széles adat pedig – amely a különböző kis és nagy, strukturálatlan és strukturált adatforrások összevonását és együttes elemzését teszi lehetővé – úgynevezett X-analitikát alkalmaz az adatforrások közötti kapcsolatok feltáráshoz, valamint a változatos adatformátumok kezeléséhez, beleértve a táblázatos, szöveges, képi, audiovizuális, hang-, hőmérsékleti, vagy akár szagészlelési és vibrációs szenzoradatokat.

Mindkét megközelítéssel növelhető az analitika és a mesterséges intelligencia robusztussága, azaz megbízhatósága, a szervezet így kevésbé lesz ráutalva a nagy adatra (big data), mégis teljesebb helyzetfelismerő képességre, 360 fokos rálátásra tesz szert, és az elemzések alapján jobb döntéseket hozhat – mondta Jim Hare. Az adat- és analitikai vezetők mindkét technikát eredménnyel vethetik be, ha kevesebb adat áll rendelkezésükre az AI tanításához, vagy változatos adatok felhasználásával robusztusabb modelleket építenének.

A kis és széles adat potenciális alkalmazási területe lehet például a kereskedelemben az előrejelzés vagy a valós idejű viselkedés- és hangulatelemzés az ügyfélszolgálaton, a szolgáltatások testreszabásában és az ügyfélélmény tökéletesítésében. A két módszer jól alkalmazható továbbá a fizikai (létesítmény)védelemben, a csalásészlelés területén, valamint olyan adaptív, önvezérlő rendszerekben, mint a robotok, amelyek a szenzoraikról érkező adatokat elemezve folyamatosan tanulnak az események időbeli és térbeli összefüggéseiből.

Adatszövet és a felruházott infófogyasztó

Előrejelzésében a Gartner az adattechnológiai és analitikai piacot formáló tíz legfontosabb trend (Top 10 Data and Analytics Technology Trends for 2021) egyikeként emelte ki a kis és széles adat fókuszba kerülését. A listán szereplő technológiák és módszerek hozzásegítik a szervezeteket a változások megválaszolásához, a piaci bizonytalanság kezeléséhez és az új üzleti lehetőségek kiaknázásához. A D&A-vezetőknek ezért az alábbi kilenc trendet is érdemes úgy tanulmányozniuk, mint az üzlet szempontjából kritikus fontosságú beruházások lehetséges területét.

Okosabb, felelősségteljes és méretezhető AI – Mesterséges intelligenciával és gépi tanulással a vállalatok akkor érhetnek el nagyobb üzleti hatást, ha okosabb, kevésbé adatéhes, etikus, felelősségteljes és állóképesebb, megbízhatóbb AI megoldásokat eredményező, új technikákat alkalmaznak. Ilyen megoldásokkal ugyanis gyorsabban tanuló algoritmusokat és értelmezhetően működő rendszereket építhetnek, amelyekkel rövidebb idő alatt nagyobb értéket teremthetnek.

Összeállítható (composable) adat- és analitikai környezet – A nyílt és konténerezett analitikai architektúrákon könnyebben és rugalmasabban állíthatók össze a kívánt analitikai képességek. Különböző adatforrásokból, analitikai eszközökből és AI-megoldásokból a szervezetek így gyorsan építhetnek felhasználóbarát, intelligens alkalmazásokat, amelyek az elemzésekkel nyert felismeréseket összekapcsolják az intézkedésekkel. Minthogy az adatuniverzum gravitációs középpontja a felhőbe kerül, az összeállítható analitika válik az alkalmazásépítés felhőalapú piacterekkel, low-code és no-code eszközökkel támogatott, agilis módszerévé.

Alapozó adatszövet (data fabric) – A digitalizáció mind fokozottabban érezteti hatását, a felhasználók is egyre rátermettebbek és önállóbbak, egyre több D&A vezető ezért adatszövettel kezeli a sokszínűség, az elosztás, a méretezés és az összetettség kihívásait a vállalat adatkörnyezetében. Az adatszövet az analitikát hívja segítségül az adatfelhasználás folyamatos monitorozásához, dinamikusan összehangolja a komponenseket a hibrid és többfelhős környezeteken át, és a különböző adatintegrációs stílusok kombinálásával, újrahasznosításával a tervezés és a bevezetés átfutási idejét 30-30 százalékkal, a karbantartás időigényét 70 százalékkal csökkenti.

XOps, hatékonyság mindenben
– Az XOps-megközelítés célja (beleértve a DataOps-, MLOps-, ModelOps- és PlatformOps-megközelítést), hogy a DevOps jó gyakorlatát követve újrahasznosítással és ismételhetőséggel az analitikában is növelje a hatékonyságot és a gazdaságosságot, méghozzá a megbízhatósággal együtt. Minthogy kerüli a technológiák és a folyamatok duplikálását, az XOps egyúttal az automatizálást is elősegíti az adatkörnyezetben. Sok analitikai és AI projekt azért fut zátonyra, mert a vállalatok utólag, a fejlesztést követően foglalkoznának a műveleti hatékonyság kérdéseivel. A D&A-vezetők az XOps segítségével elkerülhetik ezt a buktatót, mert vállalati szintre terjeszthetik ki az analitikai és AI-eszközök ismételhetőségét, követhetőségét, integritását és összekapcsolhatóságát.

Döntésintelligencia mérnöki megtervezése – Egy-egy döntés meghozatalának támogatása helyett ez a tervezés döntések sorozataira irányul, amelyeket csoportosít és üzleti folyamatokba illeszt, vagy akár kibontakozó döntések és következmények hálózataiba rendez. A döntések egyre inkább automatizálttá válnak, ezért a folyamat kiterjedtebb megtervezésével a D&A-vezetők növelhetik a döntéshozás pontosságát, ismételhetőségét, átláthatóságát és követhetőségét.

Adat és analitika, mint üzleti alapfunkció – Másodlagos foglalatosságból mindinkább üzleti alapfunkcióvá lép elő a vállalatoknál az adatokkal és analitikával összefüggő minden tevékenység. A központi és az elosztott D&A-csapatok jobb együttműködésével lebomlanak a meglévő technológiai silók, az eszközökön a szervezet egésze osztozik, így azokat eredményesebben állíthatja az üzleti teljesítmény szolgálatába.

Mindent összekapcsoló gráf – A modern adat- és analitikai képességek alapját a gráfok alkotják, amelyek változatos adatállományokon keresztül is feltárják az emberek, helyek, dolgok és események közötti kapcsolatokat. Gráfok segítségével a D&A-vezetők olyan bonyolult üzleti kérdéseket is gyorsan megválaszolhatnak, amelyekhez szükséges a kontextus ismerete, a kapcsolatok természetének értelmezése. A Gartner előrejelzése szerint 2025-re az adat- és analitikai innovációk 80 százalékában megjelennek a gráftechnológiák, ami ugrásszerű növekedést ígér az idei 10 százalékhoz képest, és hatalmas lendületet fog adni a szervezeti döntéshozásnak.

A felhatalmazott infófogyasztó – Az üzleti felhasználók többsége ma még előre elkészített digitális műszerfalakat használ, vagy kézi úton tár fel adatokat, ami téves következtetésekhez és rossz döntésekhez vezethet. A jelenlegi gyakorlatot azonban fokozatosan kiszorítja majd az automatizált, párbeszédalapú kezelőfelületen elérhető, mobil analitika, amely a felhasználó egyedi igényei szerint, dinamikusan létrehozott elemzéseket végez, és a felismeréseket a fogyasztás helyére szállítja. A trend hatására az információfogyasztó mindinkább olyan analitikai képességek kap, amelyekhez korábban csak a professzionális elemzők és az amatör adatkutatók (citizen data scientists) fértek hozzá.

Adat és analitika a peremhálózaton – A szervezetek működését támogató adat-, analitikai és más technológiák mind nagyobb számban vándorolnak a peremhálózatokra (edge computing), a fizikai világban működő eszközök közelébe, az IT osztály hatáskörén kívülre. A Gartner szerint 2023-ban a D&A-vezetők elsődleges feladatainak több mint fele már olyan adatokra fog kiterjedni, amelyek peremhálózati környezetben keletkeznek, és menedzselni, elemezni is ott kell őket a valósidejűség és az automatizálás igényeinek megfelelően. Az adatfelügyeletnek és -irányításnak ehhez rugalmasabbá és gyorsabb reagálásúvá, ugyanakkor állóképesebbé kell válnia.”

Forrás:
Gartner – Adatban kicsi az új nagy; Kis Endre; 2021. augusztus 4.
lásd még: Gartner Says 70% of Organizations Will Shift Their Focus From Big to Small and Wide Data By 2025; Gartner; 2021. május 19.