Skip to content
Kezdőlap » Az elemzések új kulcsa a strukturálatlan adat?

Az elemzések új kulcsa a strukturálatlan adat?

Az adatok kezelése évtizedekig az adatok gyűjtését, tárolását és időnkénti hozzáférését jelentette. Az elmúlt években azonban a vállalkozások keresik azokat a kritikus információkat, amelyeket a számtalan helyen keletkező (vállalati adatközpontoktól a felhőig), elérhető és tárolt hatalmas mennyiségű adatból ki tudnak nyerni.

Ennek fényében az adatelemzés – melyet olyan modern technikák, mint az AI és ML segítenek – elengedhetetlen képességé vált, és jelentősége csak egyre növekszik. A megfelelő üzleti döntések meghozatalához gyorsan kell elemzéseket végeznünk, ráadásul nagyrészt strukturálatlan adatokon. Ehhez megfelelő, modern adatkörnyezetre van szükségünk.

Milyen adatmenedzsment trendekre lehet számítani 2022-ben?

Fókusz kiterjesztése a strukturálatlan adatelemzésre

Az adattudomány nagy része hagyományosan a strukturált adatok adattárházakba történő betáplálására összpontosított. Mivel azonban egyre több a strukturálatlan adat, az adattudósoknak új készségekre kell szert tenniük, hogy ezekkel az adatokkal is megbirkózzanak. Meg kell tanulni értéket nyerni konkrét struktúrával vagy sémával nem rendelkező adatokból is, például videofájlokból, IoT-adatokból, hangfelvételekből, e-mailekből. Ezeknek a kompetenciáknak fejlesztése egyre kiemelkedőbb fontosságú lesz.

Big data elemzések helyett a megfelelő adatok elemzése

A big data szinte már ’túl nagy’, és nehezen hasznosítható ún. adatmocsarakat hoz létre. A megfelelő adatok azonosítása és elemzése rengeteg időt és munkát takarít meg, ráadásul relevánsabb elemzést is kapunk. A big data elemzések helyett tehát új trend lesz a megfelelő adatok elemzése.

A tárolás-agnosztikus adatkezelés a modern adatszövet kritikus összetevőjévé válik

Az ún. adatszövet architektúra olyan architektúra, amely biztosítja az adatok átláthatóságát, valamint az adatok hibrid tárolási és felhőalapú erőforrásokon keresztüli mozgatásának, replikálásának és hozzáférésének képességét. A közel valós idejű elemzések révén az adattulajdonosoké a kontrol, hogy az adat hol van, így azok megfelelő időben megfelelő helyen lehetnek. Az adatszövet architektúra segítségével nem kell tárolás-centrikusan kezelni az adatokat. Például ahelyett, hogy az összes orvosi felvételt ugyanazon a NAS eszközön tároljuk, a tárolási szakemberek felhasználhatják az elemzéseket és felhasználói visszajelzéseket, hogy szegmentálják ezeket a fájlokat, pl. orvosi képek másolása klinikai tanulmányok hozzáférése érdekében vagy a kritikus adatok megváltoztathatatlan felhőalapú tárolóba történő helyezése zsarolóprogramok elleni védelem miatt.

Az adatszövet architektúra stratégiai vállalti trend lesz

Az adatszövet még mindig csak vízió. Felismeri, hogy az adatok több helyen léteznek, ezt áthidalva biztosíthat nagyobb hordozhatóságot, átláthatóságot és irányítást. Az adatszövet kutatás jellemzően a strukturált, félig strukturált adatokra összpontosított. A világ adatainak jelentős része azonban strukturálatlan (pl. videók, röntgenfelvételek, naplófáljok, kül. érzékelők adatai stb.), és nincs meghatározott sémájuk. Az adattavak és az elemző alkalmazások nem tudnak könnyen hozzáférni az ilyen fájlokban rejlő adatokhoz. Az adatszövet-technológiáknak át kell hidalniuk a strukturálatlan adatok tárolását (fájl- és objektumtárolás) és az elemzői platformok használatát (beleérve az adattavakat, gépi tanulást, természetes nyelv feldolgozást és képelemzést). A strukturálatlan adatok gépi tanulással történő elemzése kulcsfontosságúvá válik. Az adatszövet-technológiáknak nyitottnak és szabványalapúnak kell lenniük. 2022-ben az adatszövetnek a vízióból adatkezelési elvek halmazává kell válnia. Tekintettel az adatok növekvő jelentőségére és nagyságrendjére, a technológiai gyártóknak be kell építeniük a strukturálatlan adatok adatszövet architektúrájukba.

A multi-cloud különböző adatstratégiákkal fog fejlődni

Manapság sok szervezet rendelkezik hibrid felhőkörnyezettel, amelyben az adatok nagy részét magán adatközpontokban tárolják. Mivel a strukturálatlan (fájl) adatok exponenciálisan nőnek, a felhőt másodlagos vagy harmadlagos tárolási szintként használják. A tárolás költségek, teljesítmény és kockázat szempontjából is nehezen átláthatóvá vált, az IT-vezetők felismerték, hogy az adatok értékének kinyerése a felhők és a helyhez kötött környezetek között óriási kihívást jelent. A multi-cloud technológiák akkor működnek legjobban, ha a szervezetek különböző felhőket használnak különböző felhasználási esetekhez és adatkészletekhez. Ez azonban felvet egy másik problémát: az adatok mozgatása igen költséges, ha a későbbiekben áthelyezésre van szükség. Egy újabb koncepció szerint a számítási teljesítmény az egy helyen lévő adatok esetén jobb. Ez a központi hely lehet egy kolokációs központ, amely közvetlen kapcsolatokkal rendelkezik a felhőszolgálatok felé. A multi-cloud különböző stratégiákkal fog fejlődni: néha a számítás érkezik az adatokhoz, néha az adatok több felhőben találhatók.

Szintetikus és strukturálatlan adatokra lesz szükség az adatnövekedés kezeléséhez

Az adatbiztonság és adatvédelem egyre sürgetőbbé válik, a szintetikus adatok pedig kiváló megoldást jelentenek a felhasználói adatok gyűjtésének megakadályozására. Ezen adatok ráadásul könnyebben is hordozhatók, mivel nem kell sok adatvédelmi előírást figyelembe venni. Bár a szintetikus adatok csökkentik az ügyféladatok lábnyomát, ezek a teljes strukturálatlan adatmennyiségnek csak töredékét teszik ki. Az adatok nagy része alkalmazások által generált, nem pedig felhasználói, ezért az adatnövekedés kezeléséhez szintetikus adatokra van szükség a strukturálatlan adatok kezelésével párosítva. A vállalatokra egyre nagyobb nyomás nehezedik, hogy olyan adatkezelési stratégiákat fogadjanak el, amelyek lehetővé teszik számukra, hogy az adatcunamiból hasznos információkat nyerjenek a kritikus üzleti döntések meghozatalához. Az analitika központi szerepet fog játszani ebben az erőfeszítésben, csakúgy, mint a nyílt és szabványokon alapuló adatszövetek létrehozása, amelyek lehetővé teszik a szervezetek számára, hogy mindezen adatokat elemzés és cselekvés céljából ellenőrzés alá vonják.

Forrás: DATACONOMY