Skip to content
Kezdőlap » Félrevezető adatvizualizációk

Félrevezető adatvizualizációk

A tengelyek szerepe

Tekintsük az alábbi vizualizációt, van-e jelentős eltérés az adatokban?

A két diagram ugyanazon adatsorból készült, egyetlen különbség, hogy az első esetben csonkoltuk az y-tengelyt, így a kis különbségek is jelentősnek tűnnek. Vizualizációk készítésekor törekedjünk arra, hogy a minimum és a maximum érték is megjelenjen az y-tengelyen, és ne legyen a skála feleslegesen hosszú sem (így egy „fordított” hatást kelthetne a diagram, mivel a nagyobb különbségek is kisebbnek tűnnének). Indokolt csonkolás esetén azt egyértelműen jelezzük. Ha logaritmikus skálát alkalmazunk, akkor azt is jelöljük megfelelően.

Statisztikailag megalapozatlan állítások sugalmazása

Van összefüggés a két adatkészlet között?

https://www.tylervigen.com/spurious-correlations

Az ábra alapján látható, hogy a két adatsor együtt mozog, de a korreláció nem jelent kauzalitást. Sok esetben a háttérben egy „confounding változó” okozza az együttjárást, amit nem is ismerünk, akár nem is mérhetünk.

Kördiagramok és egyéb 3D ábrák használata

Kördiagramokat és egyéb megoszlást mutató ábrákat csak akkor használjunk, ha az ábrázolt adatok 100%-ot tesznek ki, minden megfigyelési egység egyetlen kategóriába tartozhat. Gyakori hiba ezek használata olyan esetekben, mikor pl. egy kérdőíves kérdésnél több válasz is megjelölhető, ez esetben a használat helytelen, mivel egy válaszoló nem egy választ adhat meg. Szintén nem jó, ha olyan esetben használjuk a kördiagramot, mikor nagyon sokféle lehetőség van, hiszen ekkor nehezen lesznek láthatóak a különbségek, ekkor használjunk inkább fatérképet. Fontos, hogy ha érzékeltetni akarjuk a különbségeket az egyes kategóriák között, akkor a százalékokat is jelenítsük meg az ábrán.

A háromdimenziós ábrák használatát kerüljük, mivel nagyon félrevezető lehet. Tekintsük az alábbi példát:

Látható, hogy torzítás miatt első ránézésre egyáltalán nem azt sugallja az ábra, amit az adatok. A North (35%) és az East(30%) egymáshoz való viszonya ránézésre teljesen félrevezető. Egyéb 3D ábráknál az is előfordulhat, hogy az adatok eltakarják egymást, inkább kerüljük használatukat.

Kumulatív adatok

Ha kumulatív módon jelenítünk meg egy adatsort, akkor fontos, hogy azt egyértelműen jelezzük, ne okozzunk félreértéseket. Mielőtt azonban elkészítjük a diagramot, gondoljuk át, hogy van-e hozzáadott értéke ennek az ábrának, gondoljunk Tim Cookra és az iPhone eladásokra. Tudunk-e bármilyen információt leszűrni az ő ábrájából?

Térképes vizualizációk nem megfelelő színezéssel

Kartogramok használata esetén figyeljünk a színválasztásra. Ha az az adat, ami alapján színezünk, legalább ordinális mérési szintű, akkor figyeljünk arra, hogy ezt a színezés is tükrözze (pl. ahogy az adat növekszik, úgy lesz egyre sötétebb a használt szín), így egy sokkal könnyebben értelmezhető ábrát tudunk készíteni.

Az adatvizualizáció rengeteg kreatív lehetőséget rejt, azonban arra mindig figyeljünk, hogy mit akarunk közölni az ábrával, az adatoknak megfelelő diagramot válasszunk, és soha ne helyezzük a kinézetet az érthetőség és interpretálhatóság elé.