Ako nezavádzať ľudí zlými grafmi

A ako sa nenechať prekvapiť

Písmo: A- | A+
Diskusia  (6)

Na žiadosť zo SME som dal z rôznych zdrojov (zoznam na konci článku) vrátane vlastných skúseností dokopy základné rady, ako robiť dobré grafy, respektíve z pohľadu publika, ako si dávať pozor, aby sme nezhltli graficky manipulované údaje.

Grafy sú výborným prostriedkom pre rýchle pochopenie súvislosti viacerých čísel, ktorý zase môže pomôcť objasniť hlavný odkaz článku či reportáže. Podobne ako fotka, grafy vedia rýchlo ukázať informácie, na ktoré by bolo treba množstvo slov. Ale to platí len ak sú grafy (či fotky) dobre spravené.

1. Na čo myslieť pri spracovaní štatistík do grafov

SkryťVypnúť reklamu
SkryťVypnúť reklamu
SkryťVypnúť reklamu
Článok pokračuje pod video reklamou
SkryťVypnúť reklamu
Článok pokračuje pod video reklamou

Dobré dáta – mám vôbec kvalitné čísla, ktoré stojí za to dávať do grafu? Novinári majú grafy radi, lebo to vyzerá vedecky a sprestruje a prevzdušňuje to text či hovorené slovo. Lenže keď nie je veľmi čo dať do grafu, tak to len odpútáva pozornosť a práveže spomaľuje schopnosť pochopiť hlavný odkaz článku. SME tento rok v infografike „Rómovia na Slovensku “ zobrazilo v grafe počty Rómov v krajoch SR podľa sčítania obyvateľstva.

Pod týmto hlavným grafom je veta, že v skutočnosti je Rómov takmer 3,5krát viac...Tak načo robiť podrobný graf z čísel, ktorým novinári neveria?
Hospodárske noviny sa minulý týždeň venovali v článku rozdielom v platoch na Slovensku a v zahraničí a možným motiváciám ľudí odísť alebo ostať doma. Dobrý graf by ukazoval, ako sa platové rozdiely SR vs zahraničie menia za posledné roky, prípadne aj vývoj počtu Slovákov pracujúcich v zahraničí. HN k článku pridali graf o vývoji platov v korunách vo vybraných sektoroch za posledný rok. Čo nie je úplne od veci, ale stále dve konské dĺžky od grafu, ktorý by článok aj nejako podporoval: aký je ten rast u nás oproti povedzme eurozóne či vybraným emigračným krajinám? Aké je reálne, nie nominálne porovnanie rastov? Graf skôr odpútáva pozornosť, nie aby článku pomáhal.
Vysvetliť zdroj aj metodiku – keď sa pozerám na grafy, ako prvé vždy hľadám zdroj dát. Čísla nepadajú z neba, niekto ich zbiera s istou mierou nepresnosti a s istým zámerom. Najzaujímavejší je zdroj, ak ide o čísla zobrazujúce nejasný pojem, respektíve jav, o ktorom len veľmi ťažko získame dobré údaje (napr. týranie žien v domácnosti, šikanovanie detí v školách). Dva rôzne zdroje totiž môžu vykázať ľahko veľmi odlišné výsledky. Okrem zdroja je teda vhodné vysvetliť metodiku získania údajov. Málokto z novinárov napríklad uvádza, že pri prieskumoch o dôveryhodnosti politikov respondenti označujú až maximálne troch politikov a teda neoznačujú len jednu voľbu, ako to robia pri preferenciách politických strán .

Niekedy zase vyžadujú oficiálne dáta úpravu. Porovnávanie nominálnych súm v dlhoročnom časovom rade (cena ropy, benzínu) si vyžaduje úpravu o infláciu, inak neporovnávame skutočné hodnoty, a nie je jasné, či rast nie je náhodou aj pokles skutočnej hodnoty veličiny.

Výber typu grafu – najpoužívanejšie typy sú čiarové, stĺpcové (pruhové) a koláčové grafy.
Experti na grafiku najviac varujú pred koláčovými grafmi (to sú grafy, kde sa 100-percentný celok rozdeľuje na podskupiny). U čitateľov sú vraj kvôli výzoru najpopulárnejšie, a preto sú novinármi nadužívané. Ale ak je dielikov veľa, ťažko sa v nich orientuje (vysvetľujúca legenda je dlhá). A porovnávanie vývoja rozdelenia koláča cez dva koláčové grafy vedľa seba má význam, len ak sa veľkosť dielikov významne zmenila (experti hovoria aspoň o 5%). Čísla z koláčového grafu sa vždy dajú uviesť v stĺpcovom grafe, a väčšinou stojí za úvahu, či to radšej pre lepšie pochopenie aj neurobiť.
Trojrozmerné grafy sú vratkou pôdou. Vyzerajú lákavo, ale tiež skresľujú samotné čísla a sťažujú orientáciu. Tu je príklad, keď vykrojený dielik koláčového vyzerá ďaleko väčší ako ten najmenší dielik, hoci z celku tvoria podobne malú časť - tretí rozmer (hrúbka - sama osebe irelevantná) robí hlavnú neplechu.

SkryťVypnúť reklamu

Obrázok tiež ukazuje zlý výber typu grafu - zmena medzi grafmi je na prvý pohľad nepostrehnuteľná, treba lúštiť čísla. Lepšie bolo urobiť stĺpcový graf (mohol byť spravený aj percentách namiesto miliárd):
Základom pri výbere je, aby daný graf čo najlepšie zobrazoval hlavný odkaz čísel – ideálne aby už samotným tvarom vystihoval základný trend. Jednoduchosť je tiež veľká cnosť. V TV má na to divák len pár sekúnd, a v tlači tiež nikoho nebaví dlho analyzovať niečo, čo mu malo zrýchliť pochopenie udalosti. Dobrým pravidlom je vyradiť údaje, ktoré nie sú podstatné, a dôležité primerane zaokrúhľovať. Ak si článok naozaj vyžaduje uvádzať presné čísla na porovnanie, treba zvážiť tabuľku a nie graf.

Popis grafu – každý graf by mal mať názov, označenie osí a jednotiek, zdroj dát a legendu, ak je v grafe viac premenných ako aj dodatočné vysvetlenie, ak je potrebné (napr. na metodiku zberu dát). Občas sa zabúda na kontext – pre aký rok či pre akú krajinu čísla platia.
Konzistentnosť štýlu je plusom: nemeniť smer, v akom sa na X-ovej osi uvádza postupnosť času (stále zľava doprava alebo stále zprava doľava), alebo smer legendy, ktorá vysvetľuje dieliky v koláčovom grafe (v smere pohybu hodinových ručičiek, alebo v protismere).



2. Príklady problémových grafov z našich médií

Skresľovanie : najväčším hriechom grafu je, ak obrázok zavádza tak, že neodráža skutočné čísla.

HN : Rast HDP 8,5% v grafe vľavo dole má len dvakrát vyšší stĺpec ako má rast 1,4%; vpravo hore zase rast priemyselnej produkcie 2,5% má len o polovicu nižší stĺpec ako rast 10,9%; atď. Tvar "stĺporadia" tak vôbec neodráža vývoj daných veličín. Navyše grafy sú spolu v jednom bloku ale každý má celkom inú mierku...

SkryťVypnúť reklamu

SME: Sumy úverov a príspevkov pre stranu v pomere k obrázku vôbec nesedia, skoro 100 mil.Sk pre KDH je graficky rovnakých ako 30 miliónový úver SDKÚ, a tiež SDKÚ akoby splatením úveru prišla skoro o polovicu získaných peňazí, hoci je to v skutočnosti 15%.

HN: Všimnite si, že hoci Csákyho číslo nedôveryhodnosti je o viac ako tretinu bližšie k Slotovi ako ku Ficovi, veľkosť jeho zobrazenia je presne opačne bližšia Ficovi ako Slotovi...


Zmena štýlu: ako som vyššie spomínal, konzistentnosť uľahčuje orientáciu. SME vie zmeniť štýl zo dňa na deň v označení časovej osi – raz sú najnovšie údaje vľavo, raz zase vpravo :

Experti radia zoradiť roky zľava doprava od najstarších k najaktuálnejším, vraj sa to ľahšie číta (pre mňa to tak platí určite).

Porovnávanie neporovnateľného : čiarový graf obzvlášť silne ukazuje na trend vývoja, a preto by mal spájať len totožné veličiny

TREND : spojil celoročné hodnoty s polročnou, čo na prvý pohľad čitateľa zavádza

HN: do jedného grafu dali nominálny rast cien ako aj reálny rast miezd (nominálny očistený o infláciu). Modrá „mzdová“ čiara je tak v 3 z 5 rokov pod červenou „cenovou“. Ak by boli mzdy aj ceny porovnávané nominálne, modrá čiara sa dostane pod červenú len raz (2003), čo by vyzeralo ďaleko optimistickejšie pre našu životnú úroveň...

Kuriozity:
TREND zvláštne označil časovú os (rovnaké dieliky reprezentujú čas ľubovoľne od 6 mesiacov po 2 roky...)



Tiež sa stáva, že dieliky v koláčovom grafe nedávajú dokopy 100%. SME už malo koláčové grafy, kde dieliky spolu vytvárali 94%, ale aj 112%.

SkryťVypnúť reklamu


Takže opatrne - aj keď sú dáta v grafe v poriadku, stále je veľa spôsobov, ako vás môže tvorca grafu zviesť na zlú cestu.

Zdroje k článku:
Príklady dobre a zle spravených grafov
Podrobnejšia príručka o robení grafov od štatistickej agentúry americkej vlády pre dáta o energiách
Blog o grafoch
Základy robenia dobrých grafov

Gabriel Šípoš

Gabriel Šípoš

Bloger 
  • Počet článkov:  663
  •  | 
  • Páči sa:  10x

Pracujem v Transparency International Slovensko. Slovak Press Watch bol projektom Zoznam autorových rubrík:  SúkromnéNezaradené

Prémioví blogeri

Monika Nagyova

Monika Nagyova

299 článkov
Jiří Ščobák

Jiří Ščobák

765 článkov
Matúš Sarvaš

Matúš Sarvaš

3 články
Roman Kebísek

Roman Kebísek

106 článkov
Anna Brawne

Anna Brawne

103 článkov
reklama
reklama
SkryťZatvoriť reklamu