Manipulace s grafy

Nacistická propaganda za druhé světové války rozšířila o britském ministerském předsedovi Wilsonu Churchillovi tvrzení, že údajně řekl: „Nevěřím žádné statistice, kterou jsem sám nezfalšoval.“ Toto tvrzení mělo ukazovat, že lže vlastním obyvatelům a není vůbec hodnověrným partnerem do diskuse. Přesto, že jde o propagandistickou větu, kterou nikdy nepronesl, je v ní jistě určitá dávka pravdy.

Upravit text Aktivity Pracovní list Prezentace Kvíz Podcast

Asi každý, kdo se někdy zabýval statistikou a zpracováním dat, ví, že s nimi manipulujeme – v dobrém i špatném slova smyslu – téměř vždy. Vždy totiž chceme něco ukázat a něco jiného nás nezajímá, vždycky si vybereme jeden aspekt, ale ostatní ponecháme stranou. Pak jsou ale manipulace, které jsou úmyslné a jejich cílem je zmást čtenáře statistiky, respektive v našem případě grafu. A právě na prozkoumání některých technik, jak se to dělá (a tedy na co si dát pozor a čeho se vyvarovat), se chceme nyní podívat. 

Velice pěkný přehled nejčastějších manipulací s ukázkami je k dispozici také ve starším článku na iDnes

Podseknutá osa y je asi nejčastější v politice užívaná manipulativní technika v grafech. O co jde? Začátek osy nedáte do nuly, ale do čísla, které odkazuje na nepatrně nižší hodnotu než je ta nejnižší na grafu. Výsledkem je, že dokážete velice jednoduše extrémně zvýšit rozdíly mezi jednotlivými údaji ve sloupcovém grafu. Tím u čtenáře vytváříte pocit, že nějaký údaj dramaticky klesá nebo roste, což ale nemusí být vůbec pravda. S podseknutím osy y je samozřejmě možné pracovat, ale vždy je vhodné tuto informaci vyznačit do grafu.

Bez popisku

Ticho na pěšině vs. prudký růst? I takto výrazně může podseknutá osa změnit váš dojem z grafu. Více ukázek zkreslení grafů najdete v odkazu. Zdroj: Office.lasakovi.com - Zkreslující (chybné) grafy v Excel.

Logaritmické měřítko osy je fajn věc, pokud potřebujete do jednoho grafu zanést velice rozdílné hodnoty nějakých údajů. Třeba v astrofyzice se to používá skoro pořád. Problém ale je, pokud na takové měřítko čtenáře dostatečně neupozorníte. Pak klidně z lineárního růstu uděláte exponenciálu

Situace na pomezí prvních dvou příkladů je taková, že zobrazujeme data s jednotkami, které jsou samy o sobě logaritmické – třeba decibely – zvýšení hlasitosti o 20 dB odpovídá změně intenzity stonásobně! Pak je vlastně otázka, jak s takovými grafy pracovat. Nejčastěji užívaný dekadický logaritmus způsobí, že mezi body 1 a 10 je stejná vzdálenost jako mezi 10 a 100 nebo 100 a 1000. 

Místo podseknuté osy y můžete mít ještě jednu zajímavou manipulaci, totiž vynechání některých hodnot na ose x. To může být záměrné (například se nám nějaké hodnoty nelíbí) nebo tím, že je prostě nemáme k dispozici. V takovém případě ale v grafu má být volné místo a nikoli osa, která nebude „držet“ měřítko. 

Aby graf byl grafem, musí mít popsané osy a jasně řečené, co na něm je co. To vede jednak k požadavku na dobrou legendu, ale také na popisek os. Pokud vám takový tlak přijde od učitelů fyziky nepatřičný a zbytečný, pak vězte, že jde o jednu ze základních charakteristik grafu. Bez popisků totiž vůbec netušíte, co vidíte. Někdy je dokonce možné se potkat s tím, že pro „dvě čáry“ v grafu použijeme různé měřítko. Pak dokážete z čehokoliv cokoliv. Součástí popisku osy by měla být informace o tom, co zobrazuje a v jakých jednotkách. Jednotky většinou píšeme do hranatých závorek [m] či [kg]. 

3D grafy – za žádnou cenu nepoužívejte 3D grafy, protože jejich 3D efekt sice vypadá moc pěkně, ale ve skutečnosti vede k absolutní manipulaci s výsledky. To, co může vypadat pohledně v PowerPointu, má pak většinou zcela nulovou vypovídající hodnotu. 

Další věcí, která se stává většinou spíše z hlouposti než z úmyslu, je chybná volba typu grafu jako takového – například pro vývoj cen ropy v čase někdo použije bodový a jiný sloupcový graf a obojí je v pořádku, ale třeba koláčový graf je na něco takového zcela nepoužitelný. Z podobné kategorie je pak záměna hodnot na ose x a y. V případě vývoje rozpočtu v letech to není asi pravděpodobná chyba, ale třeba u měření voltampérové charakteristiky se vám to může stát docela snadno.

Bez popisku

Pokud vám chybí data, je třeba to v grafu přiznat, jak to udělali například datoví novináři z iRozhlasu. Jejich práci určitě stojí za to sledovat! Zdroj: iRozhlas - Pro tři čtvrtiny Čechů je změna klimatu ‚problémem dneška‘. Strach o životní prostředí roste od roku 2016

A pak je zde samozřejmě mnoho dalších otázek – je v grafu zobrazena chyba, s jakou se pracuje? (Každé statistické měření má určitou chybu, protože se nemůžete zeptat všech lidí, ale jen určité části – to znamená, že například u volebních preferencí stran víte, že určitou stranu bude volit mezi 3 až 7 procenty voličů, takže do grafu napíšete 5 % – chybou je ale zatížené každé statistické měření a zpracování dat.) Typicky – pokud o nějaké straně s preferencemi 4,5 % řekneme, že je pod hranicí vstupu do parlamentu, voličsky i politicky ji poškodíme. A přitom výsledek 4,5 % mající chybu typicky 1–3 procentní body nic takového neříká. Zrovna u průzkumů veřejného mínění u politických stran jsou důležité trendy a nikoliv přesné hodnoty volebních preferencí. 

Dalším problémem může být samozřejmě interpretace dat – totiž, že korelace není kauzalita (se spotřebou zmrzliny roste množství utopených lidí, ale netopí se kvůli zmrzlině, ale proto, že se více koupou, neboť je léto). 

A v neposlední řadě – graf má vždy nějaký zdroj, nějaká data která zobrazuje. Asi nejsnazší cestou, jak s grafem manipulovat, je – si ho prostě vymyslet. I toto je něco, co bychom u grafů v médiích měli chtít slyšet a vidět.

RNDr. Michal Černý, Ph.D.

řešitel projektu, asistent na KISKu

 

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info