Een tandpastamerk beweert
dat zijn product meer plak verwijdert
dan eender welk product ooit gemaakt.
Een politicus vertelt je
dat zijn plan de meeste banen creëert.
We zijn zo gewend geraakt
aan dit soort overdrijvingen
in reclames en de politiek
dat we er niet eens van opkijken.
Maar wat als de claim
door een grafiek wordt ondersteund?
Een grafiek is immers geen mening.
Ze representeert onverbloemde getallen,
en wie kan die tegenspreken?
Toch blijken er vele manieren te zijn
waarop een grafiek je kan misleiden
of ronduit manipuleren.
Hier zijn enkele punten om op te letten.
In deze advertentie uit 1992
beweerde Chevrolet
dat zij de degelijkste trucks
in Amerika maakten,
gebruik makend van deze grafiek.
Ze toont niet alleen
dat 98% van de in de laatste tien jaar
verkochte Chevrolettrucks
nog steeds rijdt,
maar ze lijken
twee keer zo degelijk te zijn
als Toyotatrucks.
Althans, totdat je de getallen
op de Y-as nader beschouwt
en ziet dat Toyota's percentage
ongeveer 96,5% is.
De schaalverdeling loopt van 95% tot 100%.
Als ze van 0% tot 100% liep,
zou de grafiek er als volgt uitzien.
Dit is een veelgebruikte methode
om data verkeerd voor te stellen:
de schaalverdeling vervormen.
De focus op een klein deel van de Y-as
overdrijft een amper op te merken verschil
tussen de vergeleken data.
En het is vooral
bij staafdiagrammen misleidend,
daar we aannemen
dat het hoogteverschil van de staven
evenredig aan de waarden is.
Maar een schaalverdeling
kan ook langs de X-as worden vervormd,
wat vaak voorkomt bij lijngrafieken,
die veranderingen over een periode tonen.
Deze grafiek,
die toont hoe de werkloosheid in Amerika
tussen 2008 en 2010 steeg,
is op twee manieren
langs de X-as gemanipuleerd.
Ten eerste is de schaalverdeling
niet consequent,
doordat de vijftien maanden na maart 2009
dichter bij elkaar zijn gezet
om zo korter te lijken
dan de voorgaande zes maanden.
Een consequentere schaalverdeling
laat zien dat de afname van banen
tegen het einde van 2009 stagneert.
En mocht je je afvragen
waarom het aantal banen eerst afnam:
de tijdlijn begint direct na
de grootste financiële krach in Amerika
sinds de depressie van de jaren 30.
Deze techniek staat bekend
als selectief winkelen.
Men kan een tijdspanne nauwgezet kiezen
om zo een invloedrijke gebeurtenis
buiten beschouwing te laten.
En het kiezen van specifieke data
kan belangrijke tussentijdse
veranderingen verhullen.
Zelfs als er met de grafiek
op zichzelf niets mis is,
kan het verhullen van relevante data
een valse impressie wekken.
Deze grafiek van de jaarlijkse
Super Bowl-kijkcijfers
laat het lijken alsof de populariteit
van het evenement snel stijgt.
Maar ze houdt geen rekening
met de bevolkingsgroei.
De populariteit bleef eigenlijk gelijk:
hoewel het aantal footballfans
is toegenomen,
is het percentage footballfans
gelijk gebleven.
Een grafiek kan je veel wijsmaken
als je niet weet wat de waarde
van het getoonde is.
Onderstaande grafieken
gebruiken dezelfde data
van de 'National Centers
for Environmental Information'.
Waarom wekken ze dan toch
tegenovergestelde indrukken?
De eerste grafiek toont
de oceaantemperatuur per jaar
van 1880 tot en met 2016,
en laat de verandering onbeduidend lijken.
Maar zelfs een verandering
van slechts 0,5 graden Celsius
kan grote ecologische
verstoringen teweegbrengen.
Daarom is de tweede grafiek,
die het jaarlijkse gemiddelde
van de temperatuurvariatie toont,
veel gewichtiger.
Correct ingezet,
kunnen grafieken ons helpen
om complexe data intuïtief te begrijpen.
Maar hoewel software het gebruik
van grafieken in media heeft bevorderd,
is het eveneens gemakkelijker geworden
om grafieken te misbruiken.
Dus als je weer eens een grafiek ziet,
vertrouw dan niet op de lijnen en curves.
Kijk naar de labels,
de getallen,
de schaalverdeling en de context,
en vraag je af wat ze
je willen laten geloven.