한 치약 브랜드가 자기 상품은 여태껏 나온 어떤 치약보다도 많은 치석을 제거한다고 주장합니다. 어떤 정치인이 자기 정책이 가장 많은 일자리를 만들 거라고 주장합니다. 우리는 이런 과장된 광고와 정치에 매우 익숙합니다. 그래서 이제는 눈도 깜짝하지 않죠. 하지만 이런 주장이 그래프와 함께라면 어떨까요? 어쨌든 그래프는 주관적인 게 아니니까요. 냉정하고 객관적인 숫자들에 누가 반박할 수 있을까요? 하지만 그래프는 많은 방법으로 사람들을 호도하고 완전히 조종하는 것으로 보입니다. 몇 가지 사례를 살펴보죠. 이 1992년 광고는 쉐비가 미국에서 가장 튼튼한 트럭이라고 그래프를 사용해서 주장합니다. 이 그래프는 지난 10년간 팔린 쉐비 트럭 중 98%가 아직도 도로를 달린다는 걸 보여줍니다. 도요타 트럭보다는 두 배 더 오래가는 것처럼 보입니다. 왼쪽에 숫자들을 들여다 보고 도요타의 수치는 96.5%라는 걸 알기 전까지는 말입니다. 수치의 범위는 95%에서 100%까지만 있습니다. 0에서 100까지였다면 이렇게 보여야 합니다. 이것은 그래프가 정보를 잘못 표현하는 가장 흔한 방법인 범위를 조작하는 방법입니다. y축의 작은 부분을 확대함으로써 비교대상간의 미미한 차이를 과장하는 것입니다. 특히 막대그래프의 경우 효과가 큽니다 우리는 막대의 크기 차이가 곧 수치와 비례한다고 여기기 때문입니다. 하지만 x축 범위를 조작하기도 합니다. 주로 시간에 따라 변하는 것을 보여줄 때 그렇습니다. 이 차트는 2008년부터 2010년까지 미국의 실업률을 나타내는데 x축을 두 가지 방법으로 조작합니다. 먼저 범위가 일정하지 않습니다. 2009년 3월 이후의 15개월을 압축해서 앞의 6개월보다 더 짧아 보이게 했습니다. 데이터를 일정하게 놓으면 다른 그림이 되서 2009년 말부터 실업이 감소합니다. 그리고 애초에 실업률이 왜 증가하는지 궁금하시다면 미국에 대공황 이후 최대의 금융 위기가 닥친 직후부터 시간대가 시작하기 때문입니다. 이런 기술은 체리 피킹(Cherry Picking) 이라고 합니다. 범위 밖에서 벌어진 중대한 사건의 효과를 배제하려고 신중하게 골라낸 시간대인겁니다. 그리고 특정한 점만을 선택해서 그 사이의 중요한 변화들을 감춥니다. 그래프 자체에는 아무 문제가 없지만 관련있는 정보를 제외하는 것은 잘못된 인상을 심어 줄 수 있습니다. 이 차트는 매년 얼마나 많은 사람들이 수퍼볼(Super Bowl)을 보는지 알려줍니다. 경기의 인기가 폭발적으로 늘어나는 것처럼 보입니다. 하지만 사실은 인구 증가를 고려하지 않았습니다. 미식축구 팬들이 늘어나기는 했지만 전체 시청자 중에서 차지하는 비율은 늘어나지 않았기 때문에 시청률은 일정합니다. 마지막으로, 여러분이 그래프 위의 각 수치가 얼마나 큰 것인지 모를 때는 그래프가 의미 없을 수 있습니다. 중앙 기구와 환경 정보국에서 내놓은 두 그래프 모두 같은 해양 온도 데이터를 보여주고 있습니다. 그런데 어째서 서로 반대의 결과를 보여줄까요? 첫 번째 그래프는 1880년부터 2016년까지 연간 평균 수온을 보여주는데 변화는 그다지 크지 않아 보입니다. 하지만 사실은 0.5도의 온도 증가만으로도 대규모의 생태계 혼란을 가져올 수 있습니다. 이 점 때문에 연간 온도 변화를 보여주는 두 번째 그래프가 더 중대한 결과로 보이는 것입니다. 잘만 사용한다면 그래프는 복잡한 데이터를 직관적으로 이해할 수 있게 해줍니다. 하지만 시각화 소프트웨어가 온갖 매체에서 그래프를 사용할 수 있게 해 주면서 그래프를 정직하지 못하거나 부주의하게 사용하기도 쉬워졌습니다. 그러니 다음에 그래프를 보게 되면 직선과 곡선에 흔들리지 마세요. 표시와 숫자 눈금 문맥을 보시고 그림이 전하려는 말이 무엇인지를 질문하세요.