WEBVTT 00:00:07.808 --> 00:00:10.839 한 치약 브랜드가 자기 상품은 여태껏 나온 어떤 치약보다도 00:00:10.839 --> 00:00:12.910 많은 치석을 제거한다고 주장합니다. 00:00:12.910 --> 00:00:16.411 어떤 정치인이 자기 정책이 가장 많은 일자리를 만들 거라고 주장합니다. 00:00:16.411 --> 00:00:20.841 우리는 이런 과장된 광고와 정치에 매우 익숙합니다. 00:00:20.861 --> 00:00:23.131 그래서 이제는 눈도 깜짝하지 않죠. 00:00:23.131 --> 00:00:26.111 하지만 이런 주장이 그래프와 함께라면 어떨까요? 00:00:26.111 --> 00:00:28.471 어쨌든 그래프는 주관적인 게 아니니까요. 00:00:28.471 --> 00:00:32.611 냉정하고 객관적인 숫자들에 누가 반박할 수 있을까요? 00:00:32.611 --> 00:00:36.403 하지만 그래프는 많은 방법으로 사람들을 호도하고 00:00:36.403 --> 00:00:38.192 완전히 조종하는 것으로 보입니다. 00:00:38.192 --> 00:00:40.745 몇 가지 사례를 살펴보죠. 00:00:40.745 --> 00:00:45.760 이 1992년 광고는 쉐비가 미국에서 가장 튼튼한 트럭이라고 00:00:45.760 --> 00:00:47.510 그래프를 사용해서 주장합니다. 00:00:47.510 --> 00:00:51.963 이 그래프는 지난 10년간 팔린 쉐비 트럭 중 98%가 00:00:51.963 --> 00:00:53.592 아직도 도로를 달린다는 걸 보여줍니다. 00:00:53.592 --> 00:00:57.338 도요타 트럭보다는 두 배 더 오래가는 것처럼 보입니다. 00:00:57.338 --> 00:01:00.634 왼쪽에 숫자들을 들여다 보고 00:01:00.634 --> 00:01:05.472 도요타의 수치는 96.5%라는 걸 알기 전까지는 말입니다. 00:01:05.472 --> 00:01:09.313 수치의 범위는 95%에서 100%까지만 있습니다. 00:01:09.313 --> 00:01:12.963 0에서 100까지였다면 이렇게 보여야 합니다. 00:01:12.963 --> 00:01:18.323 이것은 그래프가 정보를 잘못 표현하는 가장 흔한 방법인 범위를 조작하는 방법입니다. 00:01:18.353 --> 00:01:20.804 y축의 작은 부분을 확대함으로써 00:01:20.804 --> 00:01:25.703 비교대상간의 미미한 차이를 과장하는 것입니다. 00:01:25.703 --> 00:01:27.974 특히 막대그래프의 경우 효과가 큽니다 00:01:27.974 --> 00:01:31.023 우리는 막대의 크기 차이가 곧 00:01:31.023 --> 00:01:33.233 수치와 비례한다고 여기기 때문입니다. 00:01:33.233 --> 00:01:36.125 하지만 x축 범위를 조작하기도 합니다. 00:01:36.125 --> 00:01:40.414 주로 시간에 따라 변하는 것을 보여줄 때 그렇습니다. 00:01:40.414 --> 00:01:44.747 이 차트는 2008년부터 2010년까지 미국의 실업률을 나타내는데 00:01:44.747 --> 00:01:47.996 x축을 두 가지 방법으로 조작합니다. 00:01:47.996 --> 00:01:50.395 먼저 범위가 일정하지 않습니다. 00:01:50.395 --> 00:01:53.416 2009년 3월 이후의 15개월을 압축해서 00:01:53.416 --> 00:01:56.755 앞의 6개월보다 더 짧아 보이게 했습니다. 00:01:56.755 --> 00:02:00.106 데이터를 일정하게 놓으면 다른 그림이 되서 00:02:00.106 --> 00:02:03.705 2009년 말부터 실업이 감소합니다. 00:02:03.705 --> 00:02:06.675 그리고 애초에 실업률이 왜 증가하는지 궁금하시다면 00:02:06.675 --> 00:02:10.615 미국에 대공황 이후 최대의 금융 위기가 닥친 직후부터 00:02:10.615 --> 00:02:12.626 시간대가 시작하기 때문입니다. 00:02:12.626 --> 00:02:15.219 이런 기술은 체리 피킹(Cherry Picking) 이라고 합니다. 00:02:15.219 --> 00:02:18.869 범위 밖에서 벌어진 중대한 사건의 효과를 배제하려고 00:02:18.869 --> 00:02:20.648 신중하게 골라낸 시간대인겁니다. 00:02:20.648 --> 00:02:24.762 그리고 특정한 점만을 선택해서 그 사이의 중요한 변화들을 감춥니다. 00:02:24.762 --> 00:02:27.356 그래프 자체에는 아무 문제가 없지만 00:02:27.356 --> 00:02:30.937 관련있는 정보를 제외하는 것은 잘못된 인상을 심어 줄 수 있습니다. 00:02:30.937 --> 00:02:33.997 이 차트는 매년 얼마나 많은 사람들이 수퍼볼(Super Bowl)을 보는지 알려줍니다. 00:02:33.997 --> 00:02:37.626 경기의 인기가 폭발적으로 늘어나는 것처럼 보입니다. 00:02:37.626 --> 00:02:40.198 하지만 사실은 인구 증가를 고려하지 않았습니다. 00:02:40.198 --> 00:02:41.967 미식축구 팬들이 늘어나기는 했지만 00:02:41.967 --> 00:02:45.109 전체 시청자 중에서 차지하는 비율은 늘어나지 않았기 때문에 00:02:45.109 --> 00:02:47.959 시청률은 일정합니다. 00:02:47.959 --> 00:02:49.888 마지막으로, 여러분이 그래프 위의 00:02:49.888 --> 00:02:53.318 각 수치가 얼마나 큰 것인지 모를 때는 그래프가 의미 없을 수 있습니다. 00:02:53.318 --> 00:02:56.457 중앙 기구와 환경 정보국에서 내놓은 두 그래프 모두 00:02:56.457 --> 00:02:59.719 같은 해양 온도 데이터를 보여주고 있습니다. 00:02:59.719 --> 00:03:02.490 그런데 어째서 서로 반대의 결과를 보여줄까요? 00:03:02.490 --> 00:03:05.279 첫 번째 그래프는 1880년부터 2016년까지 00:03:05.279 --> 00:03:07.987 연간 평균 수온을 보여주는데 00:03:07.987 --> 00:03:10.149 변화는 그다지 크지 않아 보입니다. 00:03:10.149 --> 00:03:12.878 하지만 사실은 0.5도의 온도 증가만으로도 00:03:12.878 --> 00:03:15.799 대규모의 생태계 혼란을 가져올 수 있습니다. 00:03:15.799 --> 00:03:17.219 이 점 때문에 00:03:17.219 --> 00:03:19.858 연간 온도 변화를 보여주는 두 번째 그래프가 00:03:19.858 --> 00:03:22.390 더 중대한 결과로 보이는 것입니다. 00:03:22.390 --> 00:03:27.379 잘만 사용한다면 그래프는 복잡한 데이터를 직관적으로 이해할 수 있게 해줍니다. 00:03:27.379 --> 00:03:31.180 하지만 시각화 소프트웨어가 온갖 매체에서 그래프를 사용할 수 있게 해 주면서 00:03:31.180 --> 00:03:35.900 그래프를 정직하지 못하거나 부주의하게 사용하기도 쉬워졌습니다. 00:03:35.900 --> 00:03:39.560 그러니 다음에 그래프를 보게 되면 직선과 곡선에 흔들리지 마세요. 00:03:39.560 --> 00:03:40.882 표시와 00:03:40.882 --> 00:03:42.130 숫자 00:03:42.130 --> 00:03:43.048 눈금 00:03:43.048 --> 00:03:44.360 문맥을 보시고 00:03:44.360 --> 00:03:46.780 그림이 전하려는 말이 무엇인지를 질문하세요.