1 00:00:07,808 --> 00:00:10,839 一个牙膏品牌声称他们的产品 可以比以往任何的产品 2 00:00:10,839 --> 00:00:12,910 除掉更多的牙菌斑。 3 00:00:12,910 --> 00:00:16,411 一位政客告诉人们 他们的计划会制造最多的就业机会。 4 00:00:16,411 --> 00:00:18,951 我们已经太习惯在广告和政治宣传中 5 00:00:18,951 --> 00:00:20,850 听到这些夸大其词了, 6 00:00:20,850 --> 00:00:23,131 以至于有时我们根本不把这些东西放在眼里。 7 00:00:23,131 --> 00:00:26,111 但是假如这些说法同时伴随着一个图表呢? 8 00:00:26,111 --> 00:00:28,471 毕竟,图表并不是主观意见, 9 00:00:28,471 --> 00:00:32,611 它呈现的只是冰冷确切的数字, 谁又能来质疑这些冷冰冰的数字呢? 10 00:00:32,611 --> 00:00:36,403 然而,事实是,图表可以通过很多方法误导人们 11 00:00:36,403 --> 00:00:38,192 并完全地操纵人们的想法。 12 00:00:38,192 --> 00:00:40,745 下面便是一些图表误导人们的方式。 13 00:00:40,745 --> 00:00:45,760 在这则1992年的广告中, 雪弗兰利用这张图表声称 14 00:00:45,760 --> 00:00:47,510 他们制造了全美最耐用的卡车。 15 00:00:47,510 --> 00:00:51,963 这张图表不仅显示雪弗兰过去的十年间卖出的卡车 16 00:00:51,963 --> 00:00:53,592 有98%目前仍在使用中, 17 00:00:53,592 --> 00:00:57,338 图表还暗示他们的卡车比丰田要耐用一倍。 18 00:00:57,338 --> 00:01:00,634 事实看上去就是如此, 直到你仔细观察纵坐标上对应的数值, 19 00:01:00,634 --> 00:01:05,472 你才会发现丰田(十年间卖出的)卡车的使用率为96.5%左右。 20 00:01:05,472 --> 00:01:09,313 该图表的问题在于 纵坐标的范围仅仅是95到100. 21 00:01:09,313 --> 00:01:12,963 如果范围是从0到100, 图表会是这个样子。 22 00:01:12,963 --> 00:01:16,243 这便是图表误传数据的最普遍方法之一, 23 00:01:16,243 --> 00:01:18,333 也就是扭曲某一坐标的尺度。 24 00:01:18,333 --> 00:01:20,804 将y轴的某一小部分放大 25 00:01:20,804 --> 00:01:25,703 可使两个被比较的事物之间 难以察觉的差距被夸张放大。 26 00:01:25,703 --> 00:01:27,974 这个方法对于柱状图来说尤其起效。 27 00:01:27,974 --> 00:01:30,583 因为我们总是假设柱状图的长度与数值 28 00:01:30,583 --> 00:01:32,803 是成比例对应的。 29 00:01:33,233 --> 00:01:36,125 另一方面,x轴的间距也是可以被扭曲的, 30 00:01:36,125 --> 00:01:40,414 这种扭曲通常发生在 呈现某事物随着时间改变的线形图上。 31 00:01:40,414 --> 00:01:44,747 这张图标呈现的是美国2008年 到2010年的失业情况, 32 00:01:44,747 --> 00:01:47,996 其使用了两种方法操纵x轴。 33 00:01:47,996 --> 00:01:50,395 首先,x轴的间距是不一致的。 34 00:01:50,395 --> 00:01:53,416 2009年3月之后的15个月的跨度被压缩 35 00:01:53,416 --> 00:01:56,755 使其看起来比之前的6个月还短。 36 00:01:56,755 --> 00:02:00,106 如果使用一致的数据点, 我们将会看到一张截然不同的图表, 37 00:02:00,106 --> 00:02:03,705 其中的失业情况在2009年年底之后逐渐减弱。 38 00:02:03,705 --> 00:02:06,675 如果你对图表前一部分的 失业情况为何会加重感到不解, 39 00:02:06,675 --> 00:02:10,615 其原因是该图表中时间线的起点正是金融海啸之后 40 00:02:10,615 --> 00:02:12,626 美国开始财政崩溃之后的时刻。 41 00:02:12,626 --> 00:02:15,219 这种技巧被称为“计划性选择”。 42 00:02:15,219 --> 00:02:18,869 也就是通过别有用心地选择一个时间段 43 00:02:18,869 --> 00:02:20,648 来排除该时间段之外发生的某一事件的影响。 44 00:02:20,648 --> 00:02:24,762 而选择某些特定的数据点 可以掩盖该时间段内的重要变化。 45 00:02:24,762 --> 00:02:27,356 即使图表本身没有任何错误, 46 00:02:27,356 --> 00:02:30,937 省略某些相关的数据点 也会让人留下错误的印象。 47 00:02:30,937 --> 00:02:33,997 统计每年观看超级碗观众人数的表格 48 00:02:33,997 --> 00:02:37,626 让人们以为超级碗的人气火爆。 49 00:02:37,626 --> 00:02:40,198 但事实上它统计的并不是观众人数的成长。 50 00:02:40,198 --> 00:02:41,967 事实上,超级碗的收视率是保持稳定的, 51 00:02:41,967 --> 00:02:45,109 因为虽然球迷的数量在增加, 52 00:02:45,109 --> 00:02:47,959 但是每名观众的收视占有率却并没有增加。 53 00:02:47,959 --> 00:02:49,888 最后,在不知道图表呈现的重点的情况下, 54 00:02:49,888 --> 00:02:53,318 人们很难从其中获得有用的信息。 55 00:02:53,318 --> 00:02:56,457 以下的两幅图利用了国家环境信息中心提供的 56 00:02:56,457 --> 00:02:59,719 同一组海洋温度的数据。 57 00:02:59,719 --> 00:03:02,490 然而为什么它们却看起来完全相反呢? 58 00:03:02,490 --> 00:03:05,279 第一幅图描绘了1880年到2016年的 59 00:03:05,279 --> 00:03:07,987 年平均海洋温度。 60 00:03:07,987 --> 00:03:10,149 虽然温度的变化看起来并不明显, 61 00:03:10,149 --> 00:03:12,878 但是,即使是半摄氏度的温度上升 62 00:03:12,878 --> 00:03:15,799 也可能导致严重的生态问题。 63 00:03:15,799 --> 00:03:17,219 这也就是为什么 64 00:03:17,219 --> 00:03:19,858 呈现了年平均温度波动的第二张图表 65 00:03:19,858 --> 00:03:22,390 重要性远大于第一张。 66 00:03:22,390 --> 00:03:27,379 如果使用得当,图表可以帮助我们 更直观地了解复杂的数据。 67 00:03:27,379 --> 00:03:31,180 但是可视化软件一方面大大 增加了图表在各种媒体上的应用, 68 00:03:31,180 --> 00:03:35,900 另一方面粗心大意和刻意误导也变得更加频繁。 69 00:03:35,900 --> 00:03:39,560 因此,下一次在遇到图表时, 不要被直线和曲线的走向误导。 70 00:03:39,560 --> 00:03:40,882 仔细看一看单位、 71 00:03:40,882 --> 00:03:42,130 数值、 72 00:03:42,130 --> 00:03:43,048 间距 73 00:03:43,048 --> 00:03:44,360 以及该图表的背景, 74 00:03:44,360 --> 00:03:46,780 问问自己这张图标到底要传递什么信息。