WEBVTT 00:00:07.658 --> 00:00:10.839 Một hãng kem đánh răng khẳng định sản phẩm của họ sẽ diệt mảng bám 00:00:10.839 --> 00:00:12.890 sạch hơn mọi sản phẩm khác. 00:00:12.890 --> 00:00:16.411 Một chính trị gia nói rằng chiến lược của họ sẽ tạo ra nhiều việc làm nhất. 00:00:16.411 --> 00:00:18.951 Ta đã quá quen khi phải nghe các thông tin phóng đại 00:00:18.951 --> 00:00:20.850 từ quảng cáo hay chính trị, 00:00:20.850 --> 00:00:23.131 nhiều đến mức ta chẳng còn để ý đến nữa. 00:00:23.131 --> 00:00:25.991 Nhưng nếu những khẳng định đó có biểu đồ đi kèm thì sao? 00:00:26.111 --> 00:00:28.471 Biểu đồ không chỉ là một quan điểm. 00:00:28.471 --> 00:00:32.611 Chúng thể hiện các số liệu chính xác và ai có thể tranh cãi với chúng ? 00:00:32.611 --> 00:00:36.393 Nhưng thực ra, có rất nhiều cách để biểu đồ bị sai lệch, 00:00:36.403 --> 00:00:38.192 thậm chí bị bóp méo hoàn toàn. 00:00:38.192 --> 00:00:40.715 Sau đây là vài ví dụ tiêu biểu. 00:00:40.745 --> 00:00:45.760 Năm 1992, Chevy tuyên bố đã tạo ra những chiếc xe tải tốt nhất nước Mĩ 00:00:45.760 --> 00:00:47.480 bằng biểu đồ này. 00:00:47.510 --> 00:00:51.963 Không những nó chỉ ra 98% số xe tải Chevy đã được bán trong vòng mười năm gần nhất 00:00:51.963 --> 00:00:53.592 hiện vẫn còn được sử dụng, 00:00:53.592 --> 00:00:57.258 mà nó còn trông giống như xe Chevy bền gấp đôi xe Toyota. 00:00:57.338 --> 00:01:00.634 Nhưng hãy để ý kỹ hơn các con số ở trục tung bên trái, 00:01:00.634 --> 00:01:05.472 bạn sẽ thấy số liệu của xe Toyota vào khoảng 96,5%, 00:01:05.472 --> 00:01:09.303 và thang chia chỉ từ 95 tới 100%. 00:01:09.313 --> 00:01:12.963 Nếu thang chia từ 0 tới 100%, biểu đồ sẽ nhìn như thế này. 00:01:12.963 --> 00:01:16.243 Đây là cách phổ biến để thể hiện sai lệch dữ liệu trên biểu đồ, 00:01:16.243 --> 00:01:18.163 bằng việc thay đổi độ chia của trục. 00:01:18.163 --> 00:01:20.804 Dù chỉ phóng to một phần nhỏ trên trục tung, 00:01:20.804 --> 00:01:25.703 nhưng nó đã phóng đại lên sự chênh lệch ít bị phát hiện giữa các chỉ số so sánh. 00:01:25.703 --> 00:01:27.974 Cách này cực hiệu quả với biểu đồ cột, 00:01:27.974 --> 00:01:31.013 vì ta hay lầm tưởng độ cao của các cột 00:01:31.023 --> 00:01:33.233 tỷ lệ với giá trị thực của nó. 00:01:33.233 --> 00:01:36.125 Nhưng trục hoành cũng có thể dễ dàng bị bóp méo 00:01:36.125 --> 00:01:40.414 khi thể hiện sự thay đổi theo thời gian ở biểu đồ đường. 00:01:40.414 --> 00:01:44.747 Biểu đồ này thể hiện sự gia tăng số người thất nghiệp ở Mỹ từ năm 2008 đến năm 2010, 00:01:44.747 --> 00:01:47.996 trục hoành của nó đã bị bóp méo theo hai cách. 00:01:47.996 --> 00:01:50.405 Thứ nhất, độ chia thời gian không thống nhất, 00:01:50.405 --> 00:01:53.416 cắt ngắn độ dài khoảng 15 tháng sau mốc tháng ba năm 2009, 00:01:53.416 --> 00:01:56.755 để khiến nó trông ngắn hơn khoảng thời gian sáu tháng trước đó. 00:01:56.755 --> 00:02:00.106 Sử dụng các mốc dữ liệu đồng nhất sẽ đưa ra một cái nhìn khác 00:02:00.106 --> 00:02:03.705 với lượng người thất nghiệp giảm dần vào cuối năm 2009. 00:02:03.705 --> 00:02:06.675 Nếu bạn thắc mắc lý do tại sao số người thất nghiệp lại tăng 00:02:06.675 --> 00:02:10.615 thì biểu đồ đó được lập ngay sau cuộc khủng hoảng tài chính lớn nhất ở Mỹ 00:02:10.615 --> 00:02:12.586 kể từ sau Đại suy thoái. 00:02:12.626 --> 00:02:15.219 Thủ thuật này được gọi với cái tên "hái cherry". 00:02:15.219 --> 00:02:18.869 Các khoảng thời gian được chọn cẩn thận để lấp liếm những ảnh hưởng 00:02:18.869 --> 00:02:20.648 diễn ra quanh một sự kiện chính. 00:02:20.648 --> 00:02:24.762 Và chỉ lấy một số mốc thời gian cụ thể để che giấu các thay đổi lớn giữa chúng. 00:02:24.762 --> 00:02:27.356 Thậm chí khi bản thân biểu đồ không sai, 00:02:27.356 --> 00:02:30.937 việc bỏ qua các dữ liệu liên quan sẽ khiến biểu đồ gây cảm giác sai lệch. 00:02:30.937 --> 00:02:33.997 Biểu đồ dưới đây thể hiện số người xem giải Super Bowl mỗi năm, 00:02:33.997 --> 00:02:37.626 khiến ta lầm tưởng rằng giải đó đang ngày càng được biết đến. 00:02:37.626 --> 00:02:40.098 Nhưng biểu đồ chưa tính đến sự gia tăng dân số. 00:02:40.098 --> 00:02:41.967 Tỷ lệ người xem giải hầu như không đổi, 00:02:41.967 --> 00:02:45.109 bởi vì số người hâm mộ bóng bầu dục gia tăng, 00:02:45.109 --> 00:02:47.939 nên tỷ lệ của họ so với tổng lượng người xem không đổi. 00:02:47.969 --> 00:02:49.888 Cuối cùng, biểu đồ hầu như ít hiệu quả 00:02:49.888 --> 00:02:53.318 nếu bạn không hiểu đầy đủ về vấn đề đang được đề cập tới. 00:02:53.318 --> 00:02:56.457 Cả hai biểu đồ sau đây đều dùng dữ liệu về nhiệt độ của đại dương 00:02:56.457 --> 00:02:59.689 từ Trung tâm Dự báo Khí tượng Mỹ. 00:02:59.719 --> 00:03:02.490 Vậy vì sao hai biểu đồ trông hoàn toàn đối nghịch như vậy? 00:03:02.490 --> 00:03:05.279 Biểu đồ thứ nhất đo nhiệt độ trung bình hằng năm của biển 00:03:05.279 --> 00:03:07.987 từ năm 1880 tới năm 2016, 00:03:07.987 --> 00:03:10.149 có vẻ như chẳng có thay đổi gì đáng kể. 00:03:10.149 --> 00:03:12.878 Nhưng thực ra, nhiệt độ chỉ cần tăng thêm nửa độ C 00:03:12.878 --> 00:03:15.799 là đủ để gây ra thảm hoạ sinh học trên quy mô cực lớn. 00:03:15.799 --> 00:03:17.219 Đó là lý do biểu đồ thứ hai 00:03:17.219 --> 00:03:19.858 thể hiện sự chênh lệch nhiệt độ trung bình theo năm, 00:03:19.868 --> 00:03:22.390 đã nhấn mạnh tầm quan trọng của vấn đề hơn nhiều. 00:03:22.390 --> 00:03:27.169 Khi được dùng đúng cách, biểu đồ giúp ta khái quát được các dữ liệu phức tạp. 00:03:27.179 --> 00:03:31.180 Công nghệ đồ hoạ đã giúp biểu đồ được dùng rộng rãi trong truyền thông, 00:03:31.180 --> 00:03:35.900 nhưng điều đó cũng khiến chúng dễ bị lạm dụng vào mục đích không tốt. 00:03:35.900 --> 00:03:39.560 Lần tới khi bạn thấy một biểu đồ, đừng để bị chúng thuyết phục dễ dàng. 00:03:39.560 --> 00:03:40.882 Hãy để ý kỹ vào các trục, 00:03:40.882 --> 00:03:42.130 các con số, 00:03:42.130 --> 00:03:43.048 cách chia thang đo, 00:03:43.048 --> 00:03:44.370 và bối cảnh, 00:03:44.370 --> 00:03:47.060 và hãy thắc mắc về điều mà biểu đồ đó muốn thể hiện.