Một hãng kem đánh răng khẳng định
sản phẩm của họ sẽ diệt mảng bám
sạch hơn mọi sản phẩm khác.
Một chính trị gia nói rằng chiến lược
của họ sẽ tạo ra nhiều việc làm nhất.
Ta đã quá quen khi phải nghe
các thông tin phóng đại
từ quảng cáo hay chính trị,
nhiều đến mức ta chẳng còn để ý đến nữa.
Nhưng nếu những khẳng định đó
có biểu đồ đi kèm thì sao?
Biểu đồ không chỉ là một quan điểm.
Chúng thể hiện các số liệu chính xác
và ai có thể tranh cãi với chúng ?
Nhưng thực ra, có rất nhiều cách
để biểu đồ bị sai lệch,
thậm chí bị bóp méo hoàn toàn.
Sau đây là vài ví dụ tiêu biểu.
Năm 1992, Chevy tuyên bố đã tạo ra
những chiếc xe tải tốt nhất nước Mĩ
bằng biểu đồ này.
Không những nó chỉ ra 98% số xe tải Chevy
đã được bán trong vòng mười năm gần nhất
hiện vẫn còn được sử dụng,
mà nó còn trông giống như
xe Chevy bền gấp đôi xe Toyota.
Nhưng hãy để ý kỹ hơn
các con số ở trục tung bên trái,
bạn sẽ thấy số liệu của xe Toyota
vào khoảng 96,5%,
và thang chia chỉ từ 95 tới 100%.
Nếu thang chia từ 0 tới 100%,
biểu đồ sẽ nhìn như thế này.
Đây là cách phổ biến
để thể hiện sai lệch dữ liệu trên biểu đồ,
bằng việc thay đổi độ chia của trục.
Dù chỉ phóng to một phần nhỏ
trên trục tung,
nhưng nó đã phóng đại lên sự chênh lệch
ít bị phát hiện giữa các chỉ số so sánh.
Cách này cực hiệu quả với biểu đồ cột,
vì ta hay lầm tưởng độ cao của các cột
tỷ lệ với giá trị thực của nó.
Nhưng trục hoành cũng có thể
dễ dàng bị bóp méo
khi thể hiện sự thay đổi theo thời gian
ở biểu đồ đường.
Biểu đồ này thể hiện sự gia tăng số người
thất nghiệp ở Mỹ từ năm 2008 đến năm 2010,
trục hoành của nó
đã bị bóp méo theo hai cách.
Thứ nhất, độ chia thời gian
không thống nhất,
cắt ngắn độ dài khoảng 15 tháng
sau mốc tháng ba năm 2009,
để khiến nó trông ngắn hơn
khoảng thời gian sáu tháng trước đó.
Sử dụng các mốc dữ liệu đồng nhất
sẽ đưa ra một cái nhìn khác
với lượng người thất nghiệp giảm dần
vào cuối năm 2009.
Nếu bạn thắc mắc lý do tại sao
số người thất nghiệp lại tăng
thì biểu đồ đó được lập ngay sau
cuộc khủng hoảng tài chính lớn nhất ở Mỹ
kể từ sau Đại suy thoái.
Thủ thuật này được gọi
với cái tên "hái cherry".
Các khoảng thời gian được chọn cẩn thận
để lấp liếm những ảnh hưởng
diễn ra quanh một sự kiện chính.
Và chỉ lấy một số mốc thời gian cụ thể
để che giấu các thay đổi lớn giữa chúng.
Thậm chí khi bản thân biểu đồ không sai,
việc bỏ qua các dữ liệu liên quan
sẽ khiến biểu đồ gây cảm giác sai lệch.
Biểu đồ dưới đây thể hiện
số người xem giải Super Bowl mỗi năm,
khiến ta lầm tưởng rằng
giải đó đang ngày càng được biết đến.
Nhưng biểu đồ chưa tính đến
sự gia tăng dân số.
Tỷ lệ người xem giải hầu như không đổi,
bởi vì số người hâm mộ
bóng bầu dục gia tăng,
nên tỷ lệ của họ
so với tổng lượng người xem không đổi.
Cuối cùng, biểu đồ hầu như ít hiệu quả
nếu bạn không hiểu đầy đủ
về vấn đề đang được đề cập tới.
Cả hai biểu đồ sau đây đều dùng
dữ liệu về nhiệt độ của đại dương
từ Trung tâm Dự báo Khí tượng Mỹ.
Vậy vì sao hai biểu đồ
trông hoàn toàn đối nghịch như vậy?
Biểu đồ thứ nhất đo nhiệt độ
trung bình hằng năm của biển
từ năm 1880 tới năm 2016,
có vẻ như chẳng có thay đổi gì đáng kể.
Nhưng thực ra, nhiệt độ
chỉ cần tăng thêm nửa độ C
là đủ để gây ra thảm hoạ sinh học
trên quy mô cực lớn.
Đó là lý do biểu đồ thứ hai
thể hiện sự chênh lệch
nhiệt độ trung bình theo năm,
đã nhấn mạnh tầm quan trọng
của vấn đề hơn nhiều.
Khi được dùng đúng cách, biểu đồ giúp ta
khái quát được các dữ liệu phức tạp.
Công nghệ đồ hoạ đã giúp biểu đồ
được dùng rộng rãi trong truyền thông,
nhưng điều đó cũng khiến chúng
dễ bị lạm dụng vào mục đích không tốt.
Lần tới khi bạn thấy một biểu đồ,
đừng để bị chúng thuyết phục dễ dàng.
Hãy để ý kỹ vào các trục,
các con số,
cách chia thang đo,
và bối cảnh,
và hãy thắc mắc về điều
mà biểu đồ đó muốn thể hiện.