0:00:06.636,0:00:09.077 สถิติสามารถโน้มน้าวคนได้ 0:00:09.077,0:00:12.541 มากพอที่ทำให้คน องค์กร [br]และประเทศทั้งหลาย 0:00:12.541,0:00:17.747 ตัดสินใจในสิ่งสำคัญ ๆ บนพื้นฐาน[br]ของข้อมูลที่ถูกจัดเป็นระบบแล้ว 0:00:17.747,0:00:19.484 แต่ตรงนั้นแหละที่เป็นปัญหา 0:00:19.484,0:00:23.301 สถิติชุดใด ๆ อาจมีสิ่งที่ซุ่มซ่อนอยู่ในนั้น 0:00:23.301,0:00:27.251 บางอย่างทีอาจทำให้ผลลัพธ์[br]กลับหัวกลับหางไปอย่างสิ้นเชิง 0:00:27.251,0:00:30.920 ยกตัวอย่างเช่น ลองนึกภาพว่า[br]คุณต้องเลือกระหว่าง 2 โรงพยาบาล 0:00:30.920,0:00:33.737 ให้กับญาติสูงอายุของคุณ[br]เข้ารับการผ่าตัด 0:00:33.737,0:00:36.434 จากคนไข้ 1,000 คนล่าสุด[br]ของแต่ละโรงพยาบาล 0:00:36.434,0:00:39.612 900 คน รอดชีวิตจากโรงพยาบาล A 0:00:39.612,0:00:43.021 ในขณะที่มีเพียง 800 คน[br]ที่รอดชีวิตจากโรงพยาบาล B 0:00:43.021,0:00:46.170 ดังนั้น มันอาจดูเหมือนว่าโรงพยาบาล A [br]น่าจะเป็นทางเลือกที่ดีกว่า 0:00:46.170,0:00:47.843 แต่ก่อนที่คุณจะตัดสินใจ 0:00:47.843,0:00:51.411 พึงจำไว้ว่า คนไข้ทั้งหมด[br]ที่เข้ามาที่โรงพยาบาล 0:00:51.411,0:00:53.811 ไม่ได้เข้ามา[br]ด้วยสภาวะสุขภาพแบบเดียวกัน 0:00:53.811,0:00:56.703 และถ้าหากเราแบ่งคนไข้ 1,000 คนสุดท้าย[br]ของแต่ละโรงพยาบาลออกเป็น 0:00:56.703,0:01:01.132 ผู้ที่เข้ามายังโรงพยาบาลด้วยสภาพร่างกาย[br]ที่แข็งแรงและไม่แข็งแรง 0:01:01.132,0:01:03.772 ภาพรวมก็เริ่มที่จะดูต่างออกไป 0:01:03.772,0:01:07.849 โรงพยาบาล A มีคนไข้เพียง 100 คน[br]ที่เข้ามาด้วยสภาพร่างกายที่ไม่แข็งแรง 0:01:07.849,0:01:10.325 ซึ่งมีผู้รอดชีวิต 30 คน 0:01:10.325,0:01:14.852 แต่โรงพยาบาล B มี 400 คน[br]และพวกเขาช่วยชีวิตไว้ได้ 210 คน 0:01:14.852,0:01:17.169 ฉะนั้น โรงพยาบาล B เป็นตัวเลือกที่ดีกว่า 0:01:17.169,0:01:20.741 สำหรับผู้ป่วยที่เข้ามายังโรงพยบาล[br]ด้วยสภาพร่างกายที่ไม่แข็งแรง 0:01:20.741,0:01:24.526 ซึ่งอัตราการรอดชีวิตคือ 52.5% 0:01:24.526,0:01:28.445 แล้วญาติของคุณมีสภาพร่างกายที่ดี[br]ตอนเข้ามาที่โรงพยาบาลหรือเปล่า 0:01:28.445,0:01:32.271 น่าแปลกที่โรงพยาบาล B[br]ยังเป็นตัวเลือกที่ดีกว่า 0:01:32.271,0:01:35.676 ด้วยอัตราการรอดชีวิต 98% 0:01:35.676,0:01:38.733 แล้วโรงพยาบาล A [br]มีอัตราการรอดชีวิตทั้งหมดดีกว่าได้อย่างไร 0:01:38.733,0:01:44.830 ถ้าโรงพยาบาล B มีอัตราการอดชีวิต[br]สำหรับผู้ป่วยในแต่ละกลุ่มสูงกว่า 0:01:44.830,0:01:48.589 สิ่งที่เราเจออยู่นี้ คือ ซิมสันพาราด๊อก[br](Simpson's paradox) 0:01:48.589,0:01:51.899 ซึ่งข้อมูลกลุ่มเดียวกัน[br]สามารถที่จะแสดงแนวโน้มที่ตรงข้ามกันได้ 0:01:51.899,0:01:54.664 ขึ้นอยู่กับว่าเราจะจัดกลุ่มมันอย่างไร 0:01:54.664,0:01:58.744 มันเกิดขึ้นเป็นประจำเมื่อข้อมูลที่ถูกนำมารวมกัน[br]ซ่อนตัวแปรที่มีเงื่อนไขเอาไว้ 0:01:58.744,0:02:01.377 บางครั้งมันถูกเรียกว่า ตัวแปรซุกซ่อน 0:02:01.377,0:02:06.584 ซึ่งซ่อนปัจจัยอื่น ๆ [br]ที่มีผลต่อผลลัพท์อย่างมีนัยสำคัญ 0:02:06.584,0:02:10.023 ในที่นี้ ปัจจัยที่ถูกซ่อนอยู่[br]คืออัตราส่วนสัมพัทธ์ของคนไข้ 0:02:10.023,0:02:13.264 ผู้ซึ่งมาที่โรงพยาบาลด้วยสภาพร่างกาย[br]ที่แข็งแรงหรือไม่แข็งแรง 0:02:13.264,0:02:16.544 ซิมสันพาราด๊อกไม่ได้เป็นเพียง[br]เหตุการณ์ในทางทฤษฎี 0:02:16.544,0:02:18.924 มันเกิดขึ้นจริง ๆ เป็นครั้งคราว 0:02:18.924,0:02:22.132 บางครั้งในบริบทที่สำคัญ 0:02:22.132,0:02:24.130 การศึกษาหนึ่งในสหราชอาณาจักร[br]แสดงว่า 0:02:24.130,0:02:27.600 ผู้ที่สูบบุหรี่มีอัตราการรอดชีวิต[br]สูงกว่าผู้ที่ไม่สูบบุหรี่ 0:02:27.600,0:02:29.846 ตลอดระยะเวลายี่สิบปี 0:02:29.846,0:02:33.307 จนกระทั่งเราแบ่งกลุ่มคนไข้ตามกลุ่มอายุ 0:02:33.307,0:02:37.823 ซึ่งจะแสดงให้เห็นว่าผู้ที่ไม่สูบบุหรี่[br]มีอายุเฉลี่ยมากกว่าอย่างมีนัยสำคัญ 0:02:37.823,0:02:40.930 และดังนั้น จึงเป็นไปได้มากกว่า[br]ที่พวกเขาจะเสียชีวิตในช่วงทดสอบ 0:02:40.930,0:02:44.438 เนื่องจากพวกเขาโดยส่วนมากมีอายุมากกว่า 0:02:44.438,0:02:47.286 นี่คือกลุ่มอายุที่มีตัวแปรซุกซ่อน 0:02:47.286,0:02:50.176 และมีความสำคัญต่อการตีความข้อมูล[br]อย่างถูกต้อง 0:02:50.176,0:02:51.559 ในอีกตัวอย่างหนึ่ง 0:02:51.559,0:02:54.281 การวิเคราะห์คดีของรัฐฟลอริด้า[br]เกี่ยวกับการลงโทษประหารชีวิต 0:02:54.281,0:02:58.265 เหมือนว่าจะเปิดเผยว่า[br]ไม่มีความแตกต่างระหว่างเชื้อชาติ 0:02:58.265,0:03:01.581 ระหว่างผู้ต้องหาผิวดำและขาว[br]ที่โดนตั้งข้อหาฆาตกรรม 0:03:01.581,0:03:06.396 แต่การแบ่งคดีตามสีผิวของเหยื่อ[br]บอกเรื่องราวที่ต่างกันออกไป 0:03:06.396,0:03:07.969 ไม่ว่าในสถานการณ์ไหน 0:03:07.969,0:03:11.091 ผู้ต้องหาผิวดำ[br]มักจะถูกตัดสินประหารชีวิตมากกว่า 0:03:11.091,0:03:15.066 อัตราการตัดสินที่สูงกว่าเล็กน้อย[br]สำหรับผู้ต้องหาผิวขาว 0:03:15.066,0:03:18.692 เป็นเพราะว่าคดีที่มีเหยื่อเป็นคนผิวขาว 0:03:18.692,0:03:21.359 มักจะถูกตัดสินให้ได้รับโทษประหาร 0:03:21.359,0:03:24.091 มากกว่ากรณีที่เหยื่อเป็นคนผิวดำ 0:03:24.091,0:03:28.483 และฆาตกรรมส่วนใหญ่จะเกิดขึ้น[br]ในกลุ่มผู้มีสีผิวเดียวกัน 0:03:28.483,0:03:31.319 ฉะนั้น เราจะหลีกเลี่ยง[br]การตกหลุมพาราด๊อกได้อย่างไร 0:03:31.319,0:03:34.686 น่าเสียดายที่มันไม่มีคำตอบตายตัว 0:03:34.686,0:03:38.504 ข้อมูลสามารถถูกจัดกลุ่ม[br]และถูกแบ่งได้หลายรูปแบบ 0:03:38.504,0:03:42.106 และจำนวนทั้งหมด [br]บางครั้งให้ภาพที่แม่นยำ 0:03:42.106,0:03:46.638 กว่าข้อมูลที่ถูกแบ่งเป็นหมวดหมู่[br]ที่ชวนสับสนและไร้กฎเกณฑ์ 0:03:46.638,0:03:52.089 ทั้งหมดที่เราทำได้คือศึกษาสถานการณ์[br]ที่สถิติอธิบายอย่างระมัดระวัง 0:03:52.089,0:03:55.977 และพิจารณาว่ามันมีตัวแปรซุกซ่อนอยู่หรือเปล่า 0:03:55.977,0:03:59.378 มิฉะนั้นแล้ว เราทำให้ตัวเราเสี่ยง[br]กับผู้ที่อาจใช้ข้อมูล 0:03:59.378,0:04:02.649 ในการเหนี่ยวนำคนอื่น ๆ [br]และส่งเสริมแผนการของพวกเขาเอง