1 00:00:06,548 --> 00:00:09,077 الإحصائيات مقنعة. 2 00:00:09,077 --> 00:00:12,541 مقنعة جداً لدرجة أن معظم الناس، و المنظمات ودول بأكملها 3 00:00:12,631 --> 00:00:17,747 قد تبني معظم أهم قراراتها على البيانات المعطاة 4 00:00:17,747 --> 00:00:19,484 ولكن هنالك مشكلة 5 00:00:19,484 --> 00:00:23,301 أي مجموعة من الإحصاءات ربما تخبئ شيئاً بداخلها 6 00:00:23,301 --> 00:00:27,251 شيئاً قد يقلب النتائج رأساً على عقب 7 00:00:27,251 --> 00:00:30,920 على سبيل المثال: تخيل أن عليك الاختيار بين مستشفيين 8 00:00:30,920 --> 00:00:33,737 من أجل عملية لقريبتك الكبيرة في السن 9 00:00:33,737 --> 00:00:36,434 من آخر 1000 مريض في كلا المستشفيين 10 00:00:36,434 --> 00:00:39,612 900 منهم نجا في المشفى أ، 11 00:00:39,612 --> 00:00:43,021 بينما فقط 800 منهم نجا في المشفى ب 12 00:00:43,021 --> 00:00:46,170 إذاً يبدو لك أن المشفى أ هو الخيار الأفضل 13 00:00:46,170 --> 00:00:47,843 ولكن قبل أن تتخذ قرارك 14 00:00:47,843 --> 00:00:51,411 تذكر أنه ليس كل المرضى وصلوا إلى المشفى 15 00:00:51,411 --> 00:00:53,811 بنفس مستوى الصحة 16 00:00:53,811 --> 00:00:56,703 وإذا قسمنا كل 1000 مريض 17 00:00:56,703 --> 00:01:01,132 إلى قسمين هؤلاء الذين وصلوا بصحة جيدة والذين وصلوا بصحة متدنية 18 00:01:01,132 --> 00:01:03,772 قد تختلف الصورة كثيراً 19 00:01:03,772 --> 00:01:07,849 فقط 100 مريض وصلوا مستشفى أ في حال متدنية 20 00:01:07,849 --> 00:01:10,325 والذي عاش منهم 30 21 00:01:10,325 --> 00:01:14,852 بينما 400 مريض وصلوا مشفى ب وقد تمكنوا من إنقاذ 210 منهم 22 00:01:14,852 --> 00:01:17,169 إذاً مشفى ب هو الخيار الافضل 23 00:01:17,169 --> 00:01:20,741 للمرضى الذين يصلون للمشفى في حال متدنية 24 00:01:20,741 --> 00:01:24,526 مع نسبة نجاة بنسبة 52.5% 25 00:01:24,526 --> 00:01:28,445 وماذا إذا كانت صحة قريبتك جيدة عندما وصلت إلى المشفى 26 00:01:28,445 --> 00:01:32,271 بشكل غريب ستجد أن مشفى ب لايزال الخيار الأفضل 27 00:01:32,271 --> 00:01:35,676 بنسبة نجاة تصل إلى 98% 28 00:01:35,676 --> 00:01:38,733 إذاً كيف أظهرت الإحصائيات أن مشفى أ أفضل في نسبة النجاة الكلية 29 00:01:38,733 --> 00:01:44,830 إذا كان مشفى ب قد حصل على نسبة نجاة أعلى في كل المجموعتين؟ 30 00:01:44,830 --> 00:01:48,589 ذلك الذي استعرضناه من قبل هي حالة تسمى بمفارقة سيمبسون 31 00:01:48,589 --> 00:01:51,899 عندما يكون لدينا نفس مجموعة البيانات ولكن تظهر بنتيجتين متعاكستين 32 00:01:51,899 --> 00:01:54,664 اعتماداً على طريقة تقسيمها 33 00:01:54,664 --> 00:01:58,744 هذا يحدث غالباً إذا كانت البيانات المجموعة تخفي متغيرات شرطية 34 00:01:58,744 --> 00:02:01,377 وأحياناً تعرف بالمتغيرات المندسَّة 35 00:02:01,377 --> 00:02:06,584 وهي عوامل إضافية مندسَّة قد تؤثر في النتيجة بشكل كامل 36 00:02:06,584 --> 00:02:10,023 وهنا، العامل المندس هو العلاقة بين نسبة المرضى 37 00:02:10,023 --> 00:02:13,264 الذين وصلوا بصحة جيدة أو بصحة متدنية 38 00:02:13,264 --> 00:02:16,544 مفارقة سيبمسون ليست مجرد سيناريو افتراضي 39 00:02:16,544 --> 00:02:18,924 إنها تظهر لنا من وقت لآخر في العالم الواقعي 40 00:02:18,924 --> 00:02:22,132 وأحيانا في ظروف مهمة 41 00:02:22,132 --> 00:02:24,130 دراسة في المملكة المتحدة أظهرت لنا 42 00:02:24,130 --> 00:02:27,600 أن المدخنين لديهم معدلات عمر أطول من غير المدخنين 43 00:02:27,600 --> 00:02:29,846 خلال عشرين سنة 44 00:02:29,846 --> 00:02:33,307 هذا ماكان إلى أن تم تقسيم المشاركين إلى مجموعات حسب العمر 45 00:02:33,307 --> 00:02:37,823 والتي أظهرت أن المشاركين غير المدخنين كان سنهم أكبر 46 00:02:37,823 --> 00:02:40,930 ولذلك فاحتمالية موتهم خلال فترة الإحصائية أكبر 47 00:02:40,930 --> 00:02:44,438 على وجة التحديد لأنهم عاشوا أطول بشكل عام 48 00:02:44,438 --> 00:02:47,286 وهنا عامل التقسيم حسب العمر هو العامل المندس 49 00:02:47,286 --> 00:02:50,176 ولذلك من المهم أن نفسر البيانات المعطاة جيدا 50 00:02:50,176 --> 00:02:51,559 وفي مثال آخر 51 00:02:51,559 --> 00:02:54,281 في تحليل لأحكام الإعدام في بعض القضايا في فلوريدا 52 00:02:54,281 --> 00:02:58,265 بدا أنه يكشف أنه ليس هنالك أي تفاوت عرقي في الحكم 53 00:02:58,265 --> 00:03:01,581 بين المتهمين البيض والسود في قضايا القتل 54 00:03:01,581 --> 00:03:06,396 ولكن إذا قسمنا القضية حسب عرق الضحايا تصبح لدينا قصة مختلفة 55 00:03:06,396 --> 00:03:07,969 في كلا الوضعين 56 00:03:07,969 --> 00:03:11,091 المتهمين السود غالباً ما يحكم عليهم بالإعدام 57 00:03:11,091 --> 00:03:15,066 مع ارتفاع طفيف في أحكام الإعدام على المتهمين البيض 58 00:03:15,066 --> 00:03:18,692 في القضايا التي تكون فيها قتل للبيض 59 00:03:18,692 --> 00:03:21,359 غالباً مايُحكم فيها بالإعدام 60 00:03:21,359 --> 00:03:24,091 عن تلك القضايا التي يكون فيها الضحايا سود 61 00:03:24,091 --> 00:03:28,483 ومعظم قضايا القتل تحدث بين شخصين من نفس العرق 62 00:03:28,483 --> 00:03:31,319 إذا ً كيف نتجنب الوقوع في المفارقة؟ 63 00:03:31,319 --> 00:03:34,686 لسوء الحظ ليس هنالك إجابة قد تناسب كل الحالات 64 00:03:34,686 --> 00:03:38,504 بإمكاننا تجميع البيانات وفرزها بطرق لا حصر لها 65 00:03:38,504 --> 00:03:42,106 وبشكل عام الأرقام أحياناً بإمكانها إعطائنا صورة أصح 66 00:03:42,106 --> 00:03:46,638 من البيانات المقسمة إلى مجموعات مضللة أو اعتباطية 67 00:03:46,638 --> 00:03:52,089 كل ما بإمكاننا فعله هو دراسة الأوضاع الفعلية الموصوفة علميا 68 00:03:52,089 --> 00:03:55,977 وملاحظة ما إذا كان هنالك عوامل مندسة 69 00:03:55,977 --> 00:03:59,378 وإلا فنحن نجعل من أنفسنا ضحية سهلة لهؤلاء الذين قد يستخدمون البيانات 70 00:03:59,378 --> 00:04:02,649 لخداع الآخرين وتمرير أفكارهم الخاصة