1 00:00:06,636 --> 00:00:09,077 علمِ آمار متقاعد کننده است. 2 00:00:09,077 --> 00:00:12,541 آنقدر که افراد، سازمان ها، و تمامی کشورها 3 00:00:12,541 --> 00:00:17,747 برخی از تصمیمات بسیار مهمشان را بر پایه داده های طبقه بندی شده می گذارند. 4 00:00:17,747 --> 00:00:19,484 ولی این یک ایراد دارد. 5 00:00:19,484 --> 00:00:23,301 هر مجموعه آماری ممکن است چیزی در خفا در خود داشته باشد، 6 00:00:23,301 --> 00:00:27,251 چیزی که ممکن است نتایج را بکلی تغییر دهد. 7 00:00:27,251 --> 00:00:30,920 بعنوان مثال، تصور کنید که باید از بین دو بیمارستان یکی را 8 00:00:30,920 --> 00:00:33,737 را برای جراحی یک خویشاوند مُسن انتخاب کنید. 9 00:00:33,737 --> 00:00:36,434 از ۱٫۰۰۰ نفر بیمار اخیر هر بیمارستان، 10 00:00:36,434 --> 00:00:39,612 ۹۰۰ نفر در بیمارستان الف جان بدر بردند، 11 00:00:39,612 --> 00:00:43,021 در حالیکه در بیمارستان ب ۸۰۰ نفر زنده ماندند. 12 00:00:43,021 --> 00:00:46,170 پس بنظر می آید که بیمارستان الف گزینه بهتری است. 13 00:00:46,170 --> 00:00:47,843 ولی قبل از اینکه تصمیم بگیرید، 14 00:00:47,843 --> 00:00:51,411 بخاطر داشته باشید که همه بیماران با سلامت یکسان 15 00:00:51,411 --> 00:00:53,811 به بیمارستان آورده نشده اند. 16 00:00:53,811 --> 00:00:56,703 و اگر ۱٫۰۰۰ بیمار اخیر هر بیمارستان را به دو گروه تقسیم کنیم 17 00:00:56,703 --> 00:01:01,132 آنهایی که به سلامت خوبی آمدند، و اونهایی که با سلامت کم آمده اند، 18 00:01:01,132 --> 00:01:03,772 تصویر بسیار متفاوتی بنظر می آید. 19 00:01:03,772 --> 00:01:07,849 بیمارستان الف تنها ۱۰۰ بیمار با سلامت کم داشته است، که 20 00:01:07,849 --> 00:01:10,325 ۳۰ تا از آنها زنده ماندند. 21 00:01:10,325 --> 00:01:14,852 اما بیمارستان ب ۴۰۰ تا داشته، که توانستن ۲۱۰ تا را نجات دهد. 22 00:01:14,852 --> 00:01:17,169 پس بیمارستان ب گزینه بهتریست برای 23 00:01:17,169 --> 00:01:20,741 بیمارانی که با شرایط سلامتی ضعیف می رسند، 24 00:01:20,741 --> 00:01:24,526 با نرخ حیات ۵۲/۵ %. 25 00:01:24,526 --> 00:01:28,445 و اگر حال خویشاوند شما وقتی به بیمارستان می رسد خوب باشد چطور؟ 26 00:01:28,445 --> 00:01:32,271 شگفت آور اینکه، بیمارستان ب هنوز گزینه بهتری است، 27 00:01:32,271 --> 00:01:35,676 با نرخ نجات بالای ۹۸%. 28 00:01:35,676 --> 00:01:38,733 پس چطور بیمارستان الف می تواند نرخ بقای کلی بهتری داشته باشد 29 00:01:38,733 --> 00:01:44,830 اگر بیمارستان ب برای بیماران در هر یک از گروه نرخ بقای بهتری دارد؟ 30 00:01:44,830 --> 00:01:48,589 چیزی که ما به آن مواجهیم موردی از پاردوکس سیمسون است، 31 00:01:48,589 --> 00:01:51,899 جایی که مجموعه داده های یکسان می توانند روند متضاد نشان دهند، 32 00:01:51,899 --> 00:01:54,664 بسته به آنکه چگونه دسته بندی شده اند. 33 00:01:54,664 --> 00:01:58,744 این اغلب وقتی رخ می دهد که انبوه داده ها یک متغیر مشروط را پنهان کرده اند، 34 00:01:58,744 --> 00:02:01,377 چیزی که به متغیر مخفی شناخته می شود، 35 00:02:01,377 --> 00:02:06,584 که یک فاکتور نهانی اضافی است که نتایج را بطور چشمگیری تحت تاثیر قرار می دهد. 36 00:02:06,584 --> 00:02:10,023 در اینجا، فاکتور پنهان نسبت سهم بیمارانی است که 37 00:02:10,023 --> 00:02:13,264 با حالِ خوب یا بد حال به بیمارستان می رسند. 38 00:02:13,264 --> 00:02:16,544 پاردوکس سیمسون فقط یک سناریو فرضی نیست. 39 00:02:16,544 --> 00:02:18,924 گاه به گاه در دنیا واقعی سر می زند، 40 00:02:18,924 --> 00:02:22,132 بضی اوقات در زمینه های مهم. 41 00:02:22,132 --> 00:02:24,130 یک مطالعه در بریتانیا اینطور نشان می داد 42 00:02:24,130 --> 00:02:27,600 که سیگاری ها بیشتر از غیر سیگاری ها شانس زنده ماندن دارند 43 00:02:27,600 --> 00:02:29,846 در یک دوره ۲۰ ساله. 44 00:02:29,846 --> 00:02:33,307 تقسیم شرکت کنندگان در گروههای سنی 45 00:02:33,307 --> 00:02:37,823 نشان میدهد که افراد غیرسیگاری بطور چشمگیری مسنتر از متوسط افراد هستند، 46 00:02:37,823 --> 00:02:40,930 و در نتیجه ممکن هست که در دوره این بررسی فوت کنند، 47 00:02:40,930 --> 00:02:44,438 دقیقا به دلیل اینکه آنها زندگی طولانیتر داشتهاند. 48 00:02:44,438 --> 00:02:47,286 در اینجا، گروه های سنی در خفا مانده، 49 00:02:47,286 --> 00:02:50,176 و تفسیر درست داده ها حیاتی است. 50 00:02:50,176 --> 00:02:51,559 در مثال دیگری، 51 00:02:51,559 --> 00:02:54,281 تحلیلی در مورد حکم های اعدام در فلوریدا 52 00:02:54,281 --> 00:02:58,265 نشان میدهد که هیچ اختلاف نژادی در صدور حکم 53 00:02:58,265 --> 00:03:01,581 بین متهمین سفید پوست و سیاه پوست محکوم به اعدام وجود ندارد. 54 00:03:01,581 --> 00:03:06,396 اما جداسازی پروندهای با نژاد قربانیان داستان دیگری را بیان میکند. 55 00:03:06,396 --> 00:03:07,969 در هر دو وضعیت، 56 00:03:07,969 --> 00:03:11,091 حکم اعدام بیشتری برای متهمین سیاه پوست صادر شده است. 57 00:03:11,091 --> 00:03:15,066 در کل نرخ حکم اعدام برای متهمین سفید پوست کمی بیشتر بوده 58 00:03:15,066 --> 00:03:18,692 بر پایه این واقعیت که قربانیهای آنها سفید پوست بودند 59 00:03:18,692 --> 00:03:22,229 تا اینکه حکم اعدام برای مواردی که قربانیهای آنها سیاه پوست بوده اند، 60 00:03:22,229 --> 00:03:25,731 ( اگر قربانیها سفیدپوست بود حکم اعدام بیشتری صادر میشد تا اگر سیاهپوست بود) 61 00:03:25,731 --> 00:03:28,513 ضمن اینکه بیشتر قتلها بین افراد همنژاد اتفاق میافتد. 62 00:03:28,513 --> 00:03:31,319 خُب چگونه میتوان از افتادن در این تناقضات اجتناب کنیم؟ 63 00:03:31,319 --> 00:03:34,686 متاسفانه، پاسخ مناسبی برای این وجود ندارد. 64 00:03:34,686 --> 00:03:38,504 دادهها میتوانند به روشهای متعددی دستهبندی و تقسیمبندی شوند، 65 00:03:38,504 --> 00:03:42,106 و تعداد کلی ممکن است گاهی یک تصویر دقیقتری را ارائه دهد 66 00:03:42,106 --> 00:03:46,638 تا تقسیمبندی گمراه کننده و یا دستههای دلخواه دادهها. 67 00:03:46,638 --> 00:03:52,089 آنچه که میتوانیم بکنیم این است که به دقت وضعیتهای واقعی آمارها را مطالعه کنیم 68 00:03:52,089 --> 00:03:55,977 و نظر گرفتن اینکه آیا متغیرهای پنهانی ممکن است وجود داشته باشد. 69 00:03:55,977 --> 00:03:59,378 در غیر این صورت، خودمان را در مقابل کسانی که ازاین دادهها برای 70 00:03:59,522 --> 00:04:03,522 گول زدن مردم و ترویج برنامههایشان از آنها استفاده میکنند آسیبپذیر میکنیم.