0:00:06.636,0:00:08.947 Η στατιστική είναι πειστική. 0:00:08.947,0:00:12.541 Τόσο πολύ που άνθρωποι,[br]οργανώσεις και ολόκληρες χώρες 0:00:12.541,0:00:17.517 βασίζουν ορισμένες από τις πιο κρίσιμες[br]αποφάσεις τους σε οργανωμένα δεδομένα. 0:00:17.517,0:00:19.484 Ωστόσο, υπάρχει ένα πρόβλημα με αυτό. 0:00:19.484,0:00:22.941 Κάθε στατιστικό δείγμα [br]ενδέχεται να ελλοχεύει 0:00:22.941,0:00:27.061 κάτι που ανατρέπει[br]εξ ολοκλήρου τα αποτελέσματα. 0:00:27.061,0:00:30.920 Για παράδειγμα, φαντάσου ότι χρειάζεται[br]να αποφασίσεις μεταξύ δύο νοσοκομείων 0:00:30.920,0:00:33.737 για τη χειρουργική επέμβαση[br]ενός ηλικιωμένου συγγενή. 0:00:33.737,0:00:36.434 Από τους τελευταίους 1.000 ασθενείς[br]κάθε νοσοκομείου, 0:00:36.434,0:00:39.612 στο πρώτο νοσοκομείο επέζησαν 900 0:00:39.612,0:00:42.761 και μόνο 800 στο δεύτερο. 0:00:42.761,0:00:45.730 Επομένως, το πρώτο νοσοκομείο[br]φαντάζει καλύτερη επιλογή. 0:00:45.730,0:00:47.673 Όμως πριν αποφασίσεις, 0:00:47.673,0:00:51.411 θυμίσου ότι δεν έφτασαν[br]όλοι οι πάσχοντες στο νοσοκομείο 0:00:51.411,0:00:53.641 στην ίδια κατάσταση. 0:00:53.811,0:00:57.073 Αν σε κάθε νοσοκομείο διαιρέσουμε[br]τους 1.000 τελευταίους ασθενείς 0:00:57.073,0:01:01.132 σε αυτούς που φτάνουν σε καλή και [br]σε αυτούς που φτάνουν σε άσχημη κατάσταση, 0:01:01.132,0:01:03.772 η εικόνα αρχίζει να αλλάζει σημαντικά. 0:01:03.772,0:01:07.849 Το νοσοκομείο Α είχε μόλις 100 ασθενείς[br]που έφτασαν σε άσχημη κατάσταση υγείας, 0:01:07.849,0:01:10.325 30 από τους οποίους επέζησαν. 0:01:10.325,0:01:14.852 Όμως, το νοσοκομείο Β είχε 400[br]και μπόρεσε να σώσει τους 210. 0:01:14.852,0:01:17.169 Οπότε το δεύτερο είναι καλύτερη επιλογή 0:01:17.169,0:01:20.741 για ασθενείς που φτάνουν στο νοσοκομείο[br]σε κακή κατάσταση υγείας, 0:01:20.741,0:01:24.526 με ποσοστό επιβίωσης 52,5%. 0:01:24.526,0:01:28.445 Αν η κατάσταση υγείας του συγγενή σας[br]είναι καλή όταν φτάνει στο νοσοκομείο; 0:01:28.445,0:01:32.271 Περιέργως, το νοσοκομείο Β[br]είναι πάλι καλύτερη επιλογή, 0:01:32.271,0:01:35.506 με ποσοστό επιβίωσης πάνω από 98%. 0:01:35.506,0:01:38.923 Πώς είναι δυνατό να έχουμε[br]ένα μεγαλύτερο ποσοστό επιβίωσης στο Α 0:01:38.923,0:01:44.830 όταν το Β έχει καλύτερα ποσοστά επιβίωσης[br]και στις δύο ομάδες ασθενών; 0:01:44.830,0:01:48.589 Έχουμε πέσει πάνω στην περίπτωση[br]του παράδοξου του Σίμπσονς 0:01:48.589,0:01:51.899 όπου ίδιες ομάδες δεδομένων[br]μπορούν να δείξουν διαφορετικές τάσεις, 0:01:51.899,0:01:54.164 ανάλογα με την ομαδοποίηση. 0:01:54.504,0:01:58.534 Αυτό συμβαίνει όταν ομαδοποιημένα δεδομένα[br]κρύβουν έναν μεταβλητό παράγοντα, 0:01:58.534,0:02:01.107 γνωστή και ως «κρυφή μεταβλητή», 0:02:01.107,0:02:06.374 που είναι ένας επιπρόσθετος παράγοντας[br]που επηρεάζει σημαντικά τα αποτελέσματα. 0:02:06.374,0:02:10.023 Εδώ, ο κρυφός παράγοντας[br]είναι η σχετική αναλογία των ασθενών 0:02:10.023,0:02:13.074 που φτάνουν σε καλή και κακή κατάσταση. 0:02:13.074,0:02:16.304 Το παράδοξο του Σίμπσον[br]δεν είναι ένα υποθετικό σενάριο. 0:02:16.304,0:02:18.924 Εμφανίζεται σποραδικά[br]στον πραγματικό κόσμο, 0:02:18.924,0:02:22.002 μερικές φορές σε σημαντικές περιστάσεις. 0:02:22.002,0:02:23.530 Μια έρευνα στο Ηνωμένο Βασίλειο 0:02:23.530,0:02:26.800 έδειξε πως οι καπνιστές έχουν[br]μεγαλύτερο ποσοστό επιβίωσης 0:02:26.800,0:02:29.846 από τους μη καπνιστές,[br]σε περίοδο είκοσι ετών. 0:02:29.846,0:02:33.307 Όταν έγινε ο διαχωρισμός[br]των συμμετέχοντων ανά ηλικιακή ομάδα 0:02:33.307,0:02:37.633 η έρευνα έδειξε πως οι μη καπνιστές[br]ήταν σαφώς μεγαλύτερης ηλικίας, 0:02:37.633,0:02:40.780 οπότε, πολύ πιθανότερο να πεθάνουν[br]κατά την ελεγχόμενη περίοδο, 0:02:40.780,0:02:44.438 ακριβώς επειδή είχαν ζήσει[br]ήδη περισσότερο. 0:02:44.438,0:02:47.156 Εδώ, οι ηλικιακές ομάδες[br]είναι ο κρυφός παράγοντας 0:02:47.156,0:02:50.176 και είναι ζωτικής σημασίας[br]να ληφθούν υπόψη στην ανάλυση. 0:02:50.176,0:02:51.559 Σε ένα άλλο παράδειγμα, 0:02:51.559,0:02:54.281 μιας ανάλυσης περιπτώσεων[br]θανατικών ποινών στη Φλόριντα, 0:02:54.281,0:02:58.265 φαινόταν να μην υπάρχει φυλετική διάκριση[br] 0:02:58.265,0:03:01.581 μεταξύ μαύρων και λευκών[br]καταδικασμένων σε θάνατο. 0:03:01.581,0:03:06.396 Όμως, χωρίζοντας τις περιπτώσεις ανά φυλή[br]κάθε θύματος προέκυψε άλλη ερμηνεία. 0:03:06.396,0:03:07.929 Σε κάθε περίπτωση, 0:03:07.929,0:03:11.091 ήταν πολύ πιθανότερη η καταδίκη[br]των μαύρων κατηγορούμενων. 0:03:11.091,0:03:15.066 Το ελαφρώς μεγαλύτερο ποσοστό[br]καταδίκης για τους λευκούς εναγόμενους 0:03:15.066,0:03:18.692 οφειλόταν στο ότι οι υποθέσεις[br]με θύματα λευκούς 0:03:18.692,0:03:21.359 ήταν πιο πιθανό να προβλέπουν[br]θανατική ποινή 0:03:21.359,0:03:24.091 σε σχέση με τις υποθέσεις[br]με θύματα μαύρους, 0:03:24.091,0:03:28.483 και οι περισσότεροι φόνοι συνέβησαν[br]μεταξύ ανθρώπων της ίδιας φυλής. 0:03:28.483,0:03:31.319 Πώς μπορούμε να αποφύγουμε[br]να πέσουμε σε παράδοξο; 0:03:31.319,0:03:34.686 Δυστυχώς, δεν υπάρχει μία απάντηση[br]για όλες τις περιπτώσεις. 0:03:34.686,0:03:38.504 Τα δεδομένα μπορούν να ομαδοποιηθούν[br]και να καταμεριστούν με διάφορους τρόπους 0:03:38.504,0:03:42.106 και τα σύνολα μερικές φορές[br]δίνουν μια πιο σαφή εικόνα 0:03:42.106,0:03:46.638 από δεδομένα διαιρεμένα σε παραπλανητικές[br]ή αυθαίρετες κατηγορίες. 0:03:46.638,0:03:50.269 Αυτό που μπορούμε είναι να μελετήσουμε[br]προσεκτικά τις πραγματικές καταστάσεις 0:03:50.269,0:03:52.089 που περιγράφονται με χρήση στατιστικής 0:03:52.089,0:03:55.767 και να αναλογιστούμε τυχόν ύπαρξη[br]κρυφών μεταβλητών. 0:03:55.767,0:03:59.370 Διαφορετικά, γινόμαστε ευάλωτοι[br]σε αυτούς που χρησιμοποιούν τα δεδομένα 0:03:59.370,0:04:04.030 για να χειραγωγήσουν τους άλλους[br]και να προωθήσουν τα δικά τους σχέδια.