1 00:00:10,048 --> 00:00:11,933 设想有一组人。 2 00:00:11,933 --> 00:00:14,304 当人数达到多少时, 3 00:00:14,304 --> 00:00:18,778 其中两人生日相同的概率 4 00:00:18,778 --> 00:00:21,218 会超过50%? 5 00:00:21,218 --> 00:00:24,187 假设这人群中没有双胞胎, 6 00:00:24,187 --> 00:00:26,748 所有人的生日概率都相等, 7 00:00:26,748 --> 00:00:29,977 并且排除掉闰年的存在。 8 00:00:29,977 --> 00:00:33,049 花一点时间想想。 9 00:00:33,049 --> 00:00:35,908 所需要的人数其实是相当少的。 10 00:00:35,908 --> 00:00:37,708 若一组有23个人, 11 00:00:37,708 --> 00:00:44,669 那么两个人有相同生日的概率是50.73%。 12 00:00:44,669 --> 00:00:47,239 但一年有365天这么多天, 13 00:00:47,239 --> 00:00:50,489 为什么只需要这么少的人 14 00:00:50,489 --> 00:00:53,700 就可以使其中两人生日相同? 15 00:00:53,700 --> 00:00:56,526 为什么我们的直觉是如此错误的? 16 00:00:58,156 --> 00:00:59,498 为了找到答案, 17 00:00:59,498 --> 00:01:01,389 让我们看看数学家 18 00:01:01,389 --> 00:01:04,348 是如何计算生日相同的概率的。 19 00:01:05,218 --> 00:01:09,110 我们可以使用组合数学的分析方法, 20 00:01:09,110 --> 00:01:12,719 它用来计算不同组合的概率。 21 00:01:14,419 --> 00:01:16,950 首先我们需要转换问题, 22 00:01:16,950 --> 00:01:20,670 直接计算生日相同的概率是很困难的, 23 00:01:20,670 --> 00:01:24,289 因为二人相同的生日可能是在任一天。 24 00:01:25,229 --> 00:01:30,979 相反,计算每个人生日不同的概率是更简单的。 25 00:01:31,389 --> 00:01:32,820 这对于问题有什么帮助呢? 26 00:01:32,820 --> 00:01:35,741 一组人中,要么有两人生日相同,要么没有, 27 00:01:35,741 --> 00:01:38,461 所以这两种情况的概率 28 00:01:38,461 --> 00:01:41,860 相加必然等于100% 29 00:01:41,860 --> 00:01:44,271 这意味着我们可以通过 30 00:01:44,271 --> 00:01:50,381 将无相同生日的概率从100%中减去 而得到有相同生日的概率。 31 00:01:50,381 --> 00:01:53,256 让我们先考虑简单情况。 32 00:01:53,806 --> 00:01:58,281 先从只有一对人拥有不同生日开始。 33 00:01:58,281 --> 00:02:00,632 假定对象A的生日是某天, 34 00:02:00,632 --> 00:02:06,022 那么对象B的生日就是其余364天之一。 35 00:02:06,022 --> 00:02:10,592 对象A和B或是任何两人生日不同的概率就是 36 00:02:10,592 --> 00:02:14,412 364/365, 37 00:02:14,412 --> 00:02:19,464 大约是99.7%,非常高的概率。 38 00:02:20,514 --> 00:02:22,562 我们再引入对象C。 39 00:02:22,562 --> 00:02:25,793 她和其他人生日都不同的概率 40 00:02:25,793 --> 00:02:29,532 是363/365, 41 00:02:29,532 --> 00:02:33,964 因为已经有两个日期被对象A和B占用。 42 00:02:33,964 --> 00:02:38,582 对象D不与他人生日相同的概率是362/365, 43 00:02:38,582 --> 00:02:44,474 以此类推,到对象W是概率为343/365。 44 00:02:44,474 --> 00:02:46,385 将这些数字相乘, 45 00:02:46,385 --> 00:02:50,942 就会得到没有人生日相同的概率。 46 00:02:50,942 --> 00:02:54,064 结果是0.4927, 47 00:02:54,064 --> 00:03:01,362 所以23人当中,大家生日都不同的概率是49.27%。 48 00:03:01,362 --> 00:03:05,955 再用100%减去这个数值,就得到50.73%, 49 00:03:05,955 --> 00:03:08,701 这就是至少有两个人生日相同的概率, 50 00:03:08,701 --> 00:03:11,955 已经超过了50%。 51 00:03:11,955 --> 00:03:16,144 在人数如此少的小组中出现高概率, 52 00:03:16,144 --> 00:03:20,325 其关键在于可能的组合数量巨大。 53 00:03:20,325 --> 00:03:26,017 随着人数增加,可能出现的组合数量会快速增加。 54 00:03:26,017 --> 00:03:29,196 5人当中就有10种不同的组合方式。 55 00:03:29,196 --> 00:03:32,905 五个人的任何一人都可以和其他四人构成组合。 56 00:03:32,905 --> 00:03:34,835 其中一半是重复计算, 57 00:03:34,835 --> 00:03:39,615 因为对象A+对象B的组合与对象B+对象A相同, 58 00:03:39,615 --> 00:03:41,685 所以我们将数字除以2。 59 00:03:41,685 --> 00:03:43,045 相同的道理, 60 00:03:43,045 --> 00:03:45,836 10个人当中就会出现45对组合, 61 00:03:45,836 --> 00:03:49,835 23人当中会有253对组合。 62 00:03:49,835 --> 00:03:52,905 组合的数量成倍增加, 63 00:03:52,905 --> 00:03:57,665 即以小组人数的基数的成比例增长。 64 00:03:57,665 --> 00:04:00,966 不幸的是,我们的大脑非常不擅长 65 00:04:00,966 --> 00:04:04,447 直接处理非线性函数。 66 00:04:04,447 --> 00:04:11,235 所以23人就有253种配对组合看上去是不可能的。 67 00:04:11,235 --> 00:04:15,267 一旦明白了这个道理,生日问题就变得合理了。 68 00:04:15,267 --> 00:04:20,135 253对组合中的人都能找到生日相同的另一半。 69 00:04:20,135 --> 00:04:22,897 同样的,在70个人构成的小组中, 70 00:04:22,897 --> 00:04:26,616 组合数量能达到2415个, 71 00:04:26,616 --> 00:04:33,337 两个人拥有相同生日的概率超过了99.9%。 72 00:04:33,337 --> 00:04:36,707 生日问题是一个很好的例子 73 00:04:36,707 --> 00:04:38,917 展示出数学可以解释看起来不可能的事情, 74 00:04:38,917 --> 00:04:41,410 例如同一个人中两次彩票, 75 00:04:41,410 --> 00:04:44,551 不是几乎不可能的。 76 00:04:44,551 --> 00:04:48,868 有时巧合并没有看上去那么巧。