Return to Video

统计学:平均数

  • 0:01 - 0:03
    欢迎来到统计学课程
  • 0:03 - 0:06
    我早已盼望制作这套课程
  • 0:06 - 0:09
    好吧,我想要直捣黄龙地讨论核心课程
  • 0:09 - 0:12
    我将尽量运用案例教学
  • 0:12 - 0:15
    以使大家对统计学有一个总体的理解
  • 0:15 - 0:17
    这样是以防有人对统计学不熟悉
  • 0:17 - 0:19
    虽然,我想很多人直觉上了解统计学是什么
  • 0:19 - 0:21
    虽然,我想很多人直觉上了解统计学是什么
  • 0:22 - 0:27
    最核心的部分,好吧,概括而言,就是
  • 0:27 - 0:29
    一切围绕数据进行
  • 0:29 - 0:31
    我们可以大体上为统计学分类
  • 0:31 - 0:33
    基本可以分成三大类
  • 0:33 - 0:35
    第一种是描述性统计学
  • 0:35 - 0:39
    假设你有一大堆数据,你希望能在不把数据完全告诉别人
  • 0:39 - 0:41
    的情况下介绍这些数据的情况
  • 0:41 - 0:45
    你大概可以找到一些有标志性的数据
  • 0:45 - 0:48
    来代表所有的数据,而无需将所有的数据都说一次
  • 0:48 - 0:49
    来代表所有的数据,而无需将所有的数据都说一次
  • 0:49 - 0:50
    这就是描述性统计学
  • 0:50 - 0:52
    此外,还有一些统计学能对未来起预测作用
  • 0:52 - 0:53
    好吧,我大体把它们分成了一类
  • 0:53 - 0:55
    其中有推论统计学
  • 0:58 - 1:01
    推论统计学运用数据来对事物做结论
  • 1:01 - 1:02
    推论统计学运用数据来对事物做结论
  • 1:02 - 1:06
    假设你从总体中得到了一些样本
  • 1:06 - 1:09
    统计学中经常提到样本和总体
  • 1:09 - 1:11
    我想你应该对它们是什么有一些基础的认识,对么?
  • 1:11 - 1:14
    假设我调查三个即将为总统选举投票的选民
  • 1:14 - 1:16
    很显然我没有调查整个总体
  • 1:16 - 1:18
    我仅仅调查了一个样本
  • 1:18 - 1:22
    推论统计的妙处在于,我们只需对样本
  • 1:22 - 1:25
    进行一些数学计算,便有可能推断出
  • 1:25 - 1:28
    总体这个整体的情况
  • 1:28 - 1:30
    好吧,无论如何,我只是在对统计学是什么进行概括介绍
  • 1:30 - 1:31
    好吧,无论如何,我只是在对统计学是什么进行概括介绍
  • 1:31 - 1:34
    接下来,我们来学习统计学的核心内容,同时
  • 1:34 - 1:35
    我们将从描述统计开始学习
  • 1:38 - 1:41
    首先,如果别人给我们一组数据并且要求我们对其进行描述的话,我不知道我,或者大部分人会怎么做
  • 1:41 - 1:44
    首先,如果别人给我们一组数据并且要求我们对其进行描述的话,我不知道我,或者大部分人会怎么做
  • 1:44 - 1:47
    首先,如果别人给我们一组数据并且要求我们对其进行描述的话,我不知道我,或者大部分人会怎么做
  • 1:47 - 1:51
    嗯,或许我会找到其中最能代表这一组数据的个别数字
  • 1:51 - 1:54
    嗯,或许我会找到其中最能代表这一组数据的个别数字
  • 1:54 - 1:57
    或者,一些能体现集中趋势的数字
  • 1:57 - 2:00
    “集中趋势” 是统计学课本上常见的词
  • 2:00 - 2:03
    一组数字的集中趋势
  • 2:07 - 2:09
    这也叫做平均数
  • 2:09 - 2:12
    在这里,我使用“平均数”这个词的时候会比平时更加精确一些
  • 2:12 - 2:16
    当我在这里提到“平均数”时
  • 2:16 - 2:20
    它表示能描述一组数据的中心趋势,即集中位置或平均水平的一个值
  • 2:20 - 2:23
    它表示能描述一组数据的中心趋势,即集中位置或平均水平的一个值
  • 2:23 - 2:25
    或者说,最能代表一组数据的一个数值
  • 2:25 - 2:27
    我知道这听起来非常抽象,但让我们
  • 2:27 - 2:29
    先做几道题吧
  • 2:29 - 2:32
    有几种方法可以用来计算
  • 2:32 - 2:35
    一组数据的中心趋势,或平均数
  • 2:35 - 2:38
    你以前或许见过这些
  • 2:38 - 2:41
    它们是均值(即平均数)
  • 2:41 - 2:43
    事实上,均值有很多种,我们这里指的仅仅是
  • 2:43 - 2:44
    算数平均数
  • 2:51 - 2:54
    以后,当我们学习计算股票回报率时会学到几何平均数
  • 2:54 - 2:55
    或许某天还会学到调和平均数
  • 2:55 - 3:03
    包括均值、中位数和众数
  • 3:03 - 3:07
    用统计学的话说,这些都可用来表述一组数据
  • 3:07 - 3:11
    或是总体的集中趋势
  • 3:11 - 3:13
    又或是样本的集中趋势
  • 3:13 - 3:16
    同时它们都是集合性的——它们都可能是平均数的某种形态
  • 3:16 - 3:17
    同时它们都是集合性的——它们都可能是平均数的某种形态
  • 3:17 - 3:19
    我想,当我们看到例子时
  • 3:19 - 3:19
    可能会更加明白
  • 3:19 - 3:23
    在日常生活中,当人们谈论到平均数时
  • 3:23 - 3:26
    我想你在生活中已经计算过平均数了
  • 3:26 - 3:29
    人们通常指的是算数平均数
  • 3:29 - 3:30
    因此,通常情况下当人们说“让我们计算这些数字的平均数”
  • 3:30 - 3:33
    人们希望你计算的是算数平均数
  • 3:33 - 3:34
    人们希望你计算的是算数平均数
  • 3:34 - 3:36
    他们不想要中位数或众数
  • 3:36 - 3:39
    但在我们继续向下学习之前,让我们搞明白它们都是什么
  • 3:39 - 3:41
    但在我们继续向下学习之前,让我们搞明白它们都是什么
  • 3:41 - 3:43
    让我来编造一组数字
  • 3:43 - 3:46
    假设我有1
  • 3:46 - 3:50
    假设我还有一个1、一个2、一个3
  • 3:50 - 3:53
    以及一个4
  • 3:53 - 3:55
    我想这些足够了
  • 3:56 - 3:58
    我们只需要一个简单的例子
  • 3:58 - 4:03
    当谈到平均数时,算数平均数或许是大家最熟悉的
  • 4:03 - 4:06
    当谈到平均数时,算数平均数或许是大家最熟悉的
  • 4:06 - 4:08
    基本上你只需将所有数字相加,然后
  • 4:08 - 4:09
    除以数字的数目
  • 4:09 - 4:16
    在这个例子中,5个数的和就是1加1加2加3加4
  • 4:16 - 4:19
    然后除以5
  • 4:19 - 4:21
    然后除以5
  • 4:21 - 4:22
    结果是多少呢?
  • 4:22 - 4:23
    1加1等于2
  • 4:23 - 4:26
    2加2等于4
  • 4:26 - 4:28
    4加3等于7
  • 4:28 - 4:30
    7加4等于11
  • 4:30 - 4:33
    结果等于11除以5
  • 4:33 - 4:33
    就是?
  • 4:33 - 4:34
    二又五分之一
  • 4:34 - 4:38
    就等于2.2
  • 4:38 - 4:40
    所以,有人会说:“嘿,你知道
  • 4:40 - 4:41
    这个数字相当不错地代表了这组数据。”
  • 4:41 - 4:42
    这个数字相当不错地代表了这组数据。
  • 4:42 - 4:45
    这组数据中所有的数字和2.2都比较接近。”
  • 4:45 - 4:47
    你也可以认为,2.2代表了这组数据的集中趋势
  • 4:47 - 4:49
    你也可以认为,2.2代表了这组数据的集中趋势
  • 4:49 - 4:51
    通常说来,这将会是平均数。
  • 4:51 - 4:53
    更加精确地说,这是这组数据的算术平均数
  • 4:53 - 4:55
    更加精确地说,这是这组数据的算术平均数
  • 4:55 - 4:57
    你可以看到,它对这组数有一定的代表性
  • 4:57 - 4:59
    如果我不想告诉你这5个数字分别是什么
  • 4:59 - 5:01
    我可以说:“你知道,我有一组5个数据,而且
  • 5:01 - 5:04
    它们的均值是2.2。”这样至少告诉了你
  • 5:04 - 5:06
    这组数字大概会是怎样的
  • 5:06 - 5:09
    大概在下一个视频里,我们会谈到如何知道均值和
  • 5:09 - 5:12
    这组数据中每个数字的差是多少
  • 5:12 - 5:14
    所以,这就是其中一种衡量方法
  • 5:14 - 5:17
    除了这样计算平均数外,另一种衡量方法
  • 5:17 - 5:20
    就是把这组数按顺序排好
  • 5:20 - 5:20
    事实上我就是这么做的
  • 5:20 - 5:23
    让我们再次将这组数字从小到大排列
  • 5:23 - 5:27
    1,1,2,3,4
  • 5:27 - 5:28
    取中间的数字
  • 5:28 - 5:32
    我们看看,这里有1、2、3、4、5个数
  • 5:32 - 5:34
    所以中间的就是第三个数,对吗?
  • 5:34 - 5:35
    中间的数字是2
  • 5:35 - 5:37
    这组数据中,有两个比2大,还有
  • 5:37 - 5:39
    两个比2小
  • 5:39 - 5:40
    2就被称为中位数
  • 5:40 - 5:42
    所以,中位数涉及的计算非常少
  • 5:42 - 5:43
    事实上你只需将数字排序
  • 5:43 - 5:46
    然后你找到中间的数,比这个数大和比这个
  • 5:46 - 5:48
    数小的数字在这个组里一样多
  • 5:48 - 5:51
    所以这组数据的中位数就是2
  • 5:51 - 5:53
    你看,我指的是,这个中位数
  • 5:53 - 5:54
    和均值其实挺相近的
  • 5:54 - 5:56
    没有唯一正确的答案
  • 5:56 - 5:59
    均值和中位数都不是衡量平均数的唯一答案
  • 5:59 - 6:02
    它们只是衡量平均数的不同方法
  • 6:02 - 6:05
    这里就是中位数
  • 6:05 - 6:07
    我知道你大概在想:“好吧,当我们
  • 6:07 - 6:09
    有5个数的时候这些都很简单
  • 6:09 - 6:12
    但如果我们有6个数字呢?”那该怎么办呢?
  • 6:12 - 6:14
    如果这组数中有6个数怎么办?
  • 6:14 - 6:20
    1,1,2,3,4,让我们再加一个4
  • 6:20 - 6:22
    所以,我们现在没有中间的数字了,对么?
  • 6:22 - 6:25
    2不再是中位数,因为有2个数比它小
  • 6:25 - 6:27
    3个数比它大
  • 6:27 - 6:29
    3也不是中位数,因为组里有3个数比它大
  • 6:29 - 6:32
    不好意思,我说错了,有2个数比它大,3个数
  • 6:32 - 6:33
    比它小
  • 6:33 - 6:34
    所以没有数字在中间
  • 6:34 - 6:36
    当一组数据的个数是偶数,且要求你算出中位数
  • 6:36 - 6:38
    你所需要做的就是取中间的两个数字
  • 6:38 - 6:44
    然后计算这两个数字的算术平均数
  • 6:44 - 6:45
    然后计算这两个数字的算术平均数
  • 6:45 - 6:51
    因此,在这组数字中,中位数是2.5
  • 6:51 - 6:52
    好吧
  • 6:52 - 6:54
    但我们先不讨论这个,因为我想比较一下同组数据的
  • 6:54 - 6:57
    中位数、均值和众数之间的区别
  • 6:57 - 6:58
    中位数、均值和众数之间的区别
  • 6:58 - 7:00
    知道这个有助于学习,因为这三者容易让人混淆
  • 7:00 - 7:01
    知道这个有助于学习,因为这三者容易让人混淆
  • 7:01 - 7:04
    而且,这三个都是数学定义
  • 7:04 - 7:06
    是为了让我们更好的分析数字,可供运用的数学工具
  • 7:06 - 7:08
    是为了让我们更好的分析数字,可供运用的数学工具
  • 7:08 - 7:12
    这些计算公式并不会某天出现在天空,让人们
  • 7:12 - 7:14
    惊呼:“哦,如何计算平均数是宇宙的部分奥秘!”
  • 7:14 - 7:17
    惊呼:“哦,如何计算平均数是宇宙的部分奥秘!”
  • 7:17 - 7:20
    这些计算都是人类创造出来,以便使我们的大脑
  • 7:20 - 7:22
    能更好地处理数据
  • 7:22 - 7:25
    这组数据数目不多,但如果我们拥有的不是5个
  • 7:25 - 7:27
    数而是五百万个,你可以想象,你绝对不会愿意
  • 7:27 - 7:29
    一个一个地去分析这些数字
  • 7:29 - 7:32
    无论如何,在我进一步讨论前,我们先学习一下众数的概念
  • 7:32 - 7:33
    无论如何,在我进一步讨论前,我们先学习一下众数的概念
  • 7:33 - 7:36
    在一定程度上,我认为众数是最容易被人遗忘的
  • 7:36 - 7:40
    人们通常在考试时看到众数时总会惊讶万分
  • 7:40 - 7:42
    他们会觉得:“哦,这是一个很高深的概念!”
  • 7:42 - 7:45
    而事实上,众数在一定程度上是计算集中趋势或是平均数
  • 7:45 - 7:49
    最简单的方法
  • 7:49 - 7:54
    众数就是一组数据中最经常出现的数
  • 7:54 - 7:56
    在这个例子里,有两个1,其他的数字都各自只有一个,对吗?
  • 7:56 - 7:58
    在这个例子里,有两个1,其他的数字都各自只有一个,对吗?
  • 7:58 - 8:00
    所以,这里的众数就是1
  • 8:00 - 8:03
    因此,众数就是最多的数
  • 8:03 - 8:05
    现在,你可能会说:“哇,Sal,如果这个是我们的数组怎么办?
  • 8:05 - 8:06
    现在,你可能会说:“哇,Sal,如果这个是我们的数组怎么办?
  • 8:06 - 8:12
    1,1,2,3,4,4。” 这里,有两个1,还有两个4
  • 8:12 - 8:14
    在这种情况下,计算众数就更困难一点
  • 8:14 - 8:18
    因为1和4都可能成为众数
  • 8:18 - 8:20
    你可以说众数是1,或者众数是4
  • 8:20 - 8:23
    但是这样都不够精确
  • 8:23 - 8:25
    可能你会需要让那个问你问题的人澄清一下他的意图
  • 8:25 - 8:26
    可能你会需要让那个问你问题的人澄清一下他的意图
  • 8:26 - 8:29
    大部分时候,如果你在考试时遇到这个问题时
  • 8:29 - 8:29
    答案都不会这么模糊
  • 8:29 - 8:33
    通常一组数据中会有一个最经常出现的数字
  • 8:33 - 8:36
    现在,你可能会问,好吧,为什么一种计算方法还不够
  • 8:36 - 8:37
    现在,你可能会问,好吧,为什么一种计算方法还不够
  • 8:37 - 8:38
    你知道我们学习平均数的目的,为什么我们不干脆仅仅使用平均数呢?
  • 8:38 - 8:40
    你知道我们学习平均数的目的,为什么我们不干脆仅仅使用平均数呢?
  • 8:40 - 8:43
    又或者,为什么我们不一直用算术平均数进行计算呢?
  • 8:43 - 8:45
    中位数和众数有什么用呢?
  • 8:45 - 8:48
    好吧,我将试着举一个例子,看看你明不明白
  • 8:48 - 8:51
    好吧,我将试着举一个例子,看看你明不明白
  • 8:51 - 8:52
    然后你可以自己进一步思考一下
  • 8:52 - 8:54
    假设我有这样一组数
  • 8:54 - 9:04
    3,3,3,3,3,以及,100
  • 9:04 - 9:09
    那么,算术平均数是多少?
  • 9:09 - 9:12
    我有5个3以及1个100
  • 9:12 - 9:17
    所以答案是用115除以6,对吗
  • 9:17 - 9:20
    我有六个数
  • 9:20 - 9:22
    115只是这六个数的和
  • 9:22 - 9:27
    所以结果是:115是6的多少倍?
  • 9:27 - 9:29
    上一
  • 9:29 - 9:31
    一六得六
  • 9:31 - 9:32
    55除以6,上9
  • 9:32 - 9:34
    六九五十四
  • 9:34 - 9:36
    所以答案是19又1/6
  • 9:37 - 9:38
    好吧
  • 9:39 - 9:41
    我仅仅将所有数相加然后除以个数
  • 9:41 - 9:42
    我仅仅将所有数相加然后除以个数
  • 9:42 - 9:45
    但是我的问题是,这个答案真的能代表这组变量么
  • 9:45 - 9:46
    但是我的问题是,这个答案真的能代表这组变量么
  • 9:46 - 9:48
    我的意思是,我有很多的3,只有一个100
  • 9:48 - 9:51
    但是,我们得到的集中趋势却是19又1/6
  • 9:51 - 9:54
    我的意思是,19又1/6并不能很好地代表这组数据的情况
  • 9:54 - 9:54
    我的意思是,19又1/6并不能很好地代表这组数据的情况
  • 9:54 - 9:56
    或许在不同的问题下,这个答案是正确的
  • 9:56 - 9:58
    但是看起来还是有点怪,对不对?
  • 9:58 - 10:00
    我觉得,我的直觉告诉我,集中趋势应该是一个更靠近3的数字
  • 10:00 - 10:03
    因为组里有很多的3
  • 10:03 - 10:07
    在这里,众数会告诉我们什么呢?
  • 10:07 - 10:10
    这些数字已经是从小到大排列的,对吗?
  • 10:10 - 10:11
    如果它们是随机给出的,你首先需要将其从小到大排列
  • 10:11 - 10:13
    然后你看看,中间的那个数是什么?
  • 10:13 - 10:16
    我们看看,因为这组数的数目是偶数,中间的两个数是3和3
  • 10:16 - 10:18
    我们看看,因为这组数的数目是偶数,中间的两个数是3和3
  • 10:18 - 10:21
    3和3的平均数——我应该说得更加精确
  • 10:21 - 10:22
    3和3的平均数——我应该说得更加精确
  • 10:22 - 10:27
    计算3和3的算术平均数,答案是3
  • 10:27 - 10:30
    这个数字可能是衡量这组数字的
  • 10:30 - 10:34
    集中趋势或是平均数更加准确的指标,对吗?
  • 10:34 - 10:38
    根本上说,使用中位数计算时,我不会受到组里
  • 10:38 - 10:41
    比其他数大很多、很不一样的数字的影响
  • 10:41 - 10:42
    比其他数大很多、很不一样的数字的影响
  • 10:42 - 10:44
    在统计学上,它们被称为不具代表性的异常值(溢出值)
  • 10:44 - 10:47
    举例说明这样的数字,假设当我们谈起平均房价时
  • 10:47 - 10:52
    这个城市的房子大概都是10万美金
  • 10:52 - 10:54
    但是,其中却有一栋房子价值1000亿美金
  • 10:54 - 10:56
    如果某人告诉你,假设,平均房价是1百万美金
  • 10:56 - 10:58
    你对这个城市可能会有十分错误的印象
  • 10:58 - 11:00
    你对这个城市可能会有十分错误的印象
  • 11:00 - 11:04
    但是,如果告诉你房价的中位数是10万美金,那么
  • 11:04 - 11:06
    你对这个城市的真实房价就会有更好的了解
  • 11:06 - 11:09
    类似地,这个中位数,可能会给你关于这组数据
  • 11:09 - 11:12
    具体情况如何的更好的解释
  • 11:12 - 11:16
    因为算术平均数受到异常值的影响,有所偏离
  • 11:16 - 11:18
    因为算术平均数受到异常值的影响,有所偏离
  • 11:18 - 11:20
    同时,要能够找到这个异常值
  • 11:20 - 11:22
    一个统计学家可能会说,一看到它我就知道是它
  • 11:22 - 11:23
    一个统计学家可能会说,一看到它我就知道是它
  • 11:23 - 11:25
    对于异常值并没有一个正式的定义
  • 11:25 - 11:28
    但是异常值通常是一个明显地与其他数字不同的数
  • 11:28 - 11:31
    有时候,异常值的产生是来源于衡量错误或其他原因
  • 11:31 - 11:33
    最后,让我们讨论众数
  • 11:33 - 11:35
    这组数中最多见的数字是什么?
  • 11:35 - 11:39
    组里有5个3和一个100
  • 11:39 - 11:41
    所以,最常见的数字,再一次是3
  • 11:41 - 11:45
    在这个例子里,当你有一个异常值的时候,中位数
  • 11:45 - 11:47
    和众数可能,你知道,可能是用来描述一组变量
  • 11:47 - 11:51
    更加合适的指标
  • 11:51 - 11:52
    更加合适的指标
  • 11:52 - 11:53
    可能这只是一种度量错误
  • 11:53 - 11:54
    但是我不知道,我们并不了解实际上这些代表什么
  • 11:54 - 11:55
    但是我不知道,我们并不了解实际上这些代表什么
  • 11:55 - 11:58
    如果这些是房价的话,我可能会认为说这些更能
  • 11:58 - 12:01
    代表这个地区真实的房价情况
  • 12:01 - 12:03
    代表这个地区真实的房价情况
  • 12:03 - 12:06
    但如果这些数字是其他情况的产物,例如是一次考试的成绩
  • 12:06 - 12:08
    那么,可能,班上有一个孩子
  • 12:08 - 12:10
    六个孩子中有一个学得非常非常好,而且其他孩子都不学习
  • 12:10 - 12:10
    六个孩子中有一个学得非常非常好,而且其他孩子都不学习
  • 12:10 - 12:14
    这个更能表明,一定程度上,在这个层次的学生平均水平如何
  • 12:14 - 12:15
    这个更能表明,一定程度上,在这个层次的学生平均水平如何
  • 12:15 - 12:18
    无论如何,我这次的内容就讲到这里
  • 12:18 - 12:20
    我希望你们多和数字做游戏,同时
  • 12:20 - 12:21
    独自思考一下这些概念
  • 12:21 - 12:25
    在下一个视频中,我们将会学到更多
  • 12:25 - 12:25
    描述性统计学的内容
  • 12:25 - 12:28
    我们不再谈论集中趋势,而是谈论
  • 12:28 - 12:30
    集中趋势外数字的离散程度
  • 12:30 - 12:32
    集中趋势外数字的离散程度
  • 12:32 - 12:33
    下次见!
Title:
统计学:平均数
Description:

Introduction to descriptive statistics and central tendency. Ways to measure the average of a set: median, mean, mode

more » « less
Video Language:
English
Duration:
12:35
薇风breeze edited Chinese, Simplified subtitles for Statistics: The Average
薇风breeze edited Chinese, Simplified subtitles for Statistics: The Average
薇风breeze edited Chinese, Simplified subtitles for Statistics: The Average
薇风breeze added a translation

Chinese, Simplified subtitles

Revisions