本科概率统计教学中的几个注解

(整期优先)网络出版时间:2020-08-15
/ 2

本科概率统计教学中的几个注解

赵辉艳

北京师范大学珠海分校 应用数学学院 广东珠海 519087

摘 要 本科生的《概率论与数理统计》课程是大多理工专业的基础课,本文对概率存在的必要性,平均的优化属性及极大似然估计法做一些注解,希望对后进学子学习相关知识有所帮助。

关键词 概率;数学期望;算术平均;最大似然估计;

中图分类号

  1. 引言

本科生的《概率论与数理统计》是大多理工专业的一门重要基础课,其中蕴含的不确定性思想在当今数据爆炸时代起着越来越重要的作用。本文中,我们将对概率存在的必要性,平均的优化特性及参数估计中的最大似然法,进行一些注解。通过这些注解,我们将看到随着自然科学的发展,大众哲学也在慢慢的发生着变化,对不确定性的认识和应用正在改变着我们生活的世界;数学期望蕴含了优化的思想,这种观点可以让我们换一个视角看待数学期望;数学期望和算术平均在一定意义上是等价的;最后,我们可以看到最大似然估计法蕴含了一种灵活的逆向推理思想。

  1. 概率有存在的必要吗?

当我们问什么是概率的时候?教课书大多会这样告诉我们:“概率论一门研究随机(不确定)现象及其发生规律的数学学科,概率刻画了随机现象发生的可能性。”如果我们进一步问:“什么是随机现象?存在随机现象吗?概率有存在的必要吗?”

从教课书上逻辑来看,只有存在随机现象,才能说概率有没有存在的必要性,否则经典的确定性数学就已足够。

为解释这个问题,我们先回顾一段自然哲学的历史。进入19世纪,由于牛顿力学的巨大成功,牛顿三定律和万有引力定律成了主宰整个宇宙的终极真理,这种观念也被称为“按时钟前进的宇宙”[1]。这其中的代表人物有法国著名数学家、物理学家拉普拉斯,但普通民众对这一科学概念却耿耿于怀。直到1846年9月23日,天文学家观测到了由牛顿数学定律预测的海王星,这为决定论的科学观念提供了一个坚实的证据。之后,决定论科学观念成了大众文化一个不可分割的组成部分,决定论哲学掌握着19世纪早期的科学,人们相信一切事物的发生都是由宇宙初始条件和描述宇宙的数学公式事先决定。到了20世纪,随着量子力学的发展,科学家们发现,牛顿力学不再适用于微观世界。著名的海森堡不确定性原理便是这样的一个例子。此外,人们期待的确定性的生物学及社会学定律也没有成功,在一些成熟的科学领域,人们发现,牛顿定律仅仅是宏观上的一个近似。慢慢的,到了20世界末,一种含有不确定性的统计模型几乎被应用到了所有的学科。

上面的简述,让我们看到了科学观念发生变化的过程,我们当今正处的就是后者的时代。进一步,如果我们问:“世界的本质到底是确定的还是不确定的?”

这是一个太大的问题,已经超出了作者的能力范围,下面仅仅表述一下作者的主观想法。

作者更愿意相信二者之间是你中有我,我中有你的的关系。就拿随机变量的分布函数来说,他本身是一个确定性的函数,但却是用来刻画随机现象的。至此,我们最初提出的问题依然没有解决。为此,我们考虑两个极端情形:(1)如果世界本来就是不确定的,那概率的存在自然合理;(2)反过来,如果世界的本质是确定的,但我们人类自身的认知却是有限的。这样一来,就不可能对事物的认识面面俱到,一个便宜的方法是将未知的(认识不到的)那些看作是不确定的。

综上,不管自然的本质是确定的,不确定的或二者兼而有之,我们都可以假定存在不确定性。从这个意义上说,概率有其存在的必要性。这是我们理解自然的一种方式,一个思路。不仅如此,近代数学、概率的发展表明,概率思想对解决一些确定性问题也能发挥神奇效用。

  1. 平均是一种优化

接下来,我们介绍的平均包含数学期望和算术平均,我们先看数学期望的情形。

命题1. 假设5f373466e30c0_html_60c2cbb3903cccf8.gif 为一随机变量并且其数学期望存在,那么

5f373466e30c0_html_1fef7be1b86b53d2.gif .

证明.由于

5f373466e30c0_html_e6e2b23b954c90e9.gif

所以,当5f373466e30c0_html_d10061b3a2fdc012.gif 目标函数达到最小值,得证。

下面是算术平均的情形:

命题2. 假设5f373466e30c0_html_837c31af5468ce20.gif 为一组数据,5f373466e30c0_html_c7f63c9c9c7f9772.gif ,那么

5f373466e30c0_html_76a98f412bf13f2e.gif .

证明.对目标函数求导,令其为零,便可得证,我们省略详细的证明。

1. 从命题1中可以看到,如果在实数里寻找一个数,使得在平均距离平方意义下离5f373466e30c0_html_e02811e7249047cf.gif 最近,那么这个数就是5f373466e30c0_html_a585c2dc46d12525.gif 的数学期望。类似地,命题2告诉我们算术平均5f373466e30c0_html_8c89ba6acb5ea275.gif 是在距离平方和意义下离数据最近的一个数。因此,数学期望和算术平均都是一种优化的结果。直观上说,在上述距离的意义下,找一个数代表5f373466e30c0_html_ac9da686c98a4459.gif5f373466e30c0_html_837c31af5468ce20.gif ),那么这个数就是数学期望(算术平均)。

接下来,我们从一个例子来看,数学期望和算术平均结论一致是自然的。

1.假设我们有一组10个数据

1, 1, 2, 2, 2, 1, 1, 3, 3, 3.

其算术平均为:

5f373466e30c0_html_dc833e91393731c0.gif .

这组数也可以看作是一个离散随机变量5f373466e30c0_html_2cd94e35708c6a47.gif

5f373466e30c0_html_e73744dfb02c3287.gif

1

2

3

5f373466e30c0_html_8dc7356018ee385c.gif

4/10

3/10

3/10

其数学期望为:

5f373466e30c0_html_fd0ff6d13d3679a4.gif .

2. 从上述例子可以看到,数学期望是一种加权平均,可以看作是算术平均的一种推广。事实行,二者可以相互转化。也就是说,数学期望和算术平均是等价的,因此,二者通常都被称作平均。

  1. 揣度“上帝”的意旨

虽然第二部分我们对自然界的本质不置可否,事实大多自然学科都会有一定哲学基础。下面我们讨论的参数估计问题便是这样的例子。假设一组数据(样本)来自一个未知分布(总体),假定未知分布依赖未知但确定的参数,对这个参数的估计问题,称为参数估计问题。

概率中,一个通常的问题是这样表述的:“已知一个分布,问能得到某些数据的概率?”参数估计问题可以看作是它的一个逆问题,通过观测的数据对未知分布进行估计,其中分布是未知的但却是存在的(确定的)。

接下来,我们介绍参数估计中的一个重要方法---最大似然估计法。根据现在文献的看法[2,3],最大似然估计法源起伯努利,高斯等学者,由费歇尔发扬光大。下面我们回顾一下其基本想法:

假设未知的分布是离散的且其概率函数为5f373466e30c0_html_fd3ee63e28b17cc9.gif ,其中5f373466e30c0_html_9a16bdbdf33ecfdd.gif 为未知参数,假设我们可以观察到数据(样本)5f373466e30c0_html_5e67e8b20a2e08c3.gif 。接下来计算这组数据(样本)能够出现的概率,也就是:

5f373466e30c0_html_571aa51f5f559888.gif

这里5f373466e30c0_html_c69acc9e048af24b.gif 被称作是似然函数。其基本想法是5f373466e30c0_html_f97e72409ab131df.gif 取什么值时,我们最有可能观察到数据5f373466e30c0_html_5e67e8b20a2e08c3.gif 。事实是,我们已经观察到了该组数据,5f373466e30c0_html_bc98c30bffdc6316.gif 的作用必然是使似然函数5f373466e30c0_html_eab835ea9ad9b4d6.gif 取到极大值。使似然函数去极大值的5f373466e30c0_html_f1879aee1e88499e.gif 就称为5f373466e30c0_html_bc98c30bffdc6316.gif 的最大似然估计。在极大值求解过程中,我们通常对似然函数去对数,然后求导,再另其为零,然后进一步求解。

3. 从数学角度看,最大似然估计法不是一个逻辑严密的推理方法。因为,就是似然函数取的值是5f373466e30c0_html_7e1e0718825bb51c.gif ,也不能保证我们一定能够观测到样本数据。反过来,作为一个统计估计方法,其蕴含了一种逆向推理的想法。另外,从其估计效果看,不得暗暗叫绝,似乎自然界就是按照此规则演化的,不得不惊讶其揣度“上帝”本领之高超。

  1. 总结

在对概率是否有存在的必要性,平均的优化特性及最大似然估计等议题进行思考后,会发现常常一些细节的地方有很多值得我们深思的地方。甚至提出更大的哲学命题:自然的本质是确定的还是随机的,希望这些注解能起到抛转引玉的作用,启发后进学子继续前行。

参考文献

[1] (美)David Salsburg 著, 刘清山(译),女士品茶:统计学如何变革了科学和生活,南昌: 江西人们出版社,2016.

[2] 陈希孺著, 数理统计学简史,长沙:湖南教育出版社,2002.

[3](日)岩泽宏和著,戴华晶译,改变世界的134个概率统计故事,长沙:湖南科学技术出版社,2016.