概率论的核心法则(基本公理)介绍

电子说

1.3w人已加入

描述

编者按:数据科学家Jonny Brooks-Bartlett撰写的零基础概率论教程的第五篇,介绍概率论的核心法则(基本公理)。

这篇文章将介绍概率论的核心法则。如果你对概率论很陌生,我建议首先阅读零基础概率论入门的第一篇,熟悉概率论中的基本定义和记号。

概率法则(公理)

数学家探索数学的新领域的时候,常常从一组定义可以做什么的规则开始。这有点像刚发明足球的时候定下规则“每对11人,手不能触球,不能越位,等等”。一旦确立了规则,球员和球队经理便可以自由探索,创造新的球技和队伍组合。

概率论(以及一般数学)没什么两样。我们将这些规则称为公理(axiom)。一旦确立了规则,数学家便兴奋异常地探索新的定理和结果。你可以做任何你想做的,只要遵循公理。

让我们查看下概率论的公理。

公理1

第一条法则表述为一个事件的概率大于等于零。事实上,我们可以进一步地说,一个事件的概率在0和1之间(含)。

在数学上表达为:

数据科学

“事件”指“某事发生了”。例如,我们可能谈论明天的天气,事件是明天下雨了。明天下雨的概率可能是0.5,数学上表达为:

数据科学

我们可以组合结果为一个事件,比如说一个事件是明天下雨或下雪的结果。在这种方式下,事件实际上是一组结果。

公理2

这条法则表述为至少一种可能的结果发生的概率为1。让我自由散漫一下,换种说法,如果你把所有可能结果的概率加起来,所得概率之和为1. 硬核数学家会抓住我的错误,但在我们遇到的大多数情况下,第二种说法是成立的。

让我们以投掷6面骰为例。掷出骰子后,六个数字都有可能,骰子的点数必然是1、2、3、4、5、6其中之一。因此,我至少得到其中一种点数的概率是1. 概率等于1意味着我们确定(certain)。

我的第二种说法也是成立的。总共有6种可能性,掷出任何点数的概率是1/6. 因此,如果我们把掷出1、2、3、4、5或6点的概率加起来,我们得到的结果是1. 如下式所示:

P(die = 1) + P(die = 2) + P(die = 3) + P(die = 4) + P(die = 5) + P(die = 6) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 6/6 = 1.

把概率之和的每一项都写出来太枯燥乏味了,特别是在有几百种结果的情况下。所以数学家会用简短的写法:

数据科学

那个长得很像“E”的大字母是希腊字母西格玛(Σ),这个符号意味着相加,下标和上标分别表示从哪里开始,到哪里结束。所以上式表示“从i=1开始,一直到i=6结束”。

所以我们可以将陈述“所有可能结果的概率相加等于1”在数学上表示为:

数据科学

有一个专门的术语可以代替“所有可能结果”——它称为采样空间。因此,6面骰的1、2、3、4、5、6点实际上是采样空间。在数学上,采样空间记为Ω. 所以我们也可以将上式写成:

数据科学

公理3

这条公理也许是读起来最让人疑惑的,但我在之前提到过的零基础概率论入门的第一篇介绍概率互斥的时候已经涉及这条公理。这里我将通过一个例子说明。

这条公理表示为如果两事件互斥(即两事件不可能同时发生),那么这两个事件其中有一个发生的概率等于各个事件发生的(边缘)概率之和。我早说过了,这让人疑惑。让我们尝试通过第一篇中的一个例子来说明。

假设我们掷出一个均匀的6面骰,想要知道掷出5点或6点的概率。这两个事件是互斥的,因为我们无法同时掷出5点和6点。因此掷出5点或6点的概率等于掷出5点的概率加上掷出6点的概率:1/6 + 1/6 = 2/6 = 1/3.

在数学上,这条公理可以表示为:

给定结果1和结果2互斥(不能同时发生),我们有

数据科学

结语

我知道,相比之前的文章,这篇可能比较沉闷,但我觉得介绍这些基础内容很重要,理解更高级的概念需要这些基础。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分