A Concise Introduction to Probability Theory

Posted Nov 29, 2023 Updated Jun 2, 2026

By Yiwei Liu

8 min read

This is a straightforward introduction to probability theory, including combinatorial analysis, random variables, and more.

组合分析

计算一个事件发生结果的数目分析事件的概率

计数基本法则

乘法计数

排列

n个元素排列 $n!$

n个元素, $n_1$个不可区分, $n_2$不可区分, …, $n_r$个不可区分 $(\sum_i^r n_i=n)$ $\frac{n!}{n_1!n_2!…n_r!}$

(先排列, 再在每组中去掉重复排列的部分, 即除以$n_i!$)

## 组合

n个元素取出r个

$\tbinom{n}{r}=\frac{n!}{(n-r)!r!}$

组合恒等式

$\tbinom{n}{r}=\tbinom{n-1}{r-1}+\tbinom{n-1}{r}$

二项式定理

\[(x+y)^n=\sum_{k=0}^n\tbinom{n}{k}x^ky^{n-k}\]

多项式系数

n个不同的元素, 分成r组, 每组分别有 $n_1, n_2, …, n_r$ 个元素, 其中$\sum_i^r n_i=n$

(先从n个里选出$n_1$个, 依次选下去) $\tbinom{n}{n_1}\tbinom{n-n_1}{n_2}...\tbinom{n-n_1-n_2-...-n_{r-1}}{n_r}=\frac{n!}{n_1!n_2!...n_r!}$

考虑与排列中例子的等价性

定义

$\tbinom{n}{n_1,n_2,...,n_r}=\frac{n!}{n_1!n_2!...n_r!}$

多项式定理

$(x_1+x_2+...+x_r)^n=\sum\tbinom{n}{n_1,n_2,...,n_r}x_1^{n_1}x_2^{n_2}...x_r^{n_r}$ 遍历所有满足 $\sum_i^r n_i=n$ 的 $(n_1,n_2,…,n_r)$ 非负向量

方程整数解的个数

对正整数向量$(n_1,n_2,…,n_r)$, $\sum_i^r n_i=n$ , 共$\tbinom{n-1}{r-1}$ 种

对非负向量$(n_1,n_2,…,n_r)$, $\sum_i^r n_i=n$ , 共$\tbinom{n-1+r}{r-1}$ 种

概率论公理化

样本空间 $S$ , 所有可能的结果构成的集合
事件 $E$ , 样本空间的任一子集
事件的交和并, 及交换律, 结合律, 分配律, 德摩根律
事件$E\ F$互不相容, $EF=\emptyset$
补事件$E^c$
包含
事件相等 $E=F \Leftrightarrow E\sub F \ and\ F\sub E$

公理

频率定义概率, 在样本空间$S$中, 对事件$E$

$P(E)=\lim_{n\rightarrow \infty}\frac{n(E)}{n}$ 问题: 极限一定收敛于一个常数? 不同的实验中, 趋向同一个值?

现代概率论

$公理1\quad 0\leqslant P(E)\leqslant 1\\ 公理2\quad P(S)=1\\ 公理3\quad 对任一系列互不相容的事件E_1, E_2, ...(即 i\neq j, E_iE_j=\empty), 有\\ P(\cup_{i=1}^\infty E_i)=\sum_{i=1}^\infty P(E)$ 把满足上述三条公理的$P(E)$称为事件$E$的概率

公理的推论

\[E_1=S,\ E_i=\empty(i>1) \Rightarrow P(\empty)=0\]
\[E_i=\empty(i>n)\Rightarrow P(\cup_{i=1}^n E_i)=\sum_{i=1}^n P(E)\ (事件互不相容)\]
\[P(E^c)=1-P(E)\]
\[E\sub F\Rightarrow P(E)\leqslant P(F)\]
\[P(E\cup F)=P(E)+P(F)-P(EF)\]
容斥恒等式

等可能的样本空间

样本空间$S$为有限集, $S={1,2,3,…, n}$ $P({1})=P({2})=...=P({N})\\ P({i})=\frac{1}{N}\\ P(E)=\frac{|E|}{|S|}$

连续集函数

递增(递减)列
一列事件$\set{E_n n\geq 1}$ 称为递增列, 若
$E_1\sub E_2 \sub ...\sub E_n \sub E_{n+1} \sub ...$ 反之称为递减列, 如果 $E_1\supset E_2 \supset ...\supset E_n \supset E_{n+1} \supset ...$
对递增事件列定义事件 $\lim_{n\rightarrow \infty} E_n=\cup_{i=1}^\infty E_i$
对递减事件列定义事件 $\lim_{n\rightarrow \infty} E_n=\cap_{i=1}^\infty E_i$
有 $\lim_{n\rightarrow \infty} P(E_n)=P(\lim_{n\rightarrow \infty} E_n)$

概率: 确信程度的度量(主观概率)

与频率主义相区别

但是无论是频率主义还是主观概率, 都满足概率论公理, 数学属性不变

条件概率

在事件 $F$ 下 $E$ 发生的概率

$P(E|F)$

定义

$P(E|F)=\frac{P(EF)}{P(F)}$

乘法规则

\[P(E_1E_2...E_n)=P(E_1)P(E_2|E_1)P(E_3|E_2E_1)...P(E_n|E_1...E_{n-1})\\ 特别地\quad P(E_1E_2)=P(E_1)P(E_2|E_1)=P(E_2)P(E_1|E_2)\]

B C 为例子

贝叶斯公式

全概公式

用 $F$ 事件的加权平均来计算事件 $E$

优势

发现证据更新认知和判断

事件 $A$ 的优势定义为 $\frac{P(A)}{P(A^c)}=\frac{P(A)}{1-P(A)}$ 当发现新的证据时, 假设成立的概率之变化可以表示为其优势之变化

在证据 $E$ 之下, 假设 $H$ 的变化 $\frac{P(H|E)}{P(H^c|E)}=\frac{P(H)}{P(H^c)}\frac{P(E|H)}{P(E|H^c)}$

全概公式的推广 $\Rightarrow$ 贝叶斯公式

一组完备事件 $F_i(i=1,2,…,n)$ , 即 $F_i$ 为互不相容事件且 $\cup F_i=S$(必然事件)

$P(E)=\sum_{i=1}^n P(EF_i)=\sum_{i=1}^n P(E

F_i)P(F_i)$

$P(E)$ 关于完备事件 $F$ 加权 $P(F_j|E)=\frac{P(EF_j)}{P(E)}=\frac{P(E|F_j)P(F_j)}{\sum_{i=1}^n P(E|F_i)P(F_i)}$

独立事件

定义

对于两个事件 $E$ 和 $F$ , 若 $P(EF)=P(E)P(F)$ 成立, 称它们是独立的, 反之, 称为相依的/相互不独立的

推论

若两个事件 $E$ 和 $F$ 相互独立, 那么事件 $E$ 和 $F^c$ 也相互独立 $P(EF)=P(E)P(F)\\ P(EF^c)=P(E)-P(EF)=P(E)[1-P(F)]=P(E)P(F^c)$

推广1(三个事件)

如果事件 $E F G$ 相互独立, 如果 $P(EFG)=P(E)P(F)P(G)\quad (1)\\ P(EF)=P(E)P(F)\quad (2)\\ P(EG)=P(E)P(G)\quad (3)\\ P(FG)=P(F)P(G)\quad (4)$

考虑(1)与(2)(3)(4)之间的关系!

推广2(三个事件以上)

事件 $E_1, E_2, E_3, … , E_n$ 相互独立, 如果对于这些事件的任意子集 $E_{1^}, E_{2^},…,E_{r^*}, r\leq n$, 都有 $P(E_{1^*}E_{2^*}...E_{r^*})=P(E_{1^*})P(E_{2^*})...P(E_{r^*})$

推广3(无限个事件)

无限个事件的任意有限个子集都是独立的

条件独立性

事件 $E_1$ 和 $E_2$ 对于给定事件 $F$ 是条件独立的, 如果 $P(E_1|E_2F)=P(E_1|F)$

在 $F$ 发生的条件下, $E_1$ 发生的概率不因 $E_2$ 发生与否而改变

等价地 $P(E_1E_2|F)=P(E_1|E_2F)P(E_2|F)=P(E_1|F)P(E_2|F)$

重复试验

所考虑的概率是一系列子试验, 且这一系列子试验相互独立

若各个子试验彼此相同, 即各子试验有相同的(子)样本空间及相同的事件概率函数, 那么称这些试验为重复试验

推论

独立重复试验中, $E$ 和 $F$ 为一次试验中两个互不相容的事件, 那么事件 $E$ 发生在 $F$ 之前的概率为 $P=1\cdot P(E)+P(1-P(E)-P(F))+0\cdot P(F)\\ \Rightarrow P=\frac{P(E)}{P(E)+P(F)}$

problem of the points

假设在独立重复试验中, 每次成功的概率为 $P$ , 失败的概率为 $1-P$ , 问在 $m$ 次失败之前有 $n$ 次成功的概率

帕斯卡

$P_{n,m}$ 表示在 $m$ 次失败之前有 $n$ 次成功, 那么有 $P_{n,m}=PP_{n-1,m}+(1-P)P_{n,m-1}\quad n\geqslant 1,\ m\geqslant 1\\ P_{n,0}=0\\ P_{0,m}=1$

费马

相当于在 $m+n-1$ 次试验中至少有 $n$ 次成功

已知在 $m+n-1$ 次试验中恰有 $k$ 次成功的概率为 $\tbinom{m+n-1}{k}P^k(1-P)^{m+n-1-k}$

那么所求概率为 $P_{n,m}=\sum_{k=n}^{m+n-1}\tbinom{m+n-1}{k}P^k(1-P)^{m+n-1-k}$

利用负二项分布

考虑第 $m$ 次成功发生的时刻不晚于 $m+n-1$ 次试验

已知分布列

\[P\set{X=n}=\tbinom{n-1}{r-1}p^r(1-p)^{n-r}\]

那么

\[P\set{X\leqslant m+n-1}=\sum_{k=n}^{m+n-1}\tbinom{k-1}{n-1}p^n(1-p)^{k-n}\]

赌徒破产问题

赌博持续时间问题

拉普拉斯继承准则

序贯地补充信息

现在有 $n$ 个互不相容且完全的假设, 其初始概率[先验(prior)概率]为 $P(H_i),\quad \sum_{i=1}^nP(H_i)=1$ ,现在知道事件 $E_1$ 发生, 那么 $H_i$ 成立的条件概率[后验(posterior)概率] $P(H_i|E)=\frac{P(E|H_i)P(H_i)}{\sum_j P(E|H_j)P(H_j)}$ 如果先知道 $E_1$ 后知道 $E_2$ $P(H_i|E_1E_2)=\frac{P(E_1E_2|H_i)}{\sum_j P(E_1E_2|H_j)P(H_j)}$

推广到序贯地补充信息

条件概率满足的性质

满足概率的三条公理
满足普通概率的所有性质
\[define\quad Q(E)=P(E|F)\\ Q(E|R)=P(E|RF)\]

Mathematics

probability theory notes

This post is licensed under CC BY 4.0 by the author.