跳至主要內容

01. 概率 DP 知识

ITCharge大约 3 分钟

概率 DP 知识

1. 概率 DP 简介

概率 DP:一类使用动态规划方法来求解概率与期望的问题,也可以分别叫做「概率 DP」、「期望 DP」。由于概率和期望具有线性性质,使得可以在概率和期望之间建立一定的递推关系,从而通过动态规划的方式来解决一些概率问题。

概率 DP 和期望 DP 的难点主要有两点:

  1. 状态转移方程的推导。
  2. 概率论知识。

其中第 11 点和一般动态规划并无太大差别,而第 22 点涉及到对概率论基础知识的掌握。其中,「概率 PD」对应了概率论知识中的「全概率公式」,「期望 DP」则对应了「全期望公式」。

我们来看看「概率 DP」「期望 DP」中所涉及到的概率论基础知识。

2. 概率论知识

2.1 样本空间、事件和概率

基本事件:在概率论中,我们将一次随机实验中的某个可能结果称为「样本点」或者「基本事件」。

样本空间:所有可能的结果组成的集合,称为「样本空间」,标记为 SS

随机事件:样本空间 SS 的一个子集 AAASA \subseteq S),称为「随机事件」。

概率:对于样本空间 SS 中的每一个随机事件 AA,如果都存在一种时间到实数的映射函数 P(A)P(A),满足:

  1. P(S)=1P(S) = 1
  2. 0P(A)10 \le P(A) \le 1
  3. 对于两个互斥事件,P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B)

则称 P(A)P(A) 为随机事件 AA 的概率。

2.2 随机变量、数学期望

随机变量:对于样本空间 SS 中的任意事件 ii,都有唯一的实数 XiX_i 与之对应,则称 X=XiX = X_i 为样本空间 SS 上的随机变量。

常见的随机变量主要有「离散型随机变量」与「连续型随机变量」。「概率 DP」主要涉及到离散型随机变量。

数学期望:如果随机变量 X=XiX = X_i 的概率为 P(X=Xi)=piP(X = X_i) = p_i,则称 E(x)=pixiE(x) = \sum p_ix_i 为随机变量 XX 的数学期望。

数学期望的一些性质:

  1. 线性函数性质,满足:E(aX+bY)=a×E(X)+b×E(Y)E(aX + bY) = a \times E(X) + b \times E(Y)
  2. 如果随机变量 XXYY 相互独立,那么:E(XY)=E(X)E(Y)E(XY) = E(X)E(Y)

其中数学期望的线性函数性质是我们能够对数学期望进行地推求解的基本依据。

2.3 全概率公式、全期望公式

概率 DP 的理论基础主要是「全概率公式」。

全概率公式:设 B1,B2,B3,,BnB_1, B_2, B_3, …, B_n 是样本空间 SS 中互不相交的一系列事件,并且满足 S=j=1nBjS = \cup_{j = 1}^n B_j,那么对于任意事件 AA,有: P(A)=j=1nP(A | Bj)P(Bj)P(A) = \sum_{j = 1}^{n} P(A \text{ | } B_j)P(B_j)

「概率 DP」中一般常见的状态转移方程式为:dp[i]=j=1np[i][j]×dp[j]dp[i] = \sum_{j = 1}^{n} p[i][j] \times dp[j]

  • 其中 dp[i]dp[i] 对应全概率公式中的 P(A)P(A)p[i][j]p[i][j] 对应了 P(Bj)P(B_j)dp[j]dp[j] 则对应了 P(A | Bj)P(A \text{ | } B_j)

与概率 DP 类似,期望 DP 的理论基础主要是「全期望公式」。

全期望公式:设 XXYY 为随机变量,E(Y)=E(E(Y | X))=j=1nP(xj)E(Y | xj)E(Y) = E(E(Y \text{ | } X)) = \sum_{j = 1}^n P(x_j) E(Y \text{ | } x_j)

「期望 DP」中一般常见的状态转移方程式为:dp[i]=j=1np[i][j]×dp[j]dp[i] = \sum_{j = 1}^{n} p[i][j] \times dp[j]

  • 其中 dp[i]dp[i] 对应全概率公式中的 E(Y)E(Y)p[i][j]p[i][j] 对应了 P(xj)P(x_j)dp[j]dp[j] 则对应了 E(Y | xj)E(Y \text{ | } x_j)

3. 概率 DP 的应用

3.1

参考资料