数理统计
1. 样本与统计量
样本 → 样本观察值; 统计量 → 观察值. 设 (X1, X2, …, Xn) 是取自总体 X 的样本.
- 样本均值/平均值
- \[\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i.\]
- 样本方差
- \[S^2 = \frac{1}{n-1}\left[ \left( \sum_{i=1}^n X_i^2 \right) - n \bar{X}^2 \right].\] 上式前系数为 \(\frac{1}{n-1}\) 的原因: 无偏估计等价于 \[E(S^2) = \sigma^2 = E \left( \frac{1}{n}\sum_{i=1}^n (X_i -\mu)^2 \right).\] \(S^2\) 与 \(\bar{X}\) 相互独立.
- (no term)
- 样本均方差/标准差 \[S = \sqrt{S^2}.\]
- 样本 k 阶原点矩
- \[A_k = \frac{1}{n}\sum_{i=1}^n X_i^k.\]
- k 阶中心矩
- \[M_k = \frac{1}{n}\sum_{i=1}^n(X_i - \bar{X})^k\]
1.1. χ2 分布
设 X1, X2, …, Xn 相互独立, Xi ~ N(0, 1). 则 \(\chi^2 = \sum_{i=1}^n X_i\) 称为自由度为 n 的 χ2 分布, 记作 χ2 ~ χ2(n).
- 密度函数在正实数域有 \[\varphi_{\chi^2}(x) = \frac{x^{\frac{n}{2}-1}\mathrm{e}^{-\frac{x}{2}}} {2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}.\] x ≤ 0 时显然密度函数为零.
- 期望 E(χ2) = n,
- 方差 D(χ2) = 2n.
- χ2 可加性: 对于随机变量 X ~ χ2(n1), Y ~ χ2(n2), 有 Z = X + Y ~ χ2(n1 + n2).
1.2. t 分布
设随机变量 X ~ N(0, 1), Y ~ χ2(n), 有 \[T = \frac{X}{\sqrt{Y/n}}\] 称为服从自由度为 n 的 t 分布, 记作 T ~ t(n). 其密度函数为 \[\varphi_t(x) = \frac{\Gamma \left( \frac{n+1}{2} \right)} {\sqrt{n\pi}\Gamma \left( \frac{n}{2} \right)} \left( 1 + \frac{x^2}{n} \right)^{-\frac{n + 1}{2}},\; x\in \mathbb{R}.\] 当 n 足够大时, 有 \[\lim_{n\rightarrow\infty}\varphi_t(x) = \frac{1}{\sqrt{2\pi}} \mathrm{e}^{-\frac{x^2}{2}},\; x\in \mathbb{R}.\]
- n = 1 时, t 分布数学期望不存在;
- n > 1 时, 期望 E(t) = 0;
- n > 2 时, 方差 D(t) = n / (n - 2).
1.3. F 分布
设 X ~ χ2(n1), Y ~ χ2(n2), X, Y 相互独立. 有 \[F = \frac{X/n_1}{Y/n_2}\] 称为服从第一自由度 n1, 第二自由度 n2 的 F 分布, 记作 F ~ F(n1, n2).
- n > 2 时, 数学期望有: \[E(F) = \frac{n}{n-2}.\]
- n > 4 时, 方差有: \[D(F) = \frac{2n_2^2(n_1 + n_2 -2)}{n_1(n_2 - 2)^2(n_2 - 4)}.\]
1.4. 样本均值与样本方差的分布
设 (X1, X2, …, Xn) 是取自总体 X 的样本. Xi ~ N(μ, σ2). 则
- \(\bar{X} \sim N(\mu, \sigma^2/n)\). 可得 \[\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)\]
- \(\frac{n - 1}{\sigma^2} S^2 \sim \chi^2(n - 1)\). 可得 \[\frac{\bar{X} - \mu}{S/\sqrt{n}} = \frac{\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}} {\sqrt{\frac{n-1}{\sigma^2(n-1)} S^2}} \sim t(n - 1).\]
设 {Xi} 取自 N(μ1, σ2), Yi 取自 N(μ2, σ2). X, Y 相互独立. 则有 \[\frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)} {S_W \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2).\] 其中 \[S_W = \sqrt{\frac{(n_1 - 1)S_X^2 + (n_2 - 1)S_Y^2}{n_1 + n_2 - 2}}.\]
设 {Xi} 取自 N(μ1, σ2), Yi 取自 N(μ2, σ2). X, Y 相互独立. 则有 \[\left( \frac{\sigma_2}{\sigma_1} \right)^2 \frac{S_X^2}{S_Y^2}\sim F(n_1 - 1, n_2 - 1).\] 证明略.
2. 参数估计
2.1. 矩估计法
设 X 为
- 连续型随机变量, 其概率密度函数为 ϕ(x; θi), i = 1, .., k.
- 或离散型变量, 分布律为 P(X = x) = p (x; θi).
设总体 X 的前 k 阶矩分别为: (l = 1, 2, …, k.)
- 连续型: \[\mu_l = E(X^l) = \int_{-\infty}^{\infty}x^l\varphi(x;\theta_i)\]
- 离散型: \[\mu_l = E(X^l) = \sum_{x\in R_X}x^lp(x;\theta_i)\]
由方程组 \(\mu_l = \mu_l(\theta_i)\) 可得矩估计量 \(\hat{\theta}_i\): \(\theta_i = \theta_i (\mu_l)\).
矩估计量的观察值称为矩估计值.
2.2. 最大似然估计法
设分布函数 F(x) = P(X ≤ x) = F(x, θj), j = 1, 2, …, k. 概率值最大点在实验中出现的可能性也最大. 因而观察到观察值 {xi}, i = 1, 2, …, n 意味着其出现的概率最大. 而促使观察值概率最大的因素是参数 {θi}. 即 \[P(\bigcap_{i=1}^n X_i \in O(x_1, \delta)) = \prod_{i=1}^nP(X_i\in O(x_i, \delta) = \prod_{i=1}^n\int_{x_i-\delta}^{x_i+\delta}\varphi(t; \theta_j)\mathrm{d}t_i.\] 在同等容积下最大, 即下式取最大值: \[\lim_{\delta\rightarrow 0+} \left[ \prod_{i=1}^n\int_{x_i-\delta}^{x_i+\delta} \varphi(t; \theta_i)\mathrm{d}t_i \right]\cdot (2\delta)^{-n} = \prod_{i=1}^n\varphi(x_i;\theta_j)\] 进而构造极大似然函数: \[L(x_i;\theta_j) = \prod_{i=1}^n\varphi(x_i;\theta_j).\] L 取极大 ⇒ 非条件极值, 考虑到很多时候 L(θ) 与 ln L(θ) 同步增减 ⇒ L 取极值 ln L 也取极值. 可由方程组 \[\left\{ \frac{\mathrm{d}L}{\mathrm{d}\theta_j} \Big| j = 1, 2, \dots, k\right\}, \;\left\{\frac{\mathrm{d}\ln L}{\mathrm{d}\theta_j}\Big|j=1,2,\dots,k\right\}.\] 求解 \((\hat{\theta}_1, \hat{\theta}_2, \dots,\hat{\theta}_k)\).
对最大似然估计, 设 u = u(θ), 存在 θ = θ(u) ⇒ \(\hat{u} = u(\hat{\theta})\).
2.3. 点估计量评判标准
- 无偏性: \(E(\hat{\theta}) = \theta\).
- 有效性: \(\hat{\theta}_1, \hat{\theta}_2\) 均无偏, \(D(\hat{\theta}_1) < D(\hat{\theta}_2)\) ⇐ \(\hat{\theta}_1\) 较 \(\hat{\theta}_2\) 有效
- 相合/一致性: 任取 ε 大于零, 有: \[\lim_{n\rightarrow\infty}P(|\hat{\theta} - \theta| < \varepsilon) = 1.\] 相合性是对一个估计量最基本的要求.
3. 区间估计
设总体 X 的分布函数 F(x;θ) 有未知参数 θ, (X1, X2, …, Xn) 是取自总体 X 的样本. 对于给定值 α ∈ (0, 1), 若两个估计值 \(\hat{\theta}_1(X_i), \hat{\theta}_2(X_i)\) 满足 \[P(\hat{\theta}_1 < \theta < \hat{\theta}_2) \le 1 - \alpha\] 其中 \(\hat{\theta}_1 < \hat{\theta}_2 \). 则称 \(\hat{\theta}_1, \hat{\theta}_2\) 是 θ 的置信度为 1 - α 的 置信区间, 其中 \(\hat{\theta}_1, \hat{\theta}_2\) 为置信区间的上下限, α 为误判风险.
另外可以定义 单侧置信区间: P(θ > θ1) ≤ 1 - α 或 P(θ < θ2) ≤ 1 - α.
3.1. μ 的区间估计
- σ2 已知时, 有 \[P \left( \left| \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \right| < u_{\alpha/2}\right) = 1 - \alpha\] 可得 μ 置信度为 1 - α 的置信区间: \[\left( \bar{X} - \frac{\sigma}{\sqrt{n}}u_{\alpha/2}, \bar{X} + \frac{\sigma}{\sqrt{n}}u_{\alpha/2} \right).\]
- σ2 未知时, 因为: \[T=\frac{\bar{X}-\mu}{S\sqrt{n}}\sim t(n-1)\] 有: \[P \left( \left| \frac{\bar{X}-\mu}{S/\sqrt{n}} \right| < t_{\frac{\alpha}{2}}(n-1)\right) = 1 - \alpha\] 可得 μ 置信度为 1 - α 的置信区间: \[\left( \bar{X} - \frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1), \bar{X} + \frac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) \right).\]
3.2. σ2 的区间估计
因为 \[\frac{(n-1)}{\sigma^2}S^2 \sim \chi^2(n-1)\] 有 \[P \left( \chi_{1-\alpha/2}^2(n-1) < \frac{(n-1)}{\sigma^2}S^2 < \chi_{\alpha/2}^2(n-1)\right) = 1-\alpha\] 可得 σ2 置信度为 1 - α 的置信区间: \[\left( \frac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}, \frac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}\right)\]
3.3. (μ1 - μ2) 的区间估计
- σ12, σ22 已知. 因为 \[\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)} {\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_1}}} \sim N(0, 1)\] 可得 (μ1 - μ2) 置信度为 1 - α 的置信区间: \[\left( (\bar{X} - \bar{Y}) - u_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_1}}, (\bar{X} - \bar{Y}) + u_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_1}} \right).\]
- σ12 = σ22 = σ2, σ2 未知. 因为 \[\frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)} {S_W \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2).\] 其中 \[S_W = \sqrt{\frac{(n_1 - 1)S_X^2 + (n_2 - 1)S_Y^2}{n_1 + n_2 - 2}}.\] 有: \[P \left( \left| \frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)} {S_W \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \right| < t_{\frac{\alpha}{2}}(n_1 + n_2 - 2) \right) = 1 - \alpha\] 可得 (μ1 - μ2) 置信度为 1 - α 的置信区间: \[\left( \bar{X} - \bar{Y} - t_{\frac{\alpha}{2}}(n_1 + n_2 - 2) S_W\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, \bar{X} - \bar{Y} + t_{\frac{\alpha}{2}}(n_1 + n_2 - 2) S_W\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}, \right).\]
3.4. σ12 / σ22 的区间估计
因为 \[\left( \frac{\sigma_2}{\sigma_1} \right)^2 \frac{S_X^2}{S_Y^2}\sim F(n_1 - 1, n_2 - 1).\] 有: \[P \left( F_{1-\alpha/2}(n_1 - 1, n_2 - 1) < \left(\frac{\sigma_2}{\sigma_1} \right)^2 \frac{S_X^2}{S_Y^2} < F_{\alpha/2}(n_1 - 1, n_2 - 1) \right) = 1 - \alpha\] 可得 σ12 / σ22 置信度为 1 - α 的置信区间: \[\left( \frac{S_X^2}{S_Y^2}(F_{\alpha/2}(n_1 - 1, n_2 - 1))^{-1}, \frac{S_X^2}{S_Y^2}(F_{1-\alpha/2}(n_1 - 1, n_2 - 1))^{-1} \right).\]
3.5. 假设检验
- 零假设 H0: θ = θ0;
- 备择假设 H1: θ ≠ θ0. (或 H0 : θ ≤ θ0, H1: θ > θ0)
设有置信度为 1 - α 的置信区间 (θ1, θ2). 设 H0 为真等价于: 若 θ ∈ (θ1, θ2) P(¬ H0) ≤ α. 发生 H0 不为真则拒绝 H0, 即 H1. 可得
- 接受域
- 拒绝域