Skip to content
Lokkue's Notes
Go back

第03讲 Gamma分布、χ²/t/F分布与指数族

Edit page

讲义信息

[!summary]+ 本讲导读

  • 本讲研究的问题:统计推断里最常见的几类分布是如何定义、构造和联系起来的。
  • 已知什么:标准正态、正态样本的三大核心结论(第二讲)、独立性和线性变换等基本工具。
  • 未知什么:χ2\chi^2ttFF 分布到底是什么、这些分布之间如何转化、如何从概率分布的结构中识别出”充分统计量”的线索。
  • 核心统计对象:Γ\Gamma 分布、χ2\chi^2 分布、Student tt 分布、FF 分布、Beta 分布、指数族。
  • 本讲结论最终服务什么推断任务:后续区间估计、假设检验、充分统计量和 UMVUE 都会反复调用这些分布。

先看全局

上一讲结束时,我们得出了正态样本下样本方差标准化后服从卡方分布——但有一个问题悬在空中:卡方分布到底是什么?

第二讲中,我们用了 χ2(n1)\chi^2(n-1) 这个符号,但并没有给出它的密度、没有说明它和 Gamma 分布的关系、更没有展示它如何与 tt 分布和 FF 分布关联起来。这就好比你被别人递了一把钥匙,却不知道这把钥匙能开哪些门。

这一讲的任务就是:χ2\chi^2ttFF 这三把”统计推断的钥匙”的构造、性质和关系彻底讲清楚。本讲最核心的洞察是:这些分布在表面上看起来各不相同,但它们的底层其实只有几条简单的干线:

Γχ2t, F,BetaF.\Gamma \longrightarrow \chi^2 \longrightarrow t,\ F, \qquad \text{Beta} \longleftrightarrow F.

后面很多题,其实都只是在问你:

本讲的叙事线

  1. Gamma 分布:母体中的母体。 —— 从”正量之和”的分布需求出发,引入 Gamma 分布这一统驭性的分布族。χ2\chi^2 只是它的特例,指数分布也是它的特例。
  2. χ2\chi^2 分布:平方和的天然语言。 —— 从标准正态平方和的定义出发,详细给出 χ2\chi^2 的密度、期望、方差和与 Gamma 的关系。
  3. tt 分布:当 σ\sigma 未知时怎么办? —— 从上一讲的三大结论出发,自然构造 tt 统计量。解释为什么 tt 分布比标准正态尾部更厚。
  4. FF 分布:方差的比较。 —— 从两个独立 χ2\chi^2 的比值出发,解释 FF 分布如何成为”方差比推断”的工具。
  5. Beta 分布与附加联系。 —— 展示 Beta 分布与顺序统计量、FF 分布之间的相互转化。
  6. 指数族:统一视角。 —— 把那些”看起来完全不同”的分布族纳入同一个代数框架,为下一讲的充分统计量铺路。

一、本讲定位

二、模型与前提

1. 研究模型

2. 对象区分

在本讲中,请特别留心区分:

3. 模型前提检查

[!warning]+ 条件先检查

  • χ2\chi^2ttFF 的标准定义大多从独立标准正态构造。如果不是独立正态,分布就不是精确的 χ2/t/F\chi^2/t/F
  • 非中心版本通常对应”原假设不成立”或”均值偏移”的情形——在功效分析(power analysis)中很重要。
  • 查分位数时要特别注意自由度、上下分位数和左右尾定义。FF 分位数中 Fα(m,n)1/Fα(n,m)F_\alpha(m,n) \neq 1/F_\alpha(n,m)
  • 指数族的表达必须写成”参数部分”和”样本部分”分离的形式。仅仅”有指数函数”不代表是指数族——支持集(sample space)不能依赖参数

三、核心概念

3.1 Gamma 分布:统计推断中的”母分布”

3.1.1 动机:为什么需要 Gamma 分布?

在进入定义之前,先问一个很自然的问题。我们知道标准正态的平方 Z2Z^2 服从什么分布?答案是:它服从 χ2(1)\chi^2(1)。但 χ2(1)\chi^2(1) 长什么样?它的密度怎么写?

更一般地说,如果有一组独立的正随机变量 X1,X2X_1,X_2 都服从指数分布,那么它们的和 X1+X2X_1+X_2 服从什么分布?

这些问题的共同特征是:研究对象定义在正半轴上,且涉及”和”的运算。而正态分布不够用(它定义在全实数轴上),指数分布又太窄(只有一个参数)。我们需要一个更灵活的正半轴分布族——这就是 Gamma 分布。

3.1.2 定义与直觉

[!definition]+ Gamma 分布 若随机变量 XX 的密度为

p(x;α,λ)=λαΓ(α)xα1eλx,x>0,p(x;\alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}, \qquad x>0,

其中 α>0\alpha>0(形状参数),λ>0\lambda>0(速率参数),则称 XΓ(α,λ)X\sim\Gamma(\alpha,\lambda)

用途:Gamma 分布是构造 χ2\chi^2、指数分布和许多正量和式分布的统一母体。

对符号的逐一解释——不要让任何一个符号成为阅读障碍:

直觉理解:Gamma 分布可以视为对”指数分布”的推广。指数分布刻画的是”等待一次事件发生的时间”,而 Gamma 分布刻画的是”等待 α\alpha 次独立事件发生的时间”——如果把 α\alpha 取为整数,Γ(α,λ)\Gamma(\alpha,\lambda) 就是 α\alpha 个独立指数分布 E(λ)E(\lambda) 的和的分布。

Gamma 分布的两个极端特例建立了它与已有知识的联系:

3.1.3 Gamma 分布的封闭性:它为什么不惧怕”加法”

为什么要关注”加法封闭性”? 在统计推断中,我们经常遇到独立随机变量求和的问题。例如,如果每个平方项 Zi2χ2(1)Z_i^2\sim\chi^2(1),那么 Zi2\sum Z_i^2 的分布是什么?如果 Gamma 分布对”同速率参数下的加法”封闭,那 χ2\chi^2 的求和就自然封闭——这为后续讨论平方和的分布铺平了道路。

[!theorem]+ Gamma 分布的封闭性 若

X1Γ(α1,λ),X2Γ(α2,λ),X_1\sim\Gamma(\alpha_1,\lambda),\qquad X_2\sim\Gamma(\alpha_2,\lambda),

X1,X2X_1,X_2 独立,则

X1+X2Γ(α1+α2,λ).X_1+X_2\sim\Gamma(\alpha_1+\alpha_2,\lambda).

用途:这是后续构造 χ2\chi^2 分布和样本和分布的核心工具。推广到 mm 个独立 Gamma 变量(同 λ\lambda),和仍服从 Gamma,形状参数相加。

含义解析

[!warning]+ 坑点:λ\lambda 必须相同 若 X1Γ(α1,λ1)X_1\sim\Gamma(\alpha_1,\lambda_1)X2Γ(α2,λ2)X_2\sim\Gamma(\alpha_2,\lambda_2)λ1λ2\lambda_1\neq\lambda_2,则 X1+X2X_1+X_2 的分布不是 Gamma 分布。它的密度需要用卷积来计算,没有简单的封闭形式。

3.1.4 基本数字特征

对于 XΓ(α,λ)X\sim\Gamma(\alpha,\lambda)

E(X)=αλ,Var(X)=αλ2.E(X)=\frac{\alpha}{\lambda},\qquad \operatorname{Var}(X)=\frac{\alpha}{\lambda^2}.

含义:期望 α/λ\alpha/\lambda 表明 Gamma 分布的中心由”事件次数 α\alpha“和”事件速率 λ\lambda“共同决定。速率越快(λ\lambda 大),等待时间越短;事件越多(α\alpha 大),等待时间越长。方差 α/λ2\alpha/\lambda^2 说明同速率下,事件越多,方差越大(因为等待时间的累积不确定性在增加)。

3.2 χ2\chi^2 分布:平方和的天然语言

3.2.1 动机与定义

上一讲中,我们在正态样本下遇到了 (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1)。但我们没有回答:χ2\chi^2 分布到底是什么?它的密度、期望、方差怎么写?

更根本地说:χ2\chi^2 分布为什么会出现? 答案就藏在它的定义里。

[!definition]+ χ2\chi^2 分布 若 Z1,,ZnZ_1,\dots,Z_n 独立且 ZiN(0,1)Z_i\sim N(0,1),则

ξ=i=1nZi2χ2(n).\xi=\sum_{i=1}^n Z_i^2\sim \chi^2(n).

ξ\xi 服从自由度为 nn 的卡方分布(Chi-squared distribution)。

用途:用于方差推断、残差平方和分析、FF 分布构造和拟合优度检验。

直觉理解:从标准正态”出发”,每取一次样本就平方一下,然后累加。nn 就是累加的次数,也是这个分布的唯一参数——自由度。直观上,自由度越大,你累加的平方项越多,分布的中心就越往右移,且分布的形状越来越接近正态。

含义解析

3.2.2 密度与数字特征

χ2(n)\chi^2(n) 的密度为:

f(x;n)=12n/2Γ(n/2)xn/21ex/2,x>0.f(x;n)=\frac{1}{2^{n/2}\,\Gamma(n/2)}\,x^{n/2-1}e^{-x/2},\qquad x>0.

式子拆解

比较这个密度与 Gamma 分布密度的形式:

Γ ⁣(n2,12)\Gamma\!\left(\frac{n}{2},\frac{1}{2}\right)

的密度是 (1/2)n/2Γ(n/2)xn/21ex/2=12n/2Γ(n/2)xn/21ex/2\frac{(1/2)^{n/2}}{\Gamma(n/2)}x^{n/2-1}e^{-x/2}=\frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}完全一致

因此:

[!theorem]+ χ2\chi^2 分布与 Gamma 分布的关系

χ2(n)=Γ ⁣(n2,12).\chi^2(n)=\Gamma\!\left(\frac{n}{2},\frac{1}{2}\right).

用途:这说明 χ2\chi^2 不是孤立分布,而是 Gamma 分布的一个特例——形状参数为 n/2n/2、速率参数为 1/21/2。利用 Gamma 的封闭性,立刻得到 χ2\chi^2 的加法性质。

由此立即得到基本数字特征(用 Gamma 的公式代入 α=n/2,λ=1/2\alpha=n/2,\lambda=1/2):

E(χ2(n))=n/21/2=n,Var(χ2(n))=n/2(1/2)2=2n.E(\chi^2(n))=\frac{n/2}{1/2}=n,\qquad \operatorname{Var}(\chi^2(n))=\frac{n/2}{(1/2)^2}=2n.

含义解析

3.2.3 χ2\chi^2 的加法性质

由 Gamma 的封闭性立刻得到:

χ2(m)+χ2(n)=χ2(m+n),\chi^2(m)+\chi^2(n)=\chi^2(m+n),

其中两个 χ2\chi^2 变量必须独立。

为什么这个性质重要? 因为在统计推断中,我们经常需要把不同的平方和合并起来——例如,把组内平方和与组间平方和加在一起。χ2\chi^2 的加法性质保证了合并后的分布仍然是 χ2\chi^2,自由度简单相加即可。

3.3 tt 分布:当 σ\sigma 未知时

3.3.1 动机:一个”卡住”的问题

回顾第二讲的内容:在正态样本下,

Xμσ/nN(0,1).\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1).

这个公式非常漂亮。但有一个致命的问题:在实际中,我们几乎永远不知道 σ\sigma 的真实值。

那么,如果把未知的 σ\sigma 替换成样本标准差 SS,得到

XμS/n,\frac{\overline{X}-\mu}{S/\sqrt{n}},

这个新的统计量服从什么分布?

这就是 tt 分布出现的根本动机:当总体标准差未知时,用样本标准差 SS 替代 σ\sigma 会带来额外的随机性——SS 本身就是一个随机变量,它在分母上波动。这会使得最终统计量的分布不再是标准正态,而是尾部更厚的 tt 分布。

[!note]+ 思维实验:为什么 tt 分布尾部更厚?

想象你反复抽样。在大多数情况下,SSσ\sigma 不远,所以 XμS/n\frac{\overline{X}-\mu}{S/\sqrt{n}}Xμσ/n\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} 差不太多。但偶尔地,你会抽到一组样本使得 SS 异常小——此时分母变小,整个统计量就会”蹦”得很大(正或负),产生极端的 tt 值。

标准正态分布不能容忍这种极端值(它的尾部是指数级衰减的),但 tt 分布的尾部是多项式衰减的——更厚、更能容纳由 SS 的不确定性带来的极端值。这就是 tt 分布比标准正态”更保守”的根本原因。

3.3.2 定义与构造

[!definition]+ Student tt 分布 若

XN(0,1),Kχ2(n),X\sim N(0,1),\qquad K\sim \chi^2(n),

XXKK 独立,则

T=XK/nt(n).T=\frac{X}{\sqrt{K/n}}\sim t(n).

TT 服从自由度为 nntt 分布(也叫 Student’s tt)。

用途:用于总体均值未知方差情形下的推断。

式子拆解

在正态样本下的具体形式:回顾第二讲的三大核心结论。若 X1,,XnN(μ,σ2)X_1,\dots,X_n\sim N(\mu,\sigma^2),则

U=Xμσ/nN(0,1),K=(n1)S2σ2χ2(n1),UK.U=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1),\qquad K=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1),\qquad U\perp K.

UUKK 代入 tt 分布的定义:

UK/(n1)=Xμσ/n(n1)S2σ2/(n1)=XμS/nt(n1).\frac{U}{\sqrt{K/(n-1)}} =\frac{\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}}{\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}} =\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1).

这就是单样本 tt 检验的核心公式。

注意:自由度是 n1n-1 而不是 nn——因为 KK 服从 χ2(n1)\chi^2(n-1)。用 X\overline{X} 替代 μ\mu 消耗了一个自由度。

3.3.3 tt 分布的性质

  1. 对称性:t(n)t(n) 分布关于 0 对称,密度函数是偶函数。
  2. 尾部厚度:t(n)t(n) 的尾部比 N(0,1)N(0,1) 更厚。当 nn\to\infty 时,t(n)t(n) 趋近于 N(0,1)N(0,1)。实际中,n30n\ge 30 时两者已经非常接近。
  3. 矩的存在性:t(n)t(n) 只有前 n1n-1 阶矩存在。特别地,
    • n>1n>1E(T)=0E(T)=0
    • n>2n>2Var(T)=nn2\operatorname{Var}(T)=\frac{n}{n-2}(方差不随 nn 增大收敛到 1,而是从大于 1 的方向趋近);
    • n=1n=1 时(即 Cauchy 分布),期望不存在——这是一个极端案例。
  4. 抽样分布中的角色:tt 分布是”未知 σ\sigma 下的均值推断”的标准分布。它比标准正态更保守(置信区间更宽),反映了用 SS 替代 σ\sigma 带来的额外不确定性。

[!note]+ 对比辨析:N(0,1)N(0,1) vs t(n)t(n)

维度N(0,1)N(0,1)t(n)t(n)
适用场景σ\sigma 已知时的均值推断σ\sigma 未知时的均值推断
尾部衰减指数级 ex2/2e^{-x^2/2}多项式级 x(n+1)\sim \|x\|^{-(n+1)}
n=1n=1Cauchy 分布(无期望)
nn\to\infty收敛于 N(0,1)N(0,1)
置信区间较窄较宽(更保守)
方差(n>2n>211n/(n2)>1n/(n-2) > 1

使用决策:如果你知道 σ\sigma,用正态;如果你不知道 σ\sigma 但样本来自正态总体,用 tt;如果样本量很大(n30n\ge 30),两者的差异在实践中常常可以忽略。

3.4 FF 分布:方差的比较

3.4.1 动机:为什么需要比较两个方差?

到目前为止,我们有了推断一个均值的工具(tt)和推断一个方差的工具(χ2\chi^2)。但实际中还有一种常见需求:比较两个总体的方差

例如:

这些问题的共同结构是:你有两个独立估计的方差,想要比较它们的大小。 这就需要一个分布来描述”两个独立 χ2\chi^2 变量(分别除以其自由度)的比值”——这就是 FF 分布。

为什么是比值,而不是差值? 因为方差本身带量纲,用差值比较不方便(差多少算”大”?)。用比值则可以消除量纲——两个方差都除以各自的总体方差后再相除,得到一个无量纲的量。而且,比值能把”方差相等”这个假设简洁地表述为”比值等于 1”。

3.4.2 定义与构造

[!definition]+ FF 分布 若

K1χ2(m),K2χ2(n),K_1\sim \chi^2(m),\qquad K_2\sim \chi^2(n),

K1,K2K_1,K_2 独立,则

F=K1/mK2/nF(m,n).F=\frac{K_1/m}{K_2/n}\sim F(m,n).

FF 服从自由度为 (m,n)(m,n)FF 分布(也叫 Snedecor’s FF)。

用途:用于方差比推断、方差分析和回归分析。

式子拆解

在正态样本下的具体形式:若两组独立样本分别来自正态总体:

SX2/σX2SY2/σY2F(m1,n1).\frac{S_X^2/\sigma_X^2}{S_Y^2/\sigma_Y^2}\sim F(m-1,\,n-1).

特别地,当 σX2=σY2\sigma_X^2=\sigma_Y^2(两总体方差相等)时,

SX2SY2F(m1,n1).\frac{S_X^2}{S_Y^2}\sim F(m-1,\,n-1).

3.4.3 FF 分布的性质

  1. 定义域:(0,)(0,\infty)FF 是两个正量的比值,自然为正。
  2. 不对称性:FF 分布是右偏的。当 m,nm,n 都很大时趋近对称。
  3. 自由度的顺序很重要:F(m,n)F(m,n)F(n,m)F(n,m) 是完全不同的分布。特别地, Fα(m,n)=1F1α(n,m).F_{\alpha}(m,n)=\frac{1}{F_{1-\alpha}(n,m)}. 这个关系在查表时非常有用——如果表中没有 F0.95(5,10)F_{0.95}(5,10),可以查 1/F0.05(10,5)1/F_{0.05}(10,5)
  4. tt 分布的关系: Tt(n)T2F(1,n).T\sim t(n)\quad\Longrightarrow\quad T^2\sim F(1,n). 也就是说,tt 检验的平方等价于 FF 检验——这解释了为什么在方差分析中 FF 检验能替代双样本 tt 检验。
  5. 数字特征: E(F)=nn2  (n>2),Var(F)=2n2(m+n2)m(n2)2(n4)  (n>4).E(F)=\frac{n}{n-2}\;(n>2),\qquad \operatorname{Var}(F)=\frac{2n^2(m+n-2)}{m(n-2)^2(n-4)}\;(n>4).nn 很大时,E(F)1E(F)\approx 1——和直觉一致,两个”单位自由度的平方和”的比值期望趋于 1。

[!warning]+ 查表注意事项

  • FF 分布有两个自由度:第一个是分子的自由度 mm,第二个是分母的自由度 nn。不要写反。
  • Fα(m,n)F_\alpha(m,n) 表示上 α\alpha 分位数,即 P(F>Fα(m,n))=αP(F>F_\alpha(m,n))=\alpha
  • 由于 FF 分布不对称,F0.95(m,n)1/F0.05(m,n)F_{0.95}(m,n)\neq 1/F_{0.05}(m,n)。正确的关系是 F1α(m,n)=1/Fα(n,m)F_{1-\alpha}(m,n)=1/F_\alpha(n,m)

[!note]+ 对比辨析:tt 分布 vs FF 分布

维度t(n)t(n)F(m,n)F(m,n)
定义域(,)(-\infty,\infty)(0,)(0,\infty)
对称性关于 0 对称右偏(不对称)
自由度数1 个2 个(分子 + 分母)
推断对象单个均值(σ\sigma 未知)两个方差的比值
χ2\chi^2 的关系分子是 N(0,1)N(0,1),分母是独立 χ2/n\sqrt{\chi^2/n}分子和分母分别是独立的 χ2/m\chi^2/mχ2/n\chi^2/n
平方关系T2F(1,n)T^2\sim F(1,n)
典型应用单样本/双样本均值检验方差齐性检验、ANOVA、回归整体显著性

3.5 Beta 分布:比例与排序的语言

3.5.1 动机:Beta 分布何时出现?

Beta 分布的定义域是 (0,1)(0,1)——这意味着它天然适合描述比例、概率、排序位置。在统计推断中,Beta 分布主要通过以下两条路径出现:

  1. U(0,1)U(0,1) 样本的顺序统计量。 在第二讲末尾,我们发现 X(k)Beta(k,nk+1)X_{(k)}\sim\text{Beta}(k,n-k+1) 当总体为 U(0,1)U(0,1) 时。
  2. FF 分布的单调变换。 FF 分布和 Beta 分布之间可以互相转化。

3.5.2 定义与基本性质

[!definition]+ Beta 分布 若随机变量 XX 的密度为

p(x;a,b)=1B(a,b)xa1(1x)b1,0<x<1,p(x;a,b)=\frac{1}{B(a,b)}\,x^{a-1}(1-x)^{b-1},\qquad 0<x<1,

其中 a>0,b>0a>0,b>0B(a,b)=Γ(a)Γ(b)/Γ(a+b)B(a,b)=\Gamma(a)\Gamma(b)/\Gamma(a+b) 为 Beta 函数,则称 XBeta(a,b)X\sim\text{Beta}(a,b)

用途:描述 (0,1)(0,1) 上的比例和概率,以及 U(0,1)U(0,1) 样本的顺序统计量分布。

含义解析

FF 分布的关系:若 FF(m,n)F\sim F(m,n),则

mF/n1+mF/nBeta ⁣(m2,n2).\frac{mF/n}{1+mF/n}\sim\text{Beta}\!\left(\frac{m}{2},\frac{n}{2}\right).

这个变换将 (0,)(0,\infty) 上的 FF 分布”压缩”到 (0,1)(0,1) 上。反过来,若 XBeta(a,b)X\sim\text{Beta}(a,b),也可以变回 FF 分布。

3.6 非中心分布(概念了解)

在讨论 ttχ2\chi^2 时,我们默认了”中心”条件——即分子来自 N(0,1)N(0,1)(均值为零)。但在备择假设下,统计量的均值会偏移,不再是零。这就引出了非中心分布

[!definition]+ 非中心分布(概念)

  • 非中心 χ2\chi^2:若 ZiN(μi,1)Z_i\sim N(\mu_i,1) 且独立,则 Zi2χ2(n,λ)\sum Z_i^2\sim\chi^2(n,\lambda),其中非中心参数 λ=μi2\lambda=\sum\mu_i^2
  • 非中心 tt:若 XN(δ,1)X\sim N(\delta,1)Kχ2(n)K\sim\chi^2(n) 独立,则 X/K/nt(n,δ)X/\sqrt{K/n}\sim t(n,\delta)
  • 非中心 FF:若 K1χ2(m,λ)K_1\sim\chi^2(m,\lambda)K2χ2(n)K_2\sim\chi^2(n) 独立,则 (K1/m)/(K2/n)F(m,n,λ)(K_1/m)/(K_2/n)\sim F(m,n,\lambda)

用途:这些分布在功效分析(power analysis)和样本量计算中至关重要——它们描述了”当原假设不成立时,检验统计量的分布会如何偏移”。

在本课程中,非中心分布主要用于理解”为什么样本量越大,检验越容易拒绝错误原假设”。我们会在假设检验的章节中再次遇到它们。

3.7 指数族:统一视角

3.7.1 动机:这么多分布,有什么共同点?

到目前为止,我们讨论了 Gamma、χ2\chi^2ttFF、Beta 以及前两讲的正态、Bernoulli、Poisson、指数分布。这些分布看起来各不相同,但它们在统计推断中有一些共同的需求:

指数族正是为回答这些问题而生的。它的核心思想是:如果一个分布族可以写成特定的”参数与样本分离”的代数形式,那么光看这个形式,就能直接读出它的充分统计量——而这正是下一讲的主题。

3.7.2 标准形式

[!definition]+ 指数族 若分布族可写成

p(x;θ)=c(θ)exp ⁣{j=1kQj(θ)Tj(x)}h(x),p(x;\theta)=c(\theta)\exp\!\left\{\sum_{j=1}^k Q_j(\theta)\,T_j(x)\right\}h(x),

其中:

  • h(x)0h(x)\ge 0 只依赖 xx(不依赖 θ\theta);
  • c(θ)>0c(\theta)>0 只依赖 θ\theta(不依赖 xx);
  • 求和号内 Qj(θ)Q_j(\theta) 只依赖 θ\thetaTj(x)T_j(x) 只依赖 xx
  • 支持集(xx 的取值范围)不依赖 θ\theta

则称该分布族为指数族(exponential family)。kk 为指数族的

用途:这是后续判别充分统计量最直接的结构工具——T(x)=(T1(x),,Tk(x))T(x)=(T_1(x),\dots,T_k(x)) 就是充分统计量的天然候选。

每次读这个公式时,按以下步骤拆解

  1. 找到 h(x)h(x)——把所有不含 θ\theta 的因子塞进 h(x)h(x)
  2. 找到 Tj(x)T_j(x)——所有和 θ\theta 乘在一起的 xx 的函数。
  3. 找到 Qj(θ)Q_j(\theta)——所有和 xx 乘在一起的 θ\theta 的函数。
  4. 剩下的纯 θ\theta 函数归入 c(θ)c(\theta)
  5. 检查支持集是否依赖 θ\theta——这是最容易被忽略的一步!如果支持集依赖 θ\theta(例如 U(0,θ)U(0,\theta)),则它不是指数族(除非做特殊处理)。

3.7.3 典型例子:把常见分布族写成指数族形式

例 1:Bernoulli 分布族 XB(1,p)X\sim B(1,p)0<p<10<p<1

概率函数:

P(X=x)=px(1p)1x,x=0,1.P(X=x)=p^x(1-p)^{1-x},\qquad x=0,1.

重写为指数形式:

P(X=x)=(1p)exp ⁣{xlogp1p}1.P(X=x)=(1-p)\cdot\exp\!\left\{x\cdot\log\frac{p}{1-p}\right\}\cdot 1.

因此:

例 2:正态分布族(σ2\sigma^2 已知,μ\mu 未知)

密度:

p(x;μ)=12πσ2exp ⁣{(xμ)22σ2}.p(x;\mu)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}.

展开指数内的平方:

(xμ)22σ2=x22σ2+μσ2xμ22σ2.-\frac{(x-\mu)^2}{2\sigma^2} =-\frac{x^2}{2\sigma^2}+\frac{\mu}{\sigma^2}x-\frac{\mu^2}{2\sigma^2}.

将含 μ\muxx 的交叉项 μσ2x\frac{\mu}{\sigma^2}x 分离出来(这是关键一步——它是参数和样本的乘积形式):

p(x;μ)=12πσ2exp ⁣{μ22σ2}c(μ)exp ⁣{μσ2Q(μ) ⁣ ⁣xT(x)}exp ⁣{x22σ2}h(x).p(x;\mu)= \underbrace{\frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left\{-\frac{\mu^2}{2\sigma^2}\right\}}_{c(\mu)} \cdot\exp\!\left\{\underbrace{\frac{\mu}{\sigma^2}}_{Q(\mu)}\!\cdot\!\underbrace{x}_{T(x)}\right\} \cdot\underbrace{\exp\!\left\{-\frac{x^2}{2\sigma^2}\right\}}_{h(x)}.

因此:

k=1k=1(一阶指数族),充分统计量为 T(x)=xT(x)=x(即样本和 Xi\sum X_i)。

例 3:正态分布族(μ\muσ2\sigma^2 均未知)

此时参数为 θ=(μ,σ2)\theta=(\mu,\sigma^2)。展开密度:

p(x;μ,σ2)=12πσ2exp ⁣{x22σ2+μσ2xμ22σ2}.p(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi\sigma^2}} \exp\!\left\{-\frac{x^2}{2\sigma^2}+\frac{\mu}{\sigma^2}x-\frac{\mu^2}{2\sigma^2}\right\}.

将含参数的项整理为 Qj(θ)Tj(x)\sum Q_j(\theta)T_j(x) 的形式:

p(x;θ)=12πσ2exp ⁣{μ22σ2}exp ⁣{μσ2x+(12σ2)x2}.p(x;\theta)= \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left\{-\frac{\mu^2}{2\sigma^2}\right\} \cdot\exp\!\left\{\frac{\mu}{\sigma^2}\cdot x+\left(-\frac{1}{2\sigma^2}\right)\cdot x^2\right\}.

因此:

k=2k=2(二阶指数族),充分统计量为 T(x)=(Xi,Xi2)T(x)=(\sum X_i,\sum X_i^2)

3.7.4 常见分布族的指数族归属

分布族是指数族?阶数 kk充分统计量 T(x)T(x)
Bernoulli B(1,p)B(1,p)1Xi\sum X_i
Binomial B(m,p)B(m,p)mm 已知)1Xi\sum X_i
Poisson P(λ)P(\lambda)1Xi\sum X_i
指数分布 E(λ)E(\lambda)1Xi\sum X_i
正态 N(μ,σ02)N(\mu,\sigma_0^2)σ0\sigma_0 已知)1Xi\sum X_i
正态 N(μ,σ2)N(\mu,\sigma^2)(均未知)2(Xi,Xi2)(\sum X_i,\sum X_i^2)
Gamma Γ(α,λ)\Gamma(\alpha,\lambda)α\alpha 已知)1Xi\sum X_i
Gamma Γ(α,λ)\Gamma(\alpha,\lambda)(均未知)2(Xi,logXi)(\sum X_i,\sum \log X_i)
Uniform U(0,θ)U(0,\theta)—(支持集依赖 θ\theta
Cauchy 平移族

[!warning]+ 判断指数族的常见陷阱

  • 看到 ee 的指数就说是”指数族”——这是最常见的错误。关键不是有没有指数函数,而是能否写成 c(θ)exp{Qj(θ)Tj(x)}h(x)c(\theta)\exp\{\sum Q_j(\theta)T_j(x)\}h(x)标准分离形式
  • 忘记检查支持集——U(0,θ)U(0,\theta) 的密度本身可以写成 1/θ1/\theta(当 0<x<θ0<x<\theta),但支持集 (0,θ)(0,\theta) 依赖参数 θ\theta,所以不是指数族!
  • 支持集依赖参数的分布族(如 Uniform、Pareto)通常不是指数族——这一事实对充分统计量的讨论有重要影响,因为非指数族可能需要比 (T1,,Tk)(T_1,\dots,T_k) 更多的信息才能达到充分性。

四、推导与证明

1. 证明依赖

2. 证明思路概览

[!proof]- 📐 深度推导:Z2Γ(1/2,1/2)Z^2\sim\Gamma(1/2,1/2) 的证明

ZN(0,1)Z\sim N(0,1)。考虑 Y=Z2Y=Z^2

第一步:用分布函数法求 YY 的密度。

y>0y>0

P(Yy)=P(yZy)=2Φ(y)1.P(Y\le y)=P(-\sqrt{y}\le Z\le\sqrt{y})=2\Phi(\sqrt{y})-1.

求导:

fY(y)=2ϕ(y)12y=12πy1/2ey/2,y>0.f_Y(y)=2\phi(\sqrt{y})\cdot\frac{1}{2\sqrt{y}} =\frac{1}{\sqrt{2\pi}}\,y^{-1/2}e^{-y/2},\qquad y>0.

第二步:与 Gamma 密度对比。

Γ(1/2,1/2)\Gamma(1/2,1/2) 的密度为:

(1/2)1/2Γ(1/2)y1/2ey/2.\frac{(1/2)^{1/2}}{\Gamma(1/2)}\,y^{-1/2}e^{-y/2}.

Γ(1/2)=π\Gamma(1/2)=\sqrt{\pi}(这是 Gamma 函数的一个基本性质)。代入:

1/2πy1/2ey/2=12πy1/2ey/2.\frac{1/\sqrt{2}}{\sqrt{\pi}}\,y^{-1/2}e^{-y/2} =\frac{1}{\sqrt{2\pi}}\,y^{-1/2}e^{-y/2}.

fY(y)f_Y(y) 完全相同。因此 Z2Γ(1/2,1/2)=χ2(1)Z^2\sim\Gamma(1/2,1/2)=\chi^2(1)

为什么这一步很重要? 它建立了”正态平方 → Gamma 分布”的桥梁。有了这一步,再结合 Gamma 的封闭性,就立刻得到:nn 个独立标准正态的平方和 Γ(n/2,1/2)=χ2(n)\sim\Gamma(n/2,1/2)=\chi^2(n)

[!proof]- 📐 深度推导:tt 分布密度的推导思路

XN(0,1)X\sim N(0,1)Kχ2(n)K\sim\chi^2(n) 独立。令 T=X/K/nT=X/\sqrt{K/n}

**推导策略:**因为分母涉及 χ2\chi^2,直接用变量变换法比较复杂。常用的路径是:

  1. 先写出 (X,K)(X,K) 的联合密度:

    fX,K(x,k)=12πex2/212n/2Γ(n/2)kn/21ek/2.f_{X,K}(x,k)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\cdot\frac{1}{2^{n/2}\Gamma(n/2)}k^{n/2-1}e^{-k/2}.
  2. 做变量变换:令 T=X/K/nT=X/\sqrt{K/n}U=KU=K。解出 X=TU/nX=T\sqrt{U/n}。Jacobian 为 U/n\sqrt{U/n}

  3. 写出 (T,U)(T,U) 的联合密度,然后对 UU 积分出 TT 的边际密度。

最终结果为:

fT(t)=Γ((n+1)/2)nπΓ(n/2)(1+t2n)(n+1)/2,tR.f_T(t)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\,\Gamma(n/2)}\left(1+\frac{t^2}{n}\right)^{-(n+1)/2},\qquad t\in\mathbb{R}.

关键观察:密度的衰减速度是 t(n+1)|t|^{-(n+1)}——多项式衰减,而标准正态是指数衰减 et2/2e^{-t^2/2}。这解释了 tt 分布的”厚尾”特性。

用途:这个推导是理解”为什么需要 tt 分布”的关键——它从数学上确认了”用 SS 替代 σ\sigma 会使尾部变厚”这一直觉。

[!proof]- 📐 深度推导:指数族判别的标准步骤

给定一个密度或概率函数 p(x;θ)p(x;\theta),判断它是否属于指数族的标准流程:

第 1 步:检查支持集 {x:p(x;θ)>0}\{x:p(x;\theta)>0\} 是否依赖 θ\theta。如果依赖,通常不是指数族。

第 2 步:将密度中所有含 θ\theta 的因子提取出来,尝试写成

p(x;θ)=c(θ)exp ⁣{j=1kQj(θ)Tj(x)}h(x).p(x;\theta)=c(\theta)\cdot\exp\!\left\{\sum_{j=1}^k Q_j(\theta)T_j(x)\right\}\cdot h(x).

第 3 步:验证 Qj(θ)Q_j(\theta)Tj(x)T_j(x) 是彼此分离的——QjQ_j 不能含 xxTjT_j 不能含 θ\theta

第 4 步:如果成功,kk 就是阶数,(T1,,Tk)(T_1,\dots,T_k) 就是(最小)充分统计量的天然候选。

U(0,θ)U(0,\theta) 为例走一遍这个流程:

  • 密度 p(x;θ)=1/θp(x;\theta)=1/\theta,当 0<x<θ0<x<\theta
  • 第 1 步失败:支持集 (0,θ)(0,\theta) 依赖 θ\theta
  • 结论:U(0,θ)U(0,\theta) 不是指数族(所以不要尝试去找指数形式的标准分离式)。

这个结论有实用的推论:对于 U(0,θ)U(0,\theta),充分统计量是 X(n)X_{(n)}(样本最大值),而不是 Xi\sum X_i 这种求和形式的统计量——这和你对指数族的理解是一致的:指数族的充分统计量总是求和(或某种加法型)的形式。

五、关键公式释义

1. Gamma 分布密度

p(x;α,λ)=λαΓ(α)xα1eλx,x>0p(x;\alpha,\lambda)=\frac{\lambda^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}, \qquad x>0

2. χ2\chi^2 分布与 Gamma 的关系

χ2(n)=Γ ⁣(n2,12)\chi^2(n)=\Gamma\!\left(\frac{n}{2},\frac{1}{2}\right)

3. tt 分布构造式

T=XK/nt(n)T=\frac{X}{\sqrt{K/n}}\sim t(n)

4. FF 分布构造式

F=K1/mK2/nF(m,n)F=\frac{K_1/m}{K_2/n}\sim F(m,n)

5. 指数族标准形式

p(x;θ)=c(θ)exp ⁣{j=1kQj(θ)Tj(x)}h(x)p(x;\theta)=c(\theta)\exp\!\left\{\sum_{j=1}^k Q_j(\theta)T_j(x)\right\}h(x)

六、例题与变式

1. 标准题

**题型:**分布题 / 构造题

题目:

X1,,XnN(μ,σ2)X_1,\dots,X_n\sim N(\mu,\sigma^2),写出

n(Xμ)S\frac{\sqrt{n}(\overline{X}-\mu)}{S}

的分布,并说明理由。

解题思路(先理顺每一步的”为什么”):

  1. **识别统计任务:**这是”已知正态样本,求统计量分布”的题目。
  2. 拆解分子:Xμ\overline{X}-\mu 是样本均值偏离总体均值的量。乘以 n\sqrt{n} 并除以 σ\sigma 后得到标准正态——这是第二讲的 X\overline{X} 分布结论。
  3. 拆解分母:SS 是样本标准差。由第二讲的 (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1),可知 S2S^2χ2\chi^2 的关系。
  4. 关键一步:X\overline{X}S2S^2 独立(第二讲三大结论之三)。这意味着分子和分母分别由独立的随机源驱动。
  5. **拼合:**分子经过适当缩放变成 N(0,1)N(0,1),分母经过适当缩放变成 χ2(n1)/(n1)\sqrt{\chi^2(n-1)/(n-1)},且二者独立。这恰好是 tt 分布的定义。

解答:

U=n(Xμ)σN(0,1),K=(n1)S2σ2χ2(n1),U=\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1),\qquad K=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1),

UKU\perp K

于是

n(Xμ)S=UK/(n1)t(n1).\frac{\sqrt{n}(\overline{X}-\mu)}{S} =\frac{U}{\sqrt{K/(n-1)}}\sim t(n-1).

答案解读:注意最终分母中的 SS 是样本标准差,而 tt 定义式中的分母是 K/n\sqrt{K/n}。这里的 n1n-1(而不是 nn)来自 (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2\sim\chi^2(n-1) 的自由度。

常见坑点提醒:

**用途:**这是单样本均值推断中最常见的分布识别题。

2. 变式题

变式一:若 σ\sigma 已知,则统计量回到标准正态:

n(Xμ)σN(0,1).\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1).

此时不需要 tt 分布,SS 也不再出现在统计量中。

变式二:比较两组正态总体均值(双样本问题)。

X1,,XmN(μX,σ2)X_1,\dots,X_m\sim N(\mu_X,\sigma^2)Y1,,YnN(μY,σ2)Y_1,\dots,Y_n\sim N(\mu_Y,\sigma^2),两样本独立,且方差相等(但未知)

此时构造的 pooled tt 统计量为:

(XY)(μXμY)Sp1/m+1/nt(m+n2),\frac{(\overline{X}-\overline{Y})-(\mu_X-\mu_Y)}{S_p\sqrt{1/m+1/n}}\sim t(m+n-2),

其中 Sp2S_p^2 是 pooled variance。

变式三:比较两个方差(进入 FF 分布)。

若比较 σX2/σY2\sigma_X^2/\sigma_Y^2,则:

SX2/σX2SY2/σY2F(m1,n1).\frac{S_X^2/\sigma_X^2}{S_Y^2/\sigma_Y^2}\sim F(m-1,n-1).

3. 标准题:指数族判定

题目:

判断 XPoisson(λ)X\sim\text{Poisson}(\lambda)λ>0\lambda>0)是否属于指数族,若是,写出其充分统计量。

解题思路

  1. Poisson 的概率函数:P(X=x)=λxeλx!P(X=x)=\frac{\lambda^x e^{-\lambda}}{x!}x=0,1,2,x=0,1,2,\dots
  2. 支持集 {0,1,2,}\{0,1,2,\dots\} 不依赖 λ\lambda
  3. 尝试分离参数和样本: P(X=x)=eλ1x!exlogλ=eλexp{xlogλ}1x!.P(X=x)=e^{-\lambda}\cdot\frac{1}{x!}\cdot e^{x\log\lambda} =e^{-\lambda}\cdot\exp\{x\cdot\log\lambda\}\cdot\frac{1}{x!}.

解答:

因此,

是指数族,k=1k=1,充分统计量为 T(x)=XT(x)=X(单一样本下)或 i=1nXi\sum_{i=1}^n X_i(样本量为 nn 时)。

常见坑点提醒:

4. 题型提醒

[!tip]+ 做题顺序:分布识别题

  1. 先问自己:它能否拆成”正态 / χ2\chi^2 / 比值”。 看到平方和 → χ2\chi^2;看到正态/χ2\chi^2 比值 → 可能的 tt;看到两个独立 χ2\chi^2 比值 → FF
  2. 遇到 Gamma 分布先看是否存在”同率参数下求和”。 不同 λ\lambda 的 Gamma 相加,分布不是 Gamma。
  3. 遇到顺序统计量在 U(0,1)U(0,1) 下的问题,优先想 Beta 分布。
  4. 遇到”判断是否指数族”,先检查支持集,再尝试代数重排。

七、章节连接

八、复习整理

[!summary]+ 本讲小结

  • 研究的问题:统计推断里最常见的分布如何定义、构造和联系。
  • 使用的模型:标准正态、正态样本、Gamma 封闭性、独立性。
  • 核心分布链: Γ(α,λ)χ2(n)=Γ ⁣(n2,12){t(n)=N(0,1)χ2(n)/nF(m,n)=χ2(m)/mχ2(n)/n\Gamma(\alpha,\lambda)\longrightarrow\chi^2(n)=\Gamma\!\left(\frac{n}{2},\frac{1}{2}\right) \longrightarrow \begin{cases} t(n)=\dfrac{N(0,1)}{\sqrt{\chi^2(n)/n}}\\[10pt] F(m,n)=\dfrac{\chi^2(m)/m}{\chi^2(n)/n} \end{cases}
  • 关键结论:
    1. χ2\chi^2 分布是 Gamma 的特例,继承 Gamma 的封闭性。
    2. tt 分布是”未知 σ\sigma 下均值推断”的工具,尾部比正态厚。
    3. FF 分布是”方差比推断”的工具,T2F(1,n)T^2\sim F(1,n)
    4. Beta 分布描述 (0,1)(0,1) 上的比例,与 FF 和顺序统计量紧密关联。
    5. 大多数经典分布族属于指数族,可以用 c(θ)exp{Qj(θ)Tj(x)}h(x)c(\theta)\exp\{\sum Q_j(\theta)T_j(x)\}h(x) 统一表达——其中的 TjT_j 就是充分统计量的天然候选。
  • 最重要的条件:独立性、正态性(ttFF 构造的基础)、指数族要求支持集不依赖参数。
  • 本讲最终服务什么推断任务:为后续构造检验统计量、分析功效和判别充分统计量做准备。

高频误套

[!warning]+ 常见错误

  • tt 分布和标准正态分布混用,忽略自由度。 nn 小的时候(如 n=5n=5),tt 的尾部差异很大(95% 分位数 t0.025(4)2.776t_{0.025}(4)\approx 2.776,而 z0.025=1.96z_{0.025}=1.96)。忽略这个差异会严重低估置信区间的宽度。
  • F(m,n)F(m,n) 写成 F(n,m)F(n,m) 自由度的顺序影响整个分布的形状和分位数。
  • 看到”和”就机械写成 Gamma 分布,忘记检查参数是否同 λ\lambda Γ(2,3)+Γ(3,5)\Gamma(2,3)+\Gamma(3,5) 不是 Gamma 分布。
  • 看到指数函数就误判为指数族。 必须能写成标准的 c(θ)exp{Qj(θ)Tj(x)}h(x)c(\theta)\exp\{\sum Q_j(\theta)T_j(x)\}h(x) 分离形式,且支持集不依赖参数。
  • 判断指数族时忽略支持集检查。 U(0,θ)U(0,\theta) 是最常见的”看起来像但实际不是”的例子。

条件卡

  1. 结论:χ2(n)=Γ(n/2,1/2)\chi^2(n)=\Gamma(n/2,1/2)。 **成立条件:**由独立标准正态平方和构造。 **不能用在:**非标准化、相关正态的平方和不经处理直接套用。 **常见误套场景:**直接把 (Xiμ)2/σ2(X_i-\mu)^2/\sigma^2 求和——这没问题(XiX_i 是独立正态 হলে就行)。但不要把非正态的平方和也当成 χ2\chi^2

  2. 结论:T=XK/nt(n)T=\frac{X}{\sqrt{K/n}}\sim t(n)成立条件:XN(0,1)X\sim N(0,1)Kχ2(n)K\sim\chi^2(n),且独立。 **不能用在:**分子分母不独立或分母不是对应自由度的独立 χ2\chi^2。常见陷阱:XμS/nt(n1)\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1),不是 t(n)t(n)。 **常见误套场景:**分母用了 χ2(n)\chi^2(n) 但自由度写成 nn 而不是样本对应的 n1n-1(在单样本情形下)。

  3. **结论:**指数族可写成 c(θ)exp{Qj(θ)Tj(x)}h(x)c(\theta)\exp\{\sum Q_j(\theta)T_j(x)\}h(x)。 **成立条件:**参数部分和样本部分能完全分离,且支持集不依赖参数。 **不能用在:**参数和样本混杂、支持集依赖参数的情形。 **常见误套场景:**只看到 exp\exp 就说”这是指数族”。一定要逐条核对:h(x)h(x) 不含参数?Qj(θ)Q_j(\theta) 不含 xx?支持集不依赖 θ\theta

  4. 结论:T2F(1,n)T^2\sim F(1,n)Tt(n)T\sim t(n)成立条件:Tt(n)T\sim t(n)。 **不能用在:**非 tt 分布的平方不能随意套用 FF 分布。 **常见误套场景:**把任何标准化统计量的平方都当成 F(1,n)F(1,n)

九、习题区

1. 概念题

  1. 为什么说 Gamma 分布是统计推断中的”母分布”之一? 它和 χ2\chi^2、指数分布、tt 分布分别有什么关系?

  2. tt 分布为什么比标准正态尾部更厚? 这一现象背后的直觉是什么?当自由度 nn\to\infty 时,tt 分布为什么会趋近于标准正态?

  3. 指数族为什么和充分统计量关系密切? 如果某分布族不是指数族(如 U(0,θ)U(0,\theta)),它的充分统计量通常具有什么不同的特征?

2. 标准题

  1. 写出 χ2(n)\chi^2(n)t(n)t(n)F(m,n)F(m,n) 的定义(用标准正态和 χ2\chi^2 构造)。

  2. 证明:若 X1Γ(α1,λ)X_1\sim\Gamma(\alpha_1,\lambda)X2Γ(α2,λ)X_2\sim\Gamma(\alpha_2,\lambda) 且独立,则 X1+X2Γ(α1+α2,λ)X_1+X_2\sim\Gamma(\alpha_1+\alpha_2,\lambda)。提示:用卷积或矩母函数。

  3. 判断下列分布族是否属于指数族,若是则写出其标准形式和充分统计量:

    • (a) Binomial(m,p)\text{Binomial}(m,p)mm 已知,0<p<10<p<1
    • (b) Exponential(λ)\text{Exponential}(\lambda)λ>0\lambda>0
    • (c) U(0,θ)U(0,\theta)θ>0\theta>0

3. 综合题

  1. 分布关系链的梳理。ZN(0,1)Z\sim N(0,1) 出发:

    • (a) 说明 Z2χ2(1)Z^2\sim\chi^2(1)
    • (b) 推广到 nn 个独立 ZiZ_iZi2χ2(n)\sum Z_i^2\sim\chi^2(n)
    • (c) 利用第二讲的正态样本三大结论,证明 XμS/nt(n1)\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)
    • (d) 利用 (b) 和独立性,证明 SX2SY2\frac{S_X^2}{S_Y^2}(在 σX2=σY2\sigma_X^2=\sigma_Y^2 时)服从 F(m1,n1)F(m-1,n-1)
  2. 指数族与充分统计量的预期。 对下列模型族,在不使用因子分解定理的情况下,仅根据指数族的形式预测其充分统计量:

    • (a) X1,,XnPoisson(λ)X_1,\dots,X_n\sim\text{Poisson}(\lambda)
    • (b) X1,,XnN(μ,σ2)X_1,\dots,X_n\sim N(\mu,\sigma^2)μ\mu 未知,σ2\sigma^2 已知
    • (c) X1,,XnN(μ,σ2)X_1,\dots,X_n\sim N(\mu,\sigma^2),两个参数均未知 下一讲我们将用因子分解定理来验证这些预测。
  3. 思考题:为什么要学这么多分布? 用自己的话总结 χ2\chi^2ttFF 三种分布分别在统计推断中解决什么问题。如果统计推断只需要正态分布就够,为什么还需要这些”古怪”的分布?

附:排版约定

[!tip]+ 写作规则

  • 行内公式统一用 $...$
  • 行间公式统一用 $$...$$
  • 重要公式后面补一句”用途说明”。
  • 先写条件,再写结论,再写用途。
  • 少用缩进,多用小标题、短段落和留白。
  • 保留老师强调过的原表达,但其余内容改写为讲义语言。
  • 每讲默认产出:本讲小结、高频误套、3 至 5 张条件卡、标准题与变式题。

Edit page

Previous Post
第02讲 抽样分布、正态样本与顺序统计量
Next Post
第04讲 充分统计量与最小充分统计量