概率论与数理统计A · 期末速通精讲
开篇:这份资料怎么用
这门课不靠"刷难题",靠把固定套路练熟。18 套真题统计下来,每年考的就是那几类母题,题面换皮、内核不变。把下面 7 类母题练到闭着眼睛能写步骤,期末大题 70% 的分就稳了。
三步用法
- 先看「考点频率地图」,知道哪些必考、哪些是送分题、哪些只在选择题露面。时间紧就按 ★ 多少排优先级。
- 每个模块先读「知识点讲解」,把定义、公式、套路记住;再做「真题精练」,对着分步解析自己重写一遍。
- 做穿插的选择题,点一下选项立刻判分给解析,右下角实时显示正确率。不懂就问右下角 💬 答疑助手。
考点频率地图(18 套真题统计)
| 模块 | 重要度 | 在卷面怎么考 |
|---|---|---|
| M1 随机事件与概率 | ★★★★★ | 几乎每套 1 道大题(全概率+贝叶斯为主力);选择题考加法公式、条件概率、独立性 |
| M4 多维随机变量 | ★★★★★ | 全卷最高产,每套 1–3 道:联合→边缘→独立性→E(XY);Z=X+Y;max/min |
| M8 参数估计 | ★★★★★ | 每套必有 1 道,几乎全是极大似然估计;选择题考矩估计、无偏有效、区间估计 |
| M9 假设检验 | ★★★★★ | 每套必有 1 道:单正态均值检验(t/U)或方差 χ² 检验 |
| M2 一维随机变量 | ★★★★ | 每套约 1 道:连续密度"求常数→F(x)→E/D";选择题考分布函数性质、正态对称 |
| M3 随机变量函数的分布 | ★★★★ | 每套约 1 道:已知 X 求 Y=g(X) 的密度(分布函数法),稳定送分 |
| M5 数字特征 | ★★★ | 多作为 M4 的子问;选择题考 D(aX±bY)、协方差、相关系数 |
| M6 大数定律与中心极限定理 | ★★ | 基本只在选择/填空:中心极限定理、切比雪夫不等式 |
| M7 数理统计基本概念 | ★★ | 选择/填空:辨认抽样分布 χ²/t/F |
复习路径(时间紧就照这个顺序来)
不按课本章节顺序,按"投入产出比"排。一句话战略:M1 / M4 / M8 / M9 四块吃透 ≈ 拿下大题 70% 的分;M2 / M3 是稳定送分题必须会;M5 / M6 / M7 主攻选择题套路。
🔴 第一档 · 四大高频大题(每套必考,先啃这四块)
| 顺序 | 模块 | 母题模板 | 练法重点 | ||
|---|---|---|---|---|---|
| 1 | M1 全概率+贝叶斯 | 列 P(Ai)、P(B\ | Ai) → 全概率求 P(B) → 贝叶斯反推 P(Ai\ | B) | 血液化验伪阳性、直播带货(2022 近年原题) |
| 2 | M4 多维随机变量 | 求常数→边缘→独立性→E(XY);加 Z=X+Y 卷积、max/min | 离散表 / 连续密度 / 均匀域 三类各练一道 | ||
| 3 | M8 参数估计 | 几乎全是 MLE:L(θ)=∏f(xi) → lnL → 求导=0 → 解 θ̂ | 指数 / 泊松 / 正态 / 几何 套路背成肌肉记忆 | ||
| 4 | M9 假设检验 | 提 H0/H1 → 选统计量 → 定拒绝域 → 比较下结论 | 核心是别选错统计量:σ²未知用 t、已知用 U、查方差用 χ² |
🟡 第二档 · 稳定送分题(必须会,不会就亏分)
- M2 一维连续密度:归一化求常数 → 分段写 F(x) → 求 E(X)/D(X)。
- M3 随机变量函数分布:分布函数法 FY(y)=P{g(X)≤y} → 求导(见过 X²/√X/eˣ/sinX/lnX 等)。
🟢 第三档 · 客观题套路(只刷选择/填空,不展开大题)
- M5 数字特征:D(aX±bY)、协方差、相关系数 ρ。
- M6 大数定律/中心极限:中心极限定理近似、切比雪夫不等式估概率。
- M7 抽样分布:由统计量构造辨认 χ²/t/F。
考前最后一晚:只过下面的「七道必拿分母题模板」+「必背公式速查表」,再把 M5/M6/M7 的选择题套路扫一遍即可。
七道"必拿分"母题(背下解题模板)
- 全概率 + 贝叶斯(M1):列原因 Ai → 写 P(Ai)、P(B|Ai) → 全概率求 P(B) → 贝叶斯求 P(Ai|B)。
- 二维连续型综合(M4):求常数 → 边缘密度 → 独立性判断 → E(XY)。
- 一维连续密度综合(M2):归一化求常数 → 分段写 F(x) → 求 E(X)/D(X)。
- 随机变量函数分布(M3):分布函数法 FY(y)=P{g(X)≤y} → 求导。
- Z = X + Y 的分布(M4):卷积 fZ(z)=∫ fX(x)fY(z−x) dx(或二维均匀直接积分)。
- 极大似然估计(M8):写似然 L(θ)=∏ f(xi) → 取对数 ln L → 求导=0 → 解出 θ̂。
- 单正态总体假设检验(M9):提 H0/H1 → 选统计量(σ² 未知用 t、已知用 U、查方差用 χ²)→ 定拒绝域 → 代入比较下结论。
必背公式速查表
考前最后一晚就背这一节。每条公式后面都标了它属于哪个模块、用在哪类题。
概率基本公式(M1)
- 加法公式:P(A∪B) = P(A) + P(B) − P(AB);若 A、B 互斥则 P(A∪B)=P(A)+P(B)。
- 减法公式:P(A−B) = P(A) − P(AB);P(A̅) = 1 − P(A)。
- 条件概率: P(B|A) = P(AB) / P(A) (要求 P(A) > 0)
- 乘法公式:P(AB) = P(A)·P(B|A) = P(B)·P(A|B)。
- 独立:A、B 独立 ⟺ P(AB) = P(A)P(B)。此时 P(B|A)=P(B)。
- 全概率公式("由原因推结果"):设 A1…An 是一组互斥且穷尽的原因, P(B) = Σi P(Ai)·P(B|Ai)
- 贝叶斯公式("由结果反推原因"): P(Ak|B) = P(Ak)P(B|Ak) / Σi P(Ai)P(B|Ai)
常见分布的期望方差(M2 / M5)
| 分布 | 记号 | 分布律 / 密度 | 期望 E(X) | 方差 D(X) |
|---|---|---|---|---|
| 0-1 分布 | B(1,p) | P{X=1}=p, P{X=0}=1−p | p | p(1−p) |
| 二项分布 | B(n,p) | P{X=k}=C(n,k)pk(1−p)n−k | np | np(1−p) |
| 泊松分布 | P(λ) | P{X=k}=λke−λ/k! | λ | λ |
| 均匀分布 | U(a,b) | f(x)=1/(b−a), a<x<b | (a+b)/2 | (b−a)2/12 |
| 指数分布 | E(λ) | f(x)=λe−λx, x>0 | 1/λ | 1/λ2 |
| 正态分布 | N(μ,σ²) | f(x)=标准钟形 | μ | σ2 |
指数分布要分清"参数 λ"写法:f(x)=λe−λx 时 E(X)=1/λ。本校真题基本用这个写法。
数字特征公式(M5)
- 离散期望:E(X)=Σ xk pk;连续期望: E(X) = ∫ x·f(x) dx
- 函数期望:E(g(X))=Σ g(xk)pk 或 ∫ g(x)f(x) dx(不用先求 Y 的分布)。
- 方差:D(X) = E(X2) − [E(X)]2(最常用)。
- 线性性质:E(aX+b)=aE(X)+b;D(aX+b)=a2D(X)。
- 协方差:Cov(X,Y) = E(XY) − E(X)E(Y)。
- 方差和:D(X±Y) = D(X) + D(Y) ± 2Cov(X,Y);X、Y 独立(或不相关)时 D(X±Y)=D(X)+D(Y)。
- 相关系数: ρXY = Cov(X,Y) / √(D(X)·D(Y)) |ρ|≤1,ρ=±1 ⟺ X、Y 有线性关系。
- 独立 ⟹ 不相关(ρ=0),反之不一定。
数理统计核心(M7 / M8 / M9)
- 样本均值:X̄ = (1/n)ΣXi;样本方差:S2 = 1n−1 ·Σ(Xi−X̄)2(注意分母是 n−1)。
- 三大抽样分布(Xi 独立同 N(0,1)):ΣXi2 ~ χ²(n);正态/√(χ²/n) ~ t(n);(χ²1/n1)/(χ²2/n2) ~ F(n1,n2)。
- 正态总体抽样:(X̄−μ)/(σ/√n) ~ N(0,1);(X̄−μ)/(S/√n) ~ t(n−1);(n−1)S²/σ² ~ χ²(n−1)。
- 矩估计:令总体矩=样本矩(E(X)=X̄)解参数。
- 极大似然估计:L(θ)=∏f(xi;θ) → ln L → d(ln L)/dθ = 0 → 解 θ̂。
- 假设检验拒绝域(显著性水平 α):
- 均值、σ² 已知(U 检验):U=(X̄−μ0)/(σ/√n),拒绝域 |U| > uα/2。
- 均值、σ² 未知(t 检验):t=(X̄−μ0)/(S/√n),拒绝域 |t| > tα/2(n−1)。
- 方差(χ² 检验):χ²=(n−1)S²/σ02,拒绝域 χ² > χ²α/2(n−1) 或 χ² < χ²1−α/2(n−1)。
- 两类错误:弃真=第一类错误(H0 真却拒绝,概率 α);取伪=第二类错误(H0 假却接受)。
M1 随机事件与概率
★★★★★ 每套必考。大题主力是全概率公式 + 贝叶斯公式,选择/填空考加法公式、条件概率、独立性。这一块是整张卷子最稳的送分大题,模板背熟即可。
知识点讲解
1. 事件关系与运算
- 互斥(互不相容):A、B 不能同时发生,AB=∅,此时 P(A∪B)=P(A)+P(B)。
- 对立:A̅ 是"A 不发生",P(A̅)=1−P(A),且 A 与 A̅ 必有一个发生。
- 独立:一个发生与否不影响另一个,判据是 P(AB)=P(A)P(B)。
- ⚠️ 易错:互斥和独立是两回事。两个概率都不为 0 的事件,互斥一定不独立(互斥时 P(AB)=0≠P(A)P(B))。
2. 三个核心公式
加法公式(求"至少一个发生"):
条件概率(已知 A 发生,求 B 的概率):
乘法公式:P(AB) = P(A)·P(B|A)。
3. 全概率公式(由原因推结果)
当事件 B 的发生有多个互斥的"原因" A1, A2, …, An(它们互斥、且并起来是全集),求 B 的总概率:
口诀:先分类(每个原因的概率),再算每类下 B 的条件概率,加权求和。
4. 贝叶斯公式(由结果反推原因)
已知 B 已经发生了,反过来问"它是由原因 Ak 引起的概率":
分母 P(B) 就是上面全概率公式的结果。所以贝叶斯永远是全概率的下一步——先用全概率算出 P(B),再拿其中一项除以它。
5. 解题模板(背下来)
- 设原因事件 A1…An("由谁引起"),设结果事件 B("发生了什么")。
- 从题里抄出 P(Ai)(各原因的概率)和 P(B|Ai)(每个原因下结果发生的概率)。
- 第(1)问通常问 P(B) → 套全概率公式。
- 第(2)问通常问"已知结果,求是某原因" → 套贝叶斯,分母用第(1)问的 P(B)。
真题精练
真题①(2022-2023 计算题,10 分)· 全概率 + 贝叶斯
某直播平台甲、乙、丙三位主播上直播的概率分别为 25%、35%、40%,他们介绍同一款产品,销售额达到十万元的概率分别为 5%、4%、2%。 (1) 今天有一位主播介绍该产品,求销售额达到十万元的概率; (2) 已知此产品今日销售额达到十万元,求今日产品被甲推销的概率(结果保留四位小数)。
第 1 步:设事件。 设 A=甲上直播、B=乙上直播、C=丙上直播(这三个是互斥原因),D=销售额达十万(结果)。
第 2 步:抄数据。
第 3 步:(1) 用全概率公式求 P(D)。
即 P(D) = 3.45%。
第 4 步:(2) 用贝叶斯公式求 P(A|D)。 已知达到十万(D 发生),问是甲(A)的概率:
即 被甲推销的概率约 36.23%。
套路复盘:第(1)问全概率,第(2)问贝叶斯(分子是第(1)问里"甲"那一项,分母是第(1)问的总和)。所有全概率+贝叶斯大题都是这个流程,换的只是背景故事。
真题②(2008-2009,8 分)· 经典"假阳性"贝叶斯
一项血液化验有 95% 的把握把患病的人鉴定出来,但对健康人也有 1% 的"伪阳性"(健康人误诊患病)。这种病患者占人口的 0.5%。(1) 某人化验结果为阳性的概率?(2) 若某人化验为阳性,求他确实患病的概率。
设 A=患病(P(A)=0.005,故 P(A̅)=0.995),B=化验阳性,P(B|A)=0.95,P(B|A̅)=0.01。
(1) 全概率:
(2) 贝叶斯:
反直觉的点:化验"准确率 95%",但阳性者真患病的概率只有约 32%。原因是健康人基数太大(99.5%),1% 的误诊也贡献了大量假阳性。这正是贝叶斯的经典考点。
选择题即时练
M2 一维随机变量及其分布
★★★★ 每套约 1 道大题,固定套路:连续型密度"求常数 → 写分布函数 F(x) → 求 E(X)/D(X)"。选择填空考分布函数性质、正态对称性、常见分布。
知识点讲解
1. 分布函数 F(x)
定义:F(x) = P{X ≤ x}(注意是"≤",小于等于)。四条性质:
- 单调不减;F(−∞)=0,F(+∞)=1;
- 右连续;
- 离散型 F(x) 是阶梯函数;连续型 F(x) 连续。
由 F(x) 求概率:P{a < X ≤ b} = F(b) − F(a);P{X=a}=F(a)−F(a−0)(跳跃高度)。
2. 连续型随机变量与密度 f(x)
- 归一化条件(求待定常数全靠它): ∫−∞+∞ f(x) dx = 1
- 密度与分布函数:F(x)=∫−∞x f(t) dt,反过来 f(x)=F′(x)。
- 求区间概率:P{a<X<b}=∫ab f(x) dx(连续型,端点取不取无所谓)。
3. 连续型"三连问"解题模板
题目给一个含待定常数的分段密度 f(x),几乎总是依次问:
- 求常数:用 ∫f(x)dx=1 列方程解出常数(有时还会给一个额外条件如 E(X)=1 或 P{0<X<1}=1/2 联立)。
- 求分布函数 F(x):分段积分。x 落在哪段,就把"从 −∞ 到 x"的密度积起来;要写成分段函数(每个区间一个表达式),别漏端点。
- 求 E(X) / D(X):E(X)=∫x·f(x)dx;D(X)=E(X²)−[E(X)]²,其中 E(X²)=∫x²·f(x)dx。
4. 正态分布的对称性(选择填空高频)
X ~ N(μ,σ²),标准化 Z=(X−μ)/σ ~ N(0,1),用标准正态分布函数 Φ。
- 对称性:Φ(−x)=1−Φ(x);P{X<μ}=0.5。
- P{|X−μ|<σ}、P{X<μ−σ} 这类要先标准化再查 Φ 表 / 用对称性。
真题精练
真题①(2014-2015,10 分)· 连续密度三连问
设 X 的密度 f(x) = Cx³(0<x<1),其它为 0。(1) 求常数 C;(2) 求分布函数 F(x);(3) 求 E(X)。
(1) 归一化求 C:
(2) 分段写 F(x): 分三段。
- x ≤ 0 时 F(x)=0;
- 0 < x < 1 时 F(x)=∫0x 4t3 dt = x4;
- x ≥ 1 时 F(x)=1。
(3) 求期望:
真题②(2015-2016,10 分)· 由分布函数定常数(指数分布)
设 X 的分布函数 F(x) = A + Be−λx(x>0),0(x≤0),λ>0 为常数。(1) 求 A、B;(2) 求 P{|X|<1};(3) 求密度 f(x)。
(1) 用两条性质定常数:
- F(+∞)=1:x→+∞ 时 e−λx→0,故 A=1;
- 右连续(在 x=0 处衔接 0):F(0+)=A+B=0,故 B=−1。
所以 F(x)=1−e−λx(x>0)——这正是指数分布的分布函数。
(2) P{|X|<1}=P{−1<X<1}=F(1)−F(−1)=(1−e−λ) − 0 = 1−e−λ。
(3) 求导得密度:f(x)=F′(x)=λe−λx(x>0),0(x≤0)。
选择题即时练
M3 随机变量函数的分布
★★★★ 每套约 1 道,稳定送分题。已知 X 的分布,求 Y=g(X) 的分布(密度)。首选"分布函数法",一招通杀。
知识点讲解
分布函数法(万能,建议只记这一种)
求 Y=g(X) 的密度 fY(y),三步:
- 写 Y 的分布函数:FY(y)=P{Y≤y}=P{g(X)≤y},把不等式 g(X)≤y 解成 X 的范围。
- 化成 X 的分布函数 / 积分:用已知的 fX 或 FX 表示出来。
- 求导:fY(y)=FY′(y)。别忘了写 y 的取值范围,范围外为 0。
关键动作是确定 y 的有效范围:先看 X 的取值范围经过 y=g(x) 映射后,y 能取到哪些值。
公式法(g 单调时可用,作为加速)
若 y=g(x) 单调、有反函数 x=h(y),则 fY(y)=fX(h(y))·|h′(y)|。不单调(如 Y=X²)就老老实实用分布函数法。
真题精练
真题①(2014-2015,10 分)· Y=X²(不单调,必用分布函数法)
X 的密度 f(x)=e−x(x>0),0(其它),求 Y=X² 的密度。
因为 X>0,所以 Y=X²>0,且在 X>0 上 y=x² 单调增、反函数 x=√y。
分布函数法: 当 y>0,
求导(对 y):
y≤0 时 fY(y)=0。
真题②(2011-2012,10 分)· Y=e^X(X 均匀,单调可用公式法)
X ~ U(0,1),即 fX(x)=1(0<x<1)。求 Y=eX 的密度。
X∈(0,1) ⟹ Y=eX∈(1, e)。y=ex 单调增,反函数 x=ln y,h′(y)=1/y。
范围外为 0。
真题里 Y=g(X) 出现过 X²、√X、X³、∛X、e^X、sinX、lnX、2X+4 等。方法都一样:分布函数法三步,单调时才偷懒用公式法。
选择题即时练
M4 多维随机变量
★★★★★ 全卷最高产,每套 1–3 道大题。核心套路:求常数 → 边缘分布 → 独立性判断 → E(XY);以及 Z=X+Y 的分布、max/min 的分布。这是拉开分数的关键模块,务必练熟。
知识点讲解
1. 联合分布与边缘分布
离散型:联合分布律 P{X=xi, Y=yj}=pij,列成表。边缘分布 = 把表按行/按列求和:
- X 的边缘:P{X=xi} = Σj pij(该行所有数相加);
- Y 的边缘:P{Y=yj} = Σi pij(该列所有数相加)。
连续型:联合密度 f(x,y),边缘密度 = 对另一个变量积分掉:
⚠️ 积分时要根据 f 的非零区域确定 y(或 x)的积分上下限——这是最容易错的地方。
2. 独立性判断(必考)
X、Y 独立 ⟺ 联合 = 边缘相乘:
- 离散:对所有 i,j 都有 pij = P{X=xi}·P{Y=yj};
- 连续:f(x,y) = fX(x)·fY(y) 对几乎所有 (x,y) 成立。
判不独立的快捷办法:只要找到一个 (i,j) 使 pij ≠ P{X=xi}P{Y=yj},就立刻断定不独立(比如某个联合概率是 0,但两个边缘都不为 0)。连续型若非零区域不是矩形(如 0<y<x),通常不独立。
3. E(XY) 与期望
X、Y 独立时 E(XY)=E(X)E(Y)(反之不一定)。
4. Z = X + Y 的分布(卷积)
X、Y 独立时,Z=X+Y 的密度用卷积公式:
实操要点:确定被积函数同时非零的 x 范围(fX(x)≠0 且 fY(z−x)≠0),按 z 分段。二维均匀分布则直接在区域上积分更快。
5. max / min 的分布
X、Y 独立,分布函数分别 FX、FY:
- M=max{X,Y}:FM(z)=FX(z)·FY(z)(两个都 ≤ z)。
- N=min{X,Y}:FN(z)=1−[1−FX(z)]·[1−FY(z)](用对立,两个都 > z 的补)。
- 同分布时:Fmax(z)=[F(z)]²,Fmin(z)=1−[1−F(z)]²。
- 常考结论:独立指数分布的 min 仍是指数分布(参数相加)。
6. 重要事实
两个独立正态之和仍是正态:X~N(μ1,σ1²)、Y~N(μ2,σ2²) 独立 ⟹ X+Y ~ N(μ1+μ2, σ1²+σ2²)。独立泊松之和仍泊松(参数相加)。
真题精练
真题①(2022-2023,10 分)· 二维连续型综合(求边缘+独立+期望)
二维连续型 (X,Y) 联合密度 f(x,y)=8xy(0<y<x<1),0(其它)。求:(1) X、Y 的边缘密度;(2) 判断独立性并说明理由;(3) E(X)。
先看清积分区域:0<y<x<1,是单位正方形里 y<x 的那个三角形(不是矩形!这一点决定了不独立)。
(1) 边缘密度。
fX(x):固定 x(0<x<1),y 从 0 到 x 积分:
fY(y):固定 y(0<y<1),x 从 y 到 1 积分:
(2) 独立性。 算乘积 fX(x)·fY(y)=4x³·4y(1−y²)=16x³y(1−y²),显然 ≠ 8xy=f(x,y)。所以 X、Y 不独立。(本质原因:非零区域是三角形 0<y<x,不是矩形,X 的范围依赖 Y。)
(3) E(X)。 用边缘密度算:
真题②(2018-2019,10 分)· 二维连续(含可分离=独立的对照)
(X,Y) 联合密度 f(x,y)=Ce−(3x+y)(x>0,y>0),0(其它)。求:(1) C;(2) 边缘密度;(3) 是否独立。
(1) 归一化:∬f=C·∫0∞e−3xdx·∫0∞e−ydy=C·(1/3)·1=1 ⟹ C=3。
(2) fX(x)=∫0∞3e−3xe−ydy=3e−3x(x>0);fY(y)=∫0∞3e−3xe−ydx=e−y(y>0)。
(3) fX(x)·fY(y)=3e−3x·e−y=3e−(3x+y)=f(x,y),相等,所以独立。
对照真题①和②:①区域是三角形 → 不独立;②区域是矩形(整个第一象限)且密度能拆成"只含 x 的×只含 y 的" → 独立。判独立先看区域形状,再看能否分离变量。
真题③(2018-2019,10 分)· Z=X+Y 卷积
X ~ U(0,1),Y 与 X 独立且服从参数 1 的指数分布,求 Z=X+Y 的密度。
fX(x)=1(0<x<1),fY(y)=e−y(y>0)。卷积 fZ(z)=∫fX(x)fY(z−x)dx,要求 0<x<1 且 z−x>0(即 x<z)。
- z<0:fZ(z)=0;
- 0≤z<1:x 从 0 到 z,fZ(z)=∫0ze−(z−x)dx=1−e−z;
- z≥1:x 从 0 到 1,fZ(z)=∫01e−(z−x)dx=e1−z−e−z。
卷积题的难点全在分段确定积分限,画一下 x 的可行区间 [max(0,?), min(1,z)] 就清楚了。
选择题即时练
M5 数字特征(期望·方差·协方差·相关系数)
★★★ 常作为 M4 大题的子问,也是选择填空的常客。重点是 D(aX±bY) 的展开、协方差与相关系数。
知识点讲解
1. 期望与方差的公式
- 期望:离散 E(X)=Σxkpk;连续 E(X)=∫x f(x)dx。
- 函数期望(不用先求 Y 的分布):E(g(X))=Σg(xk)pk 或 ∫g(x)f(x)dx。
- 方差: D(X) = E(X2) − [E(X)]2 这是算方差的主力公式。
- 线性:E(aX+b)=aE(X)+b;D(aX+b)=a²D(X)(常数 b 不影响方差)。
2. 协方差与相关系数
- 协方差:Cov(X,Y)=E(XY)−E(X)E(Y)。
- 方差和公式: D(X±Y) = D(X) + D(Y) ± 2Cov(X,Y)
- X、Y 独立或不相关时:D(X±Y)=D(X)+D(Y),且 Cov=0。
- 相关系数: ρXY = Cov(X,Y) / √(D(X)D(Y)) 满足 |ρ|≤1。
- ρ=±1 ⟺ X、Y 几乎线性相关;ρ=0 称不相关。
- 独立 ⟹ 不相关(ρ=0);但不相关 ⇏ 独立。
3. 反求协方差的常用变形
由 D(X+Y) 和 D(X−Y) 反求 Cov:两式相减得
真题精练
真题①(2017-2018 填空)· 由 D(X±Y) 反求协方差
已知 D(X+Y)=36,D(X−Y)=24,求 Cov(X,Y)。
真题②(2022-2023 选择)· 相关系数
D(X)=9,D(Y)=16,D(X+Y)=49,求相关系数 ρXY。
先求 Cov:D(X+Y)=D(X)+D(Y)+2Cov ⟹ 49=9+16+2Cov ⟹ Cov=12。
ρ=1,说明 X、Y 完全正线性相关。
选择题即时练
M6 大数定律与中心极限定理
★★ 几乎只出现在选择/填空。会用切比雪夫不等式估概率、会用中心极限定理做正态近似即可。
知识点讲解
1. 切比雪夫不等式(估概率上下界)
对任意随机变量 X(期望 μ、方差 σ²)和任意 ε>0:
用途:不知道具体分布,只知道期望和方差,估算"偏离均值"的概率界。
2. 中心极限定理(CLT)
n 个独立同分布随机变量之和(或均值),当 n 较大时近似服从正态分布:
用法:把和标准化成 (ΣXi − nμ)/√(nσ²),再查 Φ 表。棣莫弗-拉普拉斯定理是其特例:二项 B(n,p) 当 n 大时近似 N(np, np(1−p))。
真题套路:给"n 个独立同分布、均值方差已知",问"和落在某范围的概率",标准化后用 Φ。若是泊松/二项的大量求和,常出现"恰好对称 → 概率 ≈ 0.5"的巧解。
真题精练
真题(2022-2023 选择)· 中心极限定理
X1,…,X100 独立且均服从参数为 2 的泊松分布,由中心极限定理求 P{Σi=1100 Xi < 200}。
泊松(2):μ=2、σ²=2。和的均值 nμ=100×2=200,方差 nσ²=200。标准化后阈值 200 恰好等于均值:
巧点:阈值=均值时,正态对称,概率直接是 0.5,不用查表。
选择题即时练
M7 数理统计基本概念(抽样分布)
★★ 选择填空为主。重点是辨认统计量服从 χ²、t、还是 F 分布。
知识点讲解
1. 总体、样本、统计量
- 总体:研究对象全体;样本 X1…Xn:独立同总体分布;统计量:样本的函数(不含未知参数),如 X̄、S²。
- 样本均值 X̄=(1/n)ΣXi;样本方差 S²=[1/(n−1)]Σ(Xi−X̄)²(分母 n−1)。
2. 三大抽样分布(设 Xi 独立同 N(0,1))
- χ²(n) 卡方分布:n 个独立标准正态的平方和 ΣXi² ~ χ²(n)。E=n,D=2n。
- t(n) 分布:标准正态 ÷ √(独立卡方/自由度),即 t = X / √(χ²(n)/n) ~ t(n)。形似正态但尾巴更厚。
- F(n1,n2) 分布:两个独立卡方各除以自由度再相除,F=(χ²1/n1)/(χ²2/n2)。
3. 正态总体的三个标准结论(检验的基础)
辨认口诀:纯平方和 → χ²;正态比根号下卡方 → t;两卡方相比 → F。看见自由度怎么搭,就能对上号。
选择题即时练
M8 参数估计
★★★★★ 每套必有 1 道大题,几乎全是极大似然估计(MLE)。这是全卷"模板化最强"的题——背熟五步,任何分布都能套。选择填空另考矩估计、无偏性/有效性、区间估计。
知识点讲解
1. 极大似然估计(MLE)五步模板 ⭐
给一个含未知参数 θ 的分布(密度 f(x;θ) 或分布律 p(x;θ)),样本 x1…xn,求 θ 的极大似然估计:
- 写似然函数(各样本概率连乘): L(θ) = ∏i=1n f(xi; θ)
- 取对数(把连乘变成连加,好求导):ln L(θ) = Σ ln f(xi;θ)。
- 对 θ 求导,令导数为 0:d(ln L)/dθ = 0,得"似然方程"。
- 解方程得 θ̂。
- 写成估计量(把 xi 换成大写 Xi),需要时代入数据算估计值。
2. 三个必会的 MLE 结果(直接记结论,考场上能省时间)
| 总体分布 | 似然方程要点 | 极大似然估计 |
|---|---|---|
| 指数分布 f=λe−λx | ln L=n lnλ−λΣxi,导数 n/λ−Σxi=0 | λ̂ = n/Σxi = 1/X̄ |
| 泊松分布 P(λ) | ln L=−nλ+(Σxi)lnλ−…,导数 −n+Σxi/λ=0 | λ̂ = X̄ |
| 正态 N(μ,σ²) μ未知 | 对 μ 求导 Σ(xi−μ)=0 | μ̂ = X̄ |
规律:指数分布估的是 1/X̄,泊松和正态均值估的都是 X̄。本校真题这三类占绝大多数。
3. 矩估计(选择填空常考)
用样本矩代替总体矩:令 E(X)=X̄(一阶矩),解出参数。例:
- 泊松 E(X)=λ ⟹ 矩估计 λ̂=X̄;
- 均匀 U(0,θ):E(X)=θ/2 ⟹ θ̂=2X̄。
4. 估计量的评价
- 无偏性:E(θ̂)=θ(估计没有系统偏差)。样本均值 X̄ 是 μ 的无偏估计;S²(分母 n−1)是 σ² 的无偏估计。
- 有效性:两个都无偏时,方差更小的更有效。形如 θ̂=c1X1+c2X2+c3X3,无偏要求 c1+c2+c3=1,最有效在 c1=c2=c3=1/3(系数均等时方差最小)。
5. 区间估计(正态均值,σ² 已知)
μ 的置信度 1−α 的置信区间:
置信度 0.95 时 u0.025=1.96,置信度 0.99 时 u0.005=2.575。
真题精练
真题①(2022-2023,10 分)· 指数分布 MLE(带数值)
某款手机寿命 X 服从参数 λ 的指数分布,对 5 部手机跟踪得寿命(年):3, 1, 2, 3, 1。求 λ 的极大似然估计值。
第 1 步 似然函数(f(x;λ)=λe−λx,x>0):
第 2 步 取对数:ln L = n ln λ − λ Σxi。
第 3 步 求导令零:
第 4 步 解出:λ̂ = n / Σxi = 1/X̄。
第 5 步 代数据:n=5,Σxi=3+1+2+3+1=10,所以
真题②(2018-2019,10 分)· 泊松分布 MLE
X1,…,Xn 取自总体 X ~ P(λ)(泊松),求 λ 的极大似然估计量。
分布律 P{X=k}=λke−λ/k!。
取对数:ln L = (Σxi) ln λ − nλ − ln(∏xi!)。求导令零:Σxi/λ − n = 0 ⟹ λ̂ = X̄。
两题对照:指数 → 1/X̄,泊松 → X̄。流程一字不差,区别只在 f 的形式。考场上把五步写全就有过程分。
选择题即时练
M9 假设检验
★★★★★ 每套必有 1 道大题,单正态总体居多。和 MLE 一样是"填空式"模板题——把 H0、统计量、拒绝域、结论四样写全就有分。
知识点讲解
1. 检验四步模板 ⭐
- 提假设:原假设 H0:μ=μ0(要检验的等式),备择 H1:μ≠μ0(双边)。
- 选统计量(看总体方差是否已知):
- σ² 已知 → U 检验:U=(X̄−μ0)/(σ/√n) ~ N(0,1);
- σ² 未知 → t 检验:t=(X̄−μ0)/(S/√n) ~ t(n−1);
- 检验方差 → χ² 检验:χ²=(n−1)S²/σ0² ~ χ²(n−1)。
- 定拒绝域(双边,显著性水平 α):
- U 检验:|U| > uα/2(如 α=0.05 时 1.96);
- t 检验:|t| > tα/2(n−1);
- χ² 检验:χ² > χ²α/2(n−1) 或 χ² < χ²1−α/2(n−1)。
- 算统计量值,下结论:落入拒绝域 → 拒绝 H0;否则接受 H0。
怎么选统计量?一句话:测均值看 σ² 知不知道(知道用 U、不知道用 t),测方差用 χ²。
2. 两类错误(选择填空必考)
- 第一类错误(弃真):H0 本来是真的,却拒绝了它,犯错概率 = α。
- 第二类错误(取伪):H0 本来是假的,却接受了它。
- 记忆:"取伪"是第二类错误(这是真题反复考的填空)。
真题精练
真题①(2022-2023,10 分)· σ² 已知,U 检验
ChatGPT 生成的文章单词长度 X ~ N(μ,1),收集 100 个单词,平均长度 5.8,在 α=0.05 下,"平均长度为 6"是否成立?
第 1 步 提假设:H0:μ=6,H1:μ≠6。
第 2 步 选统计量:σ²=1 已知 → U 检验。
第 3 步 拒绝域:α=0.05,|U| > u0.025=1.96。
第 4 步 结论:|U|=2 > 1.96,落入拒绝域,拒绝 H0,即"平均长度为 6"不成立。
真题②(2010-2011,10 分)· σ² 未知,t 检验
铁水含碳量 X ~ N(μ,σ²),σ² 未知,测 9 炉得 x̄=4.49,S=0.0676,问能否认为均值 μ=4.53?(α=0.05,t0.025(8)=2.3060)
提假设:H0:μ=4.53,H1:μ≠4.53。
选统计量(σ² 未知 → t 检验):
拒绝域:|t| > t0.025(8)=2.3060。
结论:|t|=1.775 < 2.3060,未落入拒绝域,接受 H0,可认为含碳量均值为 4.53。
真题里 σ² 未知的 t 检验最多(奶粉、食盐、钢丝、水泥、铁水…),近年情境题转向 σ² 已知的 U 检验(早稻、节目时长、潜伏期、单词长度)。判断用 t 还是 U,就看题里 σ²/标准差给没给"总体的"。
选择题即时练
考前冲刺 · 混合自测
把九个模块混在一起练,模拟考场上"先认题型、再调套路"的过程。每题点一下看解析。
结语 · 考前最后叮嘱
- 大题按母题套模板:看到"几个原因导致某结果"就是全概率+贝叶斯;看到含参数的密度+样本就是极大似然;看到"是否等于某值/α"就是假设检验。先认型,再套步骤。
- 送分题别丢:一维密度三连问、Y=g(X) 函数分布、二维边缘+独立性,这些步骤固定,把过程写全。
- 选择填空抓公式:D(aX±bY) 系数要平方、相关系数公式、抽样分布辨认、两类错误,这些背熟就是稳拿分。
- 算不动就先写框架:哪怕积分算错,把"似然函数→取对数→求导=0"或"H0→统计量→拒绝域→结论"的骨架写全,过程分照拿。
- 任何一步卡住,点右下角 💬 问 DeepSeek 答疑助手——它会用公式和表格给你讲清楚。
这份资料的所有题目和套路都来自 2004–2023 的 18 套真题。把每个模块的"真题精练"亲手重写一遍,比看十遍都管用。祝考试顺利!