北京大学应用统计历年真题(14—18)


北京大学应用统计历年真题(14—18)

2018年真题

一、有 4 份古卷放在书架上,请问第 1 卷与第 2 卷相邻的概率为多少?(8 分)

二、甲、乙独立地向同一目标射击,甲命中的概率是 0.6,乙命中的概率是 0.8. 请问在已知目标被命中的情况下,是乙命中的概率。(8 分)

三、甲袋中装有 2 个白球和 1 个黑球,乙袋中装有 2 个黑球和 1 个白球。 现在随机地先从甲袋中取出一球放入乙袋中,再从乙袋中取出 1 球,请问 第二次从乙袋中取出黑球的概率是多少?(12 分)

四、目前有 n 把外观相似的钥匙用于开一扇上锁的门,n 把钥匙中只有一把 能打开。随机从 n 把钥匙中取出一把用于开锁,如果不能开锁就将其放回, 重新抽取。请问成功开锁所需要的取钥匙次数的期望为多少?(12 分)

五、随机变量 X 的密度函数如下:(12 分)

$$f(x)\quad =\quad \begin{cases} cx(1-x),\quad 0<x<1 \ 0,\quad others \end{cases}$$

1) 求常数$c$的值;
2)求$X$与$\sqrt{X}$的相关系数。

六、设随机变量 X 的密度函数为:(12 分)
$$f(x)\quad =\quad \begin{cases} 2{ \theta }^{ 2 }{ x }^{ -3 },\quad x≥\theta \ 0,\quad x\le \theta \end{cases}$$

求$\theta$的矩估计和极大似然估计。

七、设随机变量 X 服从 $[0, θ]$ 上的均匀分布:(15 分)

1) 求 $θ $的极大似然估计。
2) 构造均匀分布的 $1 − α$ 优良置信区间。

八、设随机变量服从 $N (μ, 1)$,其 $1 − α$ 置信区间的长度为 $L$,求数学期望 $E(L^2)$. (15 分)

九、设随机变量序列 $X_0, X_1, …X_n$ 服从几何分布,即:
$$P(X_i = k) = (1 − p)^{k−1}p, k = 1,2,3…$$

求 $∑^{X_0}_{i=1}{X_i}$ 与 $∑^{X_0}{i=1} X{0+i}$ 的协方差。(15 分)

十、设随机变量$X$服从 $[θ−ρ,θ+ρ]$ 上的均匀分布,试求$θ$ 和 $ρ$ 的极大似然估计,并说明其极大似然估计是否为无偏估计,并证明你的结论。(15 分)

十一、叙述中心极限定理,并利用中心极限定理证明:(15 分)
$$\sum _{ i=0 }^{ [n\lambda ] }{ \frac { { \lambda }^{ k } }{ k! } { e }^{ -\lambda }=\frac { 1 }{ 2 } } $$

十二、设 $ε_i ∼ N(0, σ^2)$,其中 $σ$ 未知。有下面的方程组:(15 分)

(第三个和第四个方程的系数不太确定)

1) 求 $θ_1$,$θ_2$ 和 $θ_3$ 的无偏估计;
2) 求 $θ_1$ 的优良置信区间。

2017年真题

一、X服从${-1, 0, 1}$上的均匀分布,$Y$服从$U[0, 1]$,$X$与$Y$相互独立,求$Z = X+Y$的密度函数(15分)

二、$(X, Y)$服从区域$D = { (x, y) | 0 < x < 1, 0 < y < x}$上的均匀分布,求$X,Y$的相关系数(15分)

三、长为1的木棒截取一截,再将剩下的部分截为两段,求这三段木棒能构成三角形的概率 (15分)

四、$(x_i,y_i)$满足$y_i = a + bx_i +ε_i$,其中$ε_i ~ N(0, σ²)$,各$ε_i$独立同分布,其中$a,b, σ²$均未知,现观测到一组新数据$X_0$,计算$y_0$的95%的置信区间 (15分)

八、$X~N(μ,4)$,$X_1,X_2,,,X_n$为样本,求当$n$多大时,保证$μ$的95%置信区间长度不大于0.01?(若$X~N(0,1),P( |X|>1.96) = 0.05$) (10分)

九、$X_1,X_2,,,X_n$两两相关,且相关性相同,都为$ρ$,$X_i ~ N(μ ,σ²)$

(1)证明$\rho \ge \frac { 1 }{ \sigma -1 } $(5分)
(2)求$μ$的矩估计$\mho $ (3分)
(3)讨论 $\mho $的相合性,无偏性 (7分)

十、一个人出生在任一月份的概率为1/12,现抽取100人,先从装有5个红球3个黑球的盒子中抽球。若抽中红球则回答:出生日是否在7月1日之前:若抽中黑球则回答:是否为同性恋。最后统计回答“是”的人数为35人,回答否的为65人。求人群的同性恋比例 (15分)

2016年真题

一、有10个球,其中7个黑球3个白球,进行不放回抽取两次
(1)第二次取到白球的概率 (7分)
(2)第二次取到白球的条件下,第一次取到黑球的概率 (8分)

二、二维随机变量$X,Y$在区域$D = { (x,y) | X²+Y² ≤ 1 }$ 上服从均匀分布
(1)求X和Y的分布 (7分)
(2)随机变量X与Y是否独立 (8分)

三、考查正态分布的置信区间,假设检验问题大意是对A、B的亩产进行比较。已知:
$A:X ~ N(μ_1,\sigma_1^2 ) , μ_1= 125, \sigma_1= 2$
$B:Y ~ N(μ_2, \sigma_2^2) , μ_1= 140, \sigma_2= 3$
(1)求$μ_1,μ_2$的95%的置信区间 (5分)
(2)假设检验A,B的亩产是否有显著性差异($H0: μ_1 = μ_2$)(5分)

四、多元线性回归 $Y = Xβ+e$ 的最大似然估计
(1)β和方差的最大似然估计 (8分)
(2)β的分布 (7分)
(3)$y_i = a+bx_i$,$i = 1,,,n$,求$a,b$的极大似然估计并证明$a,b$独立的充要条件是$Σx_i=0$ (10分)

五、
(1)陈述NP引理(7分)
(2)用NP引理推导UMP否定域,并求犯第二类错误的概率:
$H0:f(x) = N(0,1) H1: f(x) = N(2,1)$ (8分)

六、X服从指数分布$exp(1/θ),x_1,x_2,,x_n$为来自总体的样本
(1)求θ的极大似然估计【另一版:证明$S = Σx_i$ 是充分统计量】 (7分)
(2)求Fisher信息量$I(θ)$ (8分)
(3)求θ的无偏估计方差下界,是否存在无偏估计可以达到此下界 (10分)

七、假设$x_1,x_2,,,x_n$是独立同分布的,其的密度函数 $f(x) = 2cx$,x>0
(1)求c的极大似然估计Sn (7分)
(2)此极大似然估计Sn是否具有无偏性 (8分)
(3)此极大似然估计Sn是否是强相合估计 (10分)

八、$X_1,X_2,,,X_n$相互独立,$P(X_n = ) = 1/n$,$P(X = 0) = 1-1/n$,α为常数求,α为多少时
(1)$X_n$依概率收敛到0 (5分)
(2)$X_n$几乎处处收敛到0 (5分)

九、一元线性回归$Y_i = βX_i+ε_i$,其中$β$是$Σ+c|β|$的极小值点,c > 0
证明:$β = sgn ( Σx_iy_i/n ) ( |Σx_iy_i/n|+c/2 )$ (10分)

2015年真题

一、 袋子里有 3 个红球和 2 个黑球,进行摸球游戏。当摸到红球时,将红球放回,再往 里面放一个红球;若摸到黒球,游戏结束。求进行了三次摸球游戏的概率。

二、 开会信息通过三种方式传达,使用短信发送的概率为 0.3,使用邮件发送的概率为0.2,使用电话通知的概率为 0.5;使用短信成功送达的概率为 0.7,使用邮件成功 送达的概率为 0.6,使用电话通知成功送达的概率为 0.9。信息一旦成功送达则被 通知者将准时赴会,求:

(1)被通知者准时赴会的概率。
(2)若已知被通知者准时赴会,则求使用短信发送的概率。

三、 $X - N(a+by, 𝜎^2)$,$Y~N(u, 𝜎^2)$,求 X, Y 之间的相关系数。

四、 有五个灯泡,灯泡寿命服从指数分布 $Exp(0.02)$

(1)五个灯泡寿命都大于 500 的概率;
(2) 若存在至少一盏灯正常工作则机器正常工作,五个灯泡全都损坏则机器故障, 求机器寿命的期望。

五、 考查棣莫佛-拉普拉斯中心极限定理,题型很常规。

六、 $N(u-0.3, 𝜎2+0.7)$,求 $𝜇𝜎$ 的矩估计

七、 正态情形下的置信区间

八、 假设检验问题,很常规

九、 假设检验、P 值,题型常规

十、 证明一元线性回归$y = ax + b$ 的最小二乘估计和最大似然估计相同。

2014年真题

一、 一副扑克牌除去大王、小王一共 52 张,从中不放回地抽出两张。
(1)两张牌花色相同的概率
(2)在两张牌花色相同的条件下,两张牌的数字不及次序相邻的概率。

二、 一个地区每天下雨的概率是 0.1,当地气象台在第二天下雨时能准确预报的概率是 0.8,在第二天不下雨时能准确预报的概率是 0.7。求档气象台预报第二天下雨时, 真的下雨的概率。

三、已知$X-N(0,1)$, 求$Y=X^2$的分布密度函数。

四、 $X_1$ 与 $X_2$ 相互独立且服从于 $U(0,1)$,记$Y = min( X_1 , X_2)$
(1)求 $Y$ 的密度函数
(2)求 $E( Y )$ 和 $Var( Y )$

五、 在一次物理放射性实验中,每分钟放出粒子的概率是 0.5,记$X_1、X_2 ··· X_n$ 为第 i 分 钟的放射数,令 $Y_n = X_1 + X_2 +··· +X_n$
(1)求$E(Y_n )$和$Var(Y_n )$
(2)利用中心极限定理估计 $P( Y_{100}> 0.6n )$的概率

六、 考查矩估计、均方误差、最大似然估计,题型常规

七、 概念题:
(1)简述假设检验中第一类错误和第二类错误的含义
(2)在假设检验中接受$H_0$的结论可靠还是拒绝$H_0$的结论可靠?
(3)简述强相合估计和弱相合估计的含义。

八、 正态分布下的假设检验问题,很常规

九、假设$X_i$和$Y_i$满足一元线性关系$Y_i =a+bX_i$,请使用最小二乘方法估计a和b,并证明估计曲线过 $(0, a)$ 和 $(X, Y)$ 两点。

十、 单因素方差分析的推导:有 s 个水平$(u_1、u_2 ··· u_s)$ ,其中第 i 个水平做 $r_i$ 次试验,推导检验问题:
$$H_0:u_1 =u_2 =···=u_n$$的检验统计量和否定域。

分享到