Skip to content

Commit 76ccca1

Browse files
committed
Merge branch 'chapter-2'
2 parents 56ecb00 + 3821c55 commit 76ccca1

8 files changed

Lines changed: 274 additions & 1 deletion

File tree

.vscode/latex.code-snippets

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -32,5 +32,9 @@
3232
"\\end{itemize}",
3333
"$0"
3434
]
35+
},
36+
"Chi Sqare Distribution": {
37+
"prefix": "chisquare",
38+
"body": "$ \\chi^2 $ 分布"
3539
}
3640
}

Chapter-2.tex

Lines changed: 6 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,6 @@
1+
\chapter{数理统计的基本概念}
2+
3+
\input{Chapter-2/Section-2-1.tex}
4+
\input{Chapter-2/Section-2-2.tex}
5+
\input{Chapter-2/Section-2-3.tex}
6+
\input{Chapter-2/Section-2-4.tex}

Chapter-2/Section-2-1.tex

Lines changed: 64 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,64 @@
1+
\section{总体与样本}
2+
3+
\hparagraph{总体与个体} 研究对象的全体称为\highlight{总体},
4+
总体中所包含的个体的个数称为总体的\highlight{容量}。
5+
总体中每个成员称为\highlight{个体}。
6+
7+
\begin{itemize}[leftmargin=\paritemindent]
8+
\item 由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。
9+
从而可以把这种数量指标看作一个随机变量$ X $,因此随机变量$ X $的分布就是该数量指标在总体中的分布。
10+
\item 总体就可以用一个随机变量及其分布来描述。因此在理论上可以把总体与概率分布等同起来。
11+
统计中,总体这个概念的要旨是:总体就是一个随机变量(向量)或一个概率分布。
12+
\end{itemize}
13+
14+
\hparagraph{样本}
15+
总体中抽出若干个体而成的集体,称为\highlight{样本}。样本中所含个体的个数,称为\highlight{样本容量}。
16+
17+
\hparagraph{抽样} 统计中,采用的抽样方法是随机抽样法,即子样中每个个体是从总体中随意地取出来的。
18+
\hsubparagraph{抽样的分类}
19+
\begin{itemize}[leftmargin=\subparitemindent]
20+
\item \highlight{重复(返回)抽样}:从总体中抽取个体检查后放回,总体成分不变(分布不变)。
21+
样本 $ X_1, X_2, \cdots, X_n $ 相互独立,与总体有相同的分布。
22+
\item \highlight{非重复(无返回)抽样}:对有限总体取出样本后改变了总体的成分,所以 $ X_1, X_2, \cdots, X_n $ 不相互独立;
23+
对无限总体而言做无返回抽取,并不改变总体的成分, $ X_1, X_2, \cdots, X_n $ 相互独立,与总体有相同的分布。
24+
\end{itemize}
25+
26+
\hsubparagraph{常用方法} 简单随机抽样。
27+
\begin{itemize}[leftmargin=\subparitemindent]
28+
\item 代表性(随机性):。 从总体中抽取样本的每一个分量$ X_k $是随机的,每一个个体被抽到的可能性相同。
29+
\item 独立同分布性: $ X_1, X_2, \cdots, X_n $ 相互独立,其中每一个分量$ X_k $与所考察的总体有相同的分布。
30+
\end{itemize}
31+
32+
\hsubparagraph{样本联合分布} 若总体的分布函数为 $ F(x) $ 、概率密度为 $ f(x) $ ,则其简单随机样本的联合分布函数为
33+
\begin{equation}
34+
F_{X_1, X_2, \cdots, X_n}(x_1, x_2, \cdots, x_n) = F(1) F(2) \cdots F(n)
35+
\end{equation}
36+
其简单随机样本的联合概率密度函数为
37+
\begin{equation}
38+
f_{X_1, X_2, \cdots, X_n}(x_1, x_2, \cdots, x_n) = f(1) f(2) \cdots f(n)
39+
\end{equation}
40+
41+
\hparagraph{样本经验分布函数} 在 $ n $ 次独立重复实验中,事件 $ \left\{ X \leqslant x \right\} $ 发生的频率
42+
\begin{equation}
43+
\hat{F}_n(x;X_1, X_2, \cdots, X_n) = \frac{1}{n} \sum_{i=1}^{n} I(X_i \leqslant x)
44+
\end{equation}
45+
具有分布函数的一切性质。是在每个数据点 $ X_i $ 上权重相等的均匀分布的分布函数。
46+
47+
\hsubparagraph{性质}
48+
\begin{itemize}[leftmargin=\subparitemindent]
49+
\item 给定 $ x $$ \hat{F}_n(x) $ 是一个随机变量: $ n\hat{F}_n(x) $ 服从二项分布 $ b(n, F(x)) $
50+
\item $ E(\hat{F}_n(x)) = F(x) $
51+
\item $ D(\hat{F}_n(x)) = \frac{F(x)(1-F(x))}{n} \rightarrow 0 $
52+
\item $ \hat{F}_n(x) \xrightarrow{P} F(x) $
53+
\item Dvoretzky-Kiefer-Wolfowitz (DKW)不等式:如果 $ X_1, X_2, \cdots, X_n \sim F $ ,则对任意 $ \epsilon > 0 $
54+
\begin{equation}
55+
P\left\{ \sup_x \left| \hat{F}_n(x)) - F(x) \right| > \epsilon \right\} \leqslant 2e^{-2n\epsilon^2}
56+
\end{equation}
57+
\end{itemize}
58+
59+
\hsubparagraph{格列汶科定理} 当 $ n \rightarrow \infty $ 时, $ \hat{F}_n(x) $ 以概率 $ 1 $ 关于 $ x $ 一致收敛于 $ F(x) $
60+
61+
\begin{equation}
62+
P\left\{ \lim_{n\rightarrow\infty} \sup_{-\infty<x<\infty} \left| \hat{F}_n(x) - F(x) \right| = 0 \right\} = 1
63+
\end{equation}
64+
当样本容量 $ n $ 足够大时,对所有的 $ x $, $ \hat{F}_n(x) $$ F(x) $ 之差的绝对值都很小,这件事发生的概率为 $ 1 $

Chapter-2/Section-2-2.tex

Lines changed: 59 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,59 @@
1+
\section{统计量}
2+
3+
\hparagraph{统计量} 不含任何未知参数的样本的函数称为统计量。它是完全由样本决定的量。
4+
\begin{itemize}[leftmargin=\paritemindent]
5+
\item 统计量是随机变量
6+
\item$ X_1, X_2, \cdots, X_n $ 是来自总体$ X $ 的一个样本, $ x_1, x_2, \cdots, x_n $ 是一个样本的观察值,
7+
$ g(x_1, x_2, \cdots, x_n) $ 也是统计量 $ g(X_1, X_2, \cdots, X_n) $ 的观察值。
8+
\end{itemize}
9+
10+
\hparagraph{常见统计量}
11+
\begin{itemize}[leftmargin=\paritemindent]
12+
\item \highlight{样本均值}:
13+
$$ \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i $$
14+
\item \highlight{样本方差}:
15+
$$ S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2 = \frac{1}{n} \left( \sum_{i=1}^{n} X_i^2 - n\bar{X}^2 \right) $$
16+
\item \highlight{样本标准差}:
17+
$$ S = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2} $$
18+
\item \highlight{样本 $ k $ 阶原点矩}:
19+
$$ A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k $$
20+
\item \highlight{样本 $ k $ 阶中心矩}:
21+
$$ B_k = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k $$
22+
\item \highlight{顺序统计量}:设 $ (x_1, x_2, \cdots, x_n) $ 为样本 $ (X_1, X_2, \cdots, X_n) $ 的一个观察值,
23+
$ x_{(1)} \leqslant x_{(2)} \leqslant \cdots \leqslant x_{(n)} $ 。当 $ (X_1, X_2, \cdots, X_n) $ 取值为
24+
$ (x_1, x_2, \cdots, x_n) $ 时,定义随机变量 $ X_{(k)} = x_{(k)} $ 则称统计量 $ (X_{(1)}, X_{(2)}, \cdots, X_{(n)}) $
25+
为顺序统计量。
26+
\item \highlight{极差}:
27+
$$ D_n = X_{(n)} - X_{(1)} $$
28+
\end{itemize}
29+
30+
\hparagraph{常见统计量的性质}
31+
\begin{itemize}[leftmargin=\paritemindent]
32+
\item $ E(\bar{X}) = E(X) = \mu $
33+
\item $ D(\bar{X}) = \frac{D(X)}{n} = \frac{\sigma^2}{n} $
34+
\item $ E(S^2) = D(X) = \sigma^2 $
35+
\item 若总体 $ k $ 阶矩 $ E(X^k) = \mu_k $ 存在,则当 $ n \rightarrow \infty $ 时,
36+
\begin{equation}
37+
A_k = \frac{1}{n} \sum_{i=1}^{n} X_i^k \xrightarrow{P} \mu_k
38+
\end{equation}
39+
推广
40+
\begin{equation}
41+
g(A_1, A_2, \cdots, A_n) \xrightarrow{P} g(\mu_1, \mu_2, \cdots, \mu_n)
42+
\end{equation}
43+
\end{itemize}
44+
45+
\hparagraph{统计量的分布} 设总体分布的特征函数为 $ \phi_X(t) $ ,则 $ \bar{X} $ 的特征函数是
46+
\begin{equation}
47+
\phi_{\bar{X}}(t) = \left(\phi_X\left(\frac{t}{n}\right)\right)^n
48+
\end{equation}
49+
\begin{itemize}[leftmargin=\paritemindent]
50+
\item 正态分布: $ \bar{X} \sim N(\mu, \sigma^2 / n) $
51+
$$ \phi_{\bar{X}}(t) = e^{\symrm{i}\mu t - \frac{1}{2} \frac{\sigma^2}{n} t^2} $$
52+
\item 泊松分布:
53+
$$ \phi_{\bar{X}}(t) = \exp \left( n\lambda \left(e^{\symrm{i}t/n} - 1\right) \right) $$
54+
\item 指数分布: $ \bar{X} \sim \Gamma \left(n-1, \frac{1}{n\lambda}\right) $
55+
$$ \phi_{\bar{X}}(t) = \left( 1 - \frac{\symrm{i}t}{n\lambda} \right) $$
56+
\item 二项分布:
57+
$$ \phi_{\bar{X}}(t) = \left( p e^{\symrm{i}t/n} + q \right)^{Nn} $$
58+
\end{itemize}
59+

Chapter-2/Section-2-3.tex

Lines changed: 85 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,85 @@
1+
\section{三大统计抽样分布}
2+
3+
\hparagraph{$ \chi^2 $分布} 设 $ X_1, X_2, \cdots, X_n $ 互相独立,都服从正态分布 $ N(0,1) $ 则称随机变量
4+
\begin{equation}
5+
\chi^2 = X_{1}^2, X_{2}^2, \cdots, X_{n}^2
6+
\end{equation}
7+
所服从的分布为自由度为 $ n $$ \chi^2 $ 分布。
8+
9+
\hsubparagraph{密度函数} $ \chi^2 $ 分布的密度函数为
10+
\begin{equation}
11+
f(x;n) = \left\{ \begin{array}{ll}
12+
\ddfrac{1}{2^{\frac{n}{2}} \Gamma(n/2)} x^{\frac{n}{2} - 1} e^{-\frac{x}{2}} & x \geqslant 0 \\
13+
0 & x < 0
14+
\end{array} \right.
15+
\end{equation}
16+
17+
\hsubparagraph{期望和方差} $ E(X) = n, D(X) = 2n $
18+
19+
\hsubparagraph{性质}
20+
\begin{itemize}[leftmargin=\subparitemindent]
21+
\item$ X_1, X_2, \cdots, X_n $ 互相独立,都服从正态分布 $ N(0,1) $
22+
\begin{equation}
23+
\chi^2 = \frac{1}{\sigma^2} \sum_{i=1}^{n}(X_i - \mu)^2 \sim \chi^2(n)
24+
\end{equation}
25+
\item \highlight{可加性}: 设 $ X_1 \sim \chi^2(n_1), X_2 \sim \chi^2(n_2) $$ X_1, X_2 $ 互相独立,则
26+
\begin{equation}
27+
X_1 + X_2 \sim \chi^2(n_1 + n_2)
28+
\end{equation}
29+
\item$ \chi^2 \sim \chi^2(n) $ 则当 $ n $ 充分大时, $ \frac{X-n}{\sqrt{2n}} $ 的分布近似正态分布 $ N(0,1) $
30+
\end{itemize}
31+
32+
\hsubparagraph{上分位点} 对于给定的正数 $ \alpha(0 < \alpha < 1) $ 称满足条件
33+
\begin{equation}
34+
P\left\{ \chi^2 > \chi^2_\alpha(n) \right\} = \int_{\chi^2_\alpha(n)}^{\infty} f(y) \diff y = \alpha
35+
\end{equation}
36+
的点 $ \chi^2_\alpha(n) $ 称为 $ \chi^2(n) $ 分布的上 $ \alpha $ 分位点。
37+
38+
\hparagraph{$ t $分布} 设 $ X \sim N(0,1),Y \sim \chi^2(n) $$ X $$ Y $ 相互独立,则称变量
39+
\begin{equation}
40+
T = \frac{X}{\sqrt{\ddfrac{Y}{n}}}
41+
\end{equation}
42+
所服从的分布为自由度为 $ n $$ t $ 分布,记为 $ T \sim t(n) $
43+
44+
\hsubparagraph{密度函数} $ t $ 分布的密度函数为
45+
\begin{equation}
46+
h(t) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\Gamma\left(\frac{n}{2}\right)} \left(1 + \frac{t^2}{n}\right)^{-\frac{n+1}{2}}
47+
\quad -\infty < t < \infty
48+
\end{equation}
49+
50+
\hsubparagraph{期望和方差} $ E(t) = 0, D(t) = \frac{n}{n-2} $
51+
52+
\hsubparagraph{性质}
53+
\begin{itemize}[leftmargin=\subparitemindent]
54+
\item 密度函数关于 $ t=0 $ 对称,当 $ n $ 充分大时,其图形近似于标准正态分布概率密度的图形。且
55+
\begin{equation}
56+
\lim_{n \rightarrow \infty} h(t) = \frac{1}{2\pi} e^{-\frac{t^2}{2}}
57+
\end{equation}
58+
即当 $ n $ 足够大时, $ T \sim N(0,1) $
59+
\end{itemize}
60+
61+
\hparagraph{$ F $分布} 设 $ X \sim \chi^2(n_1), Y \sim \chi^2(n_2) $$ X,Y $ 独立,则称统计量
62+
\begin{equation}
63+
F = \frac{X/n_1}{Y/n-2}
64+
\end{equation}
65+
服从自由度为 $ n_1,n_2 $$ F $ 分布, $ n_1 $ 为第一自由度, $ n_2 $ 为第二自由度,记为 $ F \sim F(n_1,n_2) $
66+
67+
\hsubparagraph{密度函数} $ F $ 分布的密度函数为
68+
\begin{equation}
69+
f(y) = \left\{ \begin{array}{ll}
70+
\ddfrac{\Gamma\left(\ddfrac{n_1+n_2}{2}\right)}{\Gamma\left(\ddfrac{n_1}{2}\right)\Gamma\left(\ddfrac{n_2}{2}\right)}
71+
\left(\frac{n_1}{n_2}\right) ^{\frac{n_1}{2}}(y)^{\frac{n_1}{2} - 1}
72+
\left( 1 + \frac{n_1}{n_2}y \right)^{-\frac{n_1+n_2}{2}} & y > 0 \\
73+
0 & y \leqslant 0
74+
\end{array} \right.
75+
\end{equation}
76+
77+
\hsubparagraph{期望和方差} $ E(t) = \frac{n_2}{n_2 - 2} $
78+
79+
\hsubparagraph{性质}
80+
\begin{itemize}[leftmargin=\subparitemindent]
81+
\item 即它的数学期望并不依赖于第一自由度。
82+
\item$ F \sim F(n_1, n_2) $$ \frac{1}{F} \sim F(n_2, n_1) $
83+
\item $ F_{1 - \alpha}(n_1,n_2) = 1 / F_{\alpha}(n_2,n_1) $
84+
\end{itemize}
85+

Chapter-2/Section-2-4.tex

Lines changed: 54 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,54 @@
1+
\section{正态总体抽样分布定理}
2+
3+
\noindent 设总体 $ X $ 的均值为 $ \mu $ ,方差为 $ \sigma^2 $$ X_1, X_2, \cdots, X_n $ 是来自总体的一个样本,则样本均值 $ \bar{X} $
4+
和样本方差 $ S^2 $
5+
\begin{align}
6+
E(\bar{X}) & = \mu \\
7+
D(\bar{X}) & = \frac{\sigma^2}{\mu} \\
8+
E(S^2) & = \sigma^2
9+
\end{align}
10+
11+
\hparagraph{样本均值的分布} 设 $ X_1, X_2, \cdots, X_n $ 是来自正态总体 $ N(\mu, \sigma^2) $ 的样本, $ \bar{X} $ 是样本均值,则有
12+
\begin{equation}
13+
X \sim N\left(\mu, \frac{\sigma^2}{n}\right)
14+
\end{equation}
15+
16+
\begin{equation}
17+
\frac{\bar{X} - \mu}{\ddfrac{\sigma^2}{\sqrt{n}}} \sim N(0,1)
18+
\end{equation}
19+
20+
\hparagraph{样本方差的分布} 设 $ X_1, X_2, \cdots, X_n $ 是来自正态总体 $ N(\mu, \sigma^2) $ 的样本, $ \bar{X} $ 是样本均值,
21+
$ S^2 $ 是样本方差,则有
22+
\begin{itemize}[leftmargin=\paritemindent]
23+
\item \begin{equation}
24+
\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
25+
\end{equation}
26+
\item $ \bar{X} $$ S^2 $ 独立
27+
\end{itemize}
28+
29+
30+
\hparagraph{样本均值的分布} 设 $ X_1, X_2, \cdots, X_n $ 是来自正态总体 $ N(\mu, \sigma^2) $ 的样本, $ \bar{X} $ 是样本均值,
31+
$ S^2 $ 是样本方差,则有
32+
\begin{equation}
33+
\frac{\bar{X} - \mu}{\ddfrac{S}{\sqrt{n}}} \sim t(n-1)
34+
\end{equation}
35+
36+
\hparagraph{两总体样本均值差的分布} 设 $ X\sim N(\mu_1, \sigma_{1}^{2}), X\sim N(\mu_2, \sigma_{2}^{2}) $$ X,Y $ 独立,
37+
$ X_1, X_2, \cdots, X_n $ 是来自正态总体 $ X $ 的样本,$ Y_1, Y_2, \cdots, Y_n $ 是来自正态总体 $ Y $ 的样本,
38+
$ \bar{X},\bar{Y} $ 分别是这两个样本的均值,$ S_{1}^{2}, S_{2}^{2} $ 分别是这两个样本的方差,则有
39+
\begin{align}
40+
\frac{S_{1}^{2}/\sigma_{1}^{2}}{S_{2}^{2}/\sigma_{2}^{2}} & \sim F(n_1 - 1,n_2 -1) \\
41+
\ddfrac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{
42+
\sqrt{\frac{(n_1 - 1)S_{1}^{2} + (n_2 - 1)S_{2}^{2}}{n_1 + n_2 - 2}}
43+
\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}
44+
} & \sim t(n_1 + n_2 - 2)
45+
\end{align}
46+
47+
\hparagraph{Cochran定理} 设 $ X_1, X_2, \cdots, X_n $ 独立同分布,服从 $ N(0,1) $$ X = (X_1, X_2, \cdots, X_n)^{\symrm{T}} $
48+
$$ Q = \sum_{i=1}^{n}X_{i}^{2} = \sum_{l=1}^{n}Q_l $$$ X = (X_1, X_2, \cdots, X_n)^{\symrm{T}} $ 的二次型,
49+
$ Q = X^{\symrm{T}}A_l X $ 则下述结论成立的充要条件是 $$ n = \sum_{i=1}^{k} n_i $$
50+
\begin{itemize}[leftmargin=\paritemindent]
51+
\item $ Q_1, Q_2, \cdots, Q_k $ 相互独立
52+
\item $ Q_l \sim \chi^2(n_l) $
53+
\end{itemize}
54+

MathematicalStatistics.tex

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -13,4 +13,5 @@
1313

1414
\mainmatter
1515
\include{Chapter-1}
16+
\include{Chapter-2}
1617
\end{document}

setting.tex

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -72,7 +72,7 @@
7272
\newcommand{\diff}{\symrm{d }}
7373
\newcommand{\cpi}{\symrm{\pi}}
7474
\newcommand{\trans}{^\symrm{T}}
75-
\newcommand{\highlight}[1]{\textbf{\alert{#1}}}
75+
\newcommand{\highlight}[1]{\textcolor{blue}{\textbf{\kaishu{#1}}}}
7676
\newcommand{\done}{\ooalign{$\square$ \cr \raisebox{3pt}{\scriptsize{$$}}}}
7777
\newcommand{\undone}{\ooalign{$\square$ \cr \raisebox{3pt}{}}}
7878
\newcommand{\Cov}{\mathrm{Cov}}

0 commit comments

Comments
 (0)