HOME > 情報系学生のための数学 >信頼区間

信頼区間

「けっこう信じていい区間」のことです.

当サイトでは述語論理の記述を多用します。
一般の書籍・論文ではあまり見られない記号を使用する場合もありますので、 本サイトで使用する数学記号 を参照しながらご覧ください。

定義

定義1. 信頼区間

ある母集団に関する統計量 \(\theta\) について, 母集団からの無作為標本 \(X\) によって得られる区間 \(I(X)\) が

\[P(\theta\in I(X))=1-\alpha\]

を満たすとき,\(\alpha\) を危険率,\(1-\alpha\) を信頼係数, \(I(X)\) を \(100(1-\alpha)\%\) 信頼区間という.

正規母集団の母平均の区間推定

以下では,正規母集団 \(\mathcal{N}(\mu,\sigma^2)\) から無作為に抽出した標本 \(X=\{X_i\}_{i=1}^N\) について,標本平均

\[\mathbb{E}(X)\triangleq\frac{1}{N}\sum_{i=1}^NX_i\]

および標本分散

\[\mathbb{V}(X)\triangleq\frac{1}{N}\sum_{i=1}^N(X_i-\mathbb{E}(X))^2\]

が与えられているものとする.

1. 母分散が既知の場合

母平均 \(\mu\) が未知,母分散 \(\sigma^2\) が既知である場合を考える.

\[\mathbb{E}(X)\sim\mathcal{N}\left(\mu,\frac{\sigma^2}{N}\right)\]

より,標準正規分布 \(\mathcal{N}(0,1)\) の上側 \(100\alpha\%\) 点を \(z(\alpha)\) とすると

\begin{align} 1-\alpha&=P\left( -z\left(\frac{\alpha}{2}\right) \le\frac{\mathbb{E}(X)-\mu}{\sigma/\sqrt{N}} \le z\left(\frac{\alpha}{2}\right)\right) \\ &=P\left( \mathbb{E}(X)-z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{N}} \le\mu \le\mathbb{E}(X)+z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{N}} \right) \end{align}

よって母平均 \(\mu\) の \(100(1-\alpha)\%\) 信頼区間は

\[ I(X)=\left[ \mathbb{E}(X)-z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{N}}, \ \ \mathbb{E}(X)+z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{N}} \right] \]

2. 母分散が未知の場合

正規母集団 \(\mathcal{N}(\mu,\sigma^2)\) について,母平均 \(\mu\) および 母分散 \(\sigma^2\) がともに未知である場合を考える.

\begin{align} \mathbb{E}(X)&\sim\mathcal{N}\left(\mu,\frac{\sigma^2}{N}\right) \\ N\frac{\mathbb{V}(X)}{\sigma^2}&\sim\chi^2_{N-1} \end{align}

より,統計量 \(T\) が以下のように定義される. (\(t\) 分布の定義)

\[ T\triangleq\frac{\frac{\mathbb{E}(X)-\mu}{\sigma/\sqrt{N}}} {\sqrt{\frac{N}{N-1}\frac{\mathbb{V}(X)}{\sigma^2}}} =\frac{\sqrt{N-1}\ (\mathbb{E}(X)-\mu)}{\mathbb{V}(X)}\sim t_{N-1} \]

よって \(t_{N-1}\) の上側 \(100\alpha\%\) 点を \(t_{N-1}(\alpha)\) とすると

\begin{align} 1-\alpha&=P\left( -t_{N-1}\left(\frac{\alpha}{2}\right) \le\frac{\sqrt{N-1}\ (\mathbb{E}(X)-\mu)}{\mathbb{V}(X)} \le t_{N-1}\left(\frac{\alpha}{2}\right)\right) \\ &=P\left( \mathbb{E}(X)-t_{N-1} \left(\frac{\alpha}{2}\right)\sqrt{\frac{\mathbb{V}(X)}{N-1}} \le\mu \le\mathbb{E}(X)+t_{N-1} \left(\frac{\alpha}{2}\right)\sqrt{\frac{\mathbb{V}(X)}{N-1}} \right) \end{align}

したがって母平均 \(\mu\) の \(100(1-\alpha)\%\) 信頼区間は

\[ I(X)=\left[ \mathbb{E}(X)-t_{N-1} \left(\frac{\alpha}{2}\right)\sqrt{\frac{\mathbb{V}(X)}{N-1}}, \ \ \mathbb{E}(X)+t_{N-1} \left(\frac{\alpha}{2}\right)\sqrt{\frac{\mathbb{V}(X)}{N-1}} \right] \]