解答一覧リンク
時間内答案
解いた感想
t分布に関する基本問題です。
完全初見でも[2]までは解きたいところです。
[3]は時間内だと完全解答は厳しいと思いました。
t分布も公式の形や自由度を覚えるために、
パターンをこなすのが重要です。
[1]
検定統計量 \( T = \frac{\bar{y}-\mu_B}{s_{y} / \sqrt{n}} \) が自由度 \(n-1\) の t分布に従うので、
$$ t_{0.975}(14) \leq \frac{\bar{y}-\mu_B}{s_{y} / \sqrt{n}} \leq t_{0.025}(14) $$
$$ -2.145 \leq \frac{20-\mu_B}{10 / \sqrt{15}} \leq 2.145 $$
$$ 20-2.145 \frac{10}{\sqrt{15}} \leq \mu_B \leq 20+2.145 \frac{10}{\sqrt{15}} $$
$$ 20-5.538 \leq \mu_B \leq 20+5.538 $$
$$ 14.46 \leq \mu_B \leq 25.54 $$
[2]
プールした分散 \( s^2 \) は一般に次式で表される
$$ s^2 = \frac{(n_A-1){s_A}^2+(n_B-1){s_B}^2}{n_A+n_B-2} $$
検定統計量 t は次式で表される
$$ t = \frac{\bar{y_A}-\bar{y_B}-(\mu_A-\mu_B)}{s\sqrt{1/{n_A}+1/{n_B}}} $$
$$ t = \frac{\bar{y_A}-\bar{y_B}-(\mu_A-\mu_B)}{s\sqrt{\frac{1}{{n_A}}+\frac{1}{{n_B}}}} $$
t は自由度 \( n_A+n_B-2 \) のt分布に従う
帰無仮説 \( H_0 : \mu_A = \mu_B \Leftrightarrow \mu_A-\mu_B = 0 \)
帰無仮説 \( H_0 \)のもとで検定統計量の実現値は以下で表される
$$ t = \frac{\bar{y_A}-\bar{y_B}}{s\sqrt{\frac{1}{{n_A}}+\frac{1}{{n_B}}}} $$
実際の値を代入すると以下の様になる
$$ t = \frac{27-20}{\sqrt{82}\sqrt{\frac{1}{{15}}+\frac{1}{{15}}}}=2.12 $$
自由度28のt分布の上側2.5%点は\( t_{0.025}(28)=2.048 \) なので、
$$ t =2.12 > t_{0.025}(28) $$
よって、\(H_0\)は棄却される。
また、\(\mu_A-\mu_B\) の95%信頼区間は次式から計算できる
$$ t_{0.975}(n_A+n_B-2) \leq \frac{\bar{y_A}-\bar{y_B}-(\mu_A-\mu_B)}{s\sqrt{\frac{1}{{n_A}}+\frac{1}{{n_B}}}} \leq t_{0.025}(n_A+n_B-2) $$
$$ -2.048 \leq \frac{27-20-(\mu_A-\mu_B)}{\sqrt{\frac{164}{15}}} \leq 2.048 $$
$$ 7-2.048\sqrt{\frac{164}{15}} \leq \mu_A-\mu_B \leq 7+2.048\sqrt{\frac{164}{15}} $$
$$ 0.23 \leq \mu_A-\mu_B \leq 13.77 $$
[3]
AとBの95%信頼区間に重なりが無い場合、
$$ Bの信頼区間の上限 < Aの信頼区間の下限 $$
$$ \bar{y_B}+\frac{s}{\sqrt{n}}t_{0.025}(n-1) < \bar{y_A}-\frac{s}{\sqrt{n}}t_{0.025}(n-1) $$
$$ \bar{y_A}-\bar{y_B} > 2\frac{s}{\sqrt{n}}t_{0.025}(n-1) > 2\frac{s}{\sqrt{n}}t_{0.025}(2n-2)$$
左辺と右辺を\( s\sqrt{\frac{2}{n}} \)で割ると、
左辺が \( T = \frac{\bar{y_A}-\bar{y_B}}{s\sqrt{\frac{2}{n}}} \) の形で表せるので
$$ T > \sqrt{2}t_{0.025}(2n-2)$$
よって、AとBの95%信頼区間の重なりが無い場合は2標本両側t検定は常に有意となる。
AとBの95%信頼区間に重なりがある場合、
簡単のため、Aの下限>Bの上限の場合を考える
AとBの信頼区間の重なりをDとする。
$$ \begin{align}
D &= \bar{y_B}+\frac{s}{\sqrt{n}}t_{0.025}(n-1) – (\bar{y_A}-\frac{s}{\sqrt{n}}t_{0.025}(n-1)) \\
&= 2\frac{s}{\sqrt{n}}t_{0.025}(n-1) -(\bar{y_A}-\bar{y_B})
\end{align} $$
Tが棄却域\( t_{0.025}(2n-2) \)を超える場合、
$$ \begin{align}
T &> t_{0.025}(2n-2) \\
\\
\frac{\bar{y_A}-\bar{y_B}}{s\sqrt{\frac{2}{n}}} &> t_{0.025}(2n-2) \\
\bar{y_A}-\bar{y_B} &> s\sqrt{\frac{2}{n}}t_{0.025}(2n-2)
\end{align} $$
左辺に、\( \bar{y_A}-\bar{y_B} = -D+2\frac{s}{\sqrt{n}}t_{0.025}(n-1) \) を代入すると
$$ \begin{align}
D &< 2\frac{s}{\sqrt{n}}t_{0.025}(n-1) – s\sqrt{\frac{2}{n}}t_{0.025}(2n-2) \\
&= (2t_{0.025}(n-1) – \sqrt{2}t_{0.025}(2n-2))\frac{s}{\sqrt{n}} \\
&= \Biggl(1 – \frac{\sqrt{2}}{2}\frac{t_{0.025}(2n-2)}{t_{0.025}(n-1)}\Biggr)2t_{0.025}(n-1)\frac{s}{\sqrt{n}}
\end{align} $$
nが十分に大きいとき、\( \frac{t_{0.025}(2n-2)}{t_{0.025}(n-1)} \simeq 1\)とみなせ、
\( 1 – \frac{\sqrt{2}}{2} \simeq 0.293 \)となるため、
信頼区間幅 \( 2t_{0.025}(n-1)\frac{s}{\sqrt{n}} \) の30パーセント以下しか重なっていないときに
2標本の両側t検定は有意となる。
所感
難易度 : A (簡単)
t分布に関する基本公式を学びたい場合、
大学1・2年生のためのすぐわかる統計学
がオススメです。
検定のパターンを覚えたい場合は
以下の書籍がオススメです。