문과생 네버랜드의 데이터 창고

17. T분포와 F분포 본문

수리통계

17. T분포와 F분포

K JI 2023. 6. 22. 20:26
  1. T분포
    1) 표준정규분포와 카이제곱 분포의 결합분포를 T분포라고 한다.
    ${(1)}$ 모평균과 모표준편차를 알기 어려운 상황에서, 자유도라 불리우는 표본의 갯수에 따라 통계적 성질이 결정된다.
    ${(2)}$ 자유도를 $n \rightarrow \infty$로 할 경우 정규분포로 수렴하므로, 정규분포의 근사 분포로서 주로 활용된다.

    2) T분포의 유도
    ${(1)}$ pdf의 유도
    -. W ~ $N(0,1)$을 따르는 분포라 하고, V ~ $x^{2}(r)$을 따르는 분포라 하자. 두 분포는 서로 독립이다.

    -. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉 
    $$h(w,v) = [\frac{1}{\sqrt{2\pi}}exp(-\frac{w^{2}}{2})] \cdot [\frac{1}{\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}v^{\frac{r}{2}-1}e^{-\frac{v}{2}}]$$

    -. $T = \frac{w}{\sqrt{v/r}}$ 로 변수변환을 수행하면, U = V라고 할 때  $W = t \cdot \frac{\sqrt{u}}{\sqrt{r}}$
    -. 따라서 변환 야코비안 |J|는 아래와 같다.
    $$|J| = \begin{vmatrix} \frac{\partial u}{\partial v} && \frac{\partial u}{\partial t} \\ \frac{\partial w}{\partial v} && \frac{\partial w}{\partial t} \end{vmatrix} = \begin{vmatrix} 1 && 0 \\ 0 && \frac{\sqrt{u}}{\sqrt{r}}\end{vmatrix} = \frac{\sqrt{u}}{\sqrt{r}}$$ 
    -. 결합 pdf를 다시 정리하면
    $$g(t,u) = \frac{1}{\sqrt{2\pi}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}u^{\frac{r}{2}-1}exp[-\frac{u}{2}(1+\frac{t^{2}}{r})] \begin{vmatrix} \frac{\sqrt{u}}{\sqrt{r}} \end{vmatrix}$$

    -. 이제, u에 대하여 적분하여 변환된 확률변수 T에 대한 주변 pdf를 구하면 다음과 같다.
    $$g(t) = \int_{0}^{\infty} \frac{1}{\sqrt{2\pi}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}u^{\frac{r}{2}-1}exp[-\frac{u}{2}(1+\frac{t^{2}}{r})] \begin{vmatrix} \frac{\sqrt{u}}{\sqrt{r}} \end{vmatrix} du $$

    이 때, $z = \frac{u}{2}[1 + \frac{t^{2}}{r}]$ 라고 하면 $|J| = \frac{2}{1+\frac{t^{2}}{r^{2}}}$이고, 다시 정리하면

    $$\int_{0}^{\infty} \frac{1}{\sqrt{2\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}(\frac{2z}{1+\frac{t^{2}}{r}})^{\frac{r+1}{2}-1}exp[-z]\begin{vmatrix} \frac{2}{1+\frac{t^{2}}{r^{2}}} \end{vmatrix}  dz $$

    $$ =\frac{1}{\sqrt{\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}{(1+\frac{t^{2}}{r})^{\frac{r+1}{2}}}}\int_{0}^{\infty}z^{\frac{r+1}{2}-1}exp[-z]dz$$

    이 때, 적분식 안은 $\Gamma(\frac{r+1}{2})$와 동일하므로, 이를 반영하여 정리하면

    $$ =\frac{\Gamma(\frac{r+1}{2})}{\sqrt{\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}{(1+\frac{t^{2}}{r})^{\frac{r+1}{2}}}}$$
    (단, t는 -$\infty < t < \infty$)
    이것이 바로  $T = \frac{w}{\sqrt{v/r}}$의 pdf이다.

    ${(2)}$ T분포의 평균과 분산
    -. 다시, W ~ $N(0,1)$을 따르는 분포라 하고, V ~ $x^{2}(r)$을 따르는 분포라 하자. 두 분포는 서로 독립이다.
    -. $T = \frac{w}{\sqrt{v/r}}$ 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.

    일반식 $$E(T^{k}) = E[w^{k} \cdot (\frac{v}{r})^{-\frac{k}{2}}]=E[w^{k}] \cdot E[(\frac{v}{r})^{-\frac{k}{2}}]$$

    이 때, 카이제곱의 기타 성질 중 $E(x^{k})$의 성질에 따라 

    $$E(T^{k}) = E(w^{k}) \cdot \frac{2^{-k}\Gamma(\frac{r}{2} - \frac{k}{2})}{\Gamma(\frac{r}{2})r^{-\frac{k}{2}}}$$

    평균 $$E(T) = E(w) \cdot\frac{2^{-\frac{1}{2}}\Gamma(\frac{r}{2} - \frac{1}{2})}{\Gamma(\frac{1}{2})r^{-\frac{1}{2}}}$$

    이 때, $E(w) = 0$ 이므로 평균은 결국 0이다.
    분산 $$E(T^{2}) = E(w^{2}) \cdot\frac{2\Gamma(\frac{r}{2} - \frac{2}{2})}{\Gamma(\frac{2}{2})r^{-\frac{2}{2}}} = E(w^{2})\frac{r}{r-2}$$

    이 때, 표준정규분포 W의  $E(w^{2}) = 1$ 이므로

    $$Var(T) = E(T^{2}) - E(T)^{2} = \frac{r}{r-2}$$
  2. F분포
    1) 자유도 $r_{1}$과 $r_{2}$를 따르는 서로 독립인 $x^{2}$ 분포에서 파생된 결합분포
    ${(1)}$ F분포는 분산분석(ANOVA) 등 다양한 통계적 추론 분야에서 활용된다.

    2) F분포의 유도

    ${(1)}$ U ~ $x^{2}(r_{1})$ 이고, V~$x^{2}(r_{2})$ 라고 하자. 두 분포는 서로 독립이다.
    -. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉 
    $$h(u,v) = \frac{1}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}U^{\frac{r_{1}}{2}-1} \cdot V^{\frac{r_{2}}{2}-1}exp(-\frac{(U+V)}{2})$$

    -. 이 때, $W = \frac{u/r_{1}}{v/r_{2}}$, $Z = V$ 라고 변수변환을 수행하면, 역함수는$ U = \frac{r_{1}zw}{r_{2}} $
    그 야코비 |J|는
    $$|J| =\begin{vmatrix} \frac{\partial Z}{\partial V} && \frac{\partial Z}{\partial W} \\ \frac{\partial U}{\partial V} && \frac{\partial U}{\partial W} \end{vmatrix} = \begin{vmatrix} 1 && 0 \\ 0 && \frac{r_{1}}{r_{2}z}\end{vmatrix} = \frac{r_{1}}{r_{2}}z$$

    -. 결합 pdf를 다시 정리하면
    $$g(w,z) = \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot z^{\frac{r_{1} + r_{2}}{2}-1}exp[-\frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)]$$

    -. 이제, z에 대하여 적분하여 W에 대한 주변 pdf를 구하면 다음과 같다.
    $$g(w) = \int_{0}^{\infty} \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot z^{\frac{r_{1} + r_{2}}{2}-1}exp[-\frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)] dz$$

    이때, $Y = \frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)$ 로 변수변환하면 그 야코비안 $|J| = \frac{2}{r_{1}w/r_{2} + 1}$ 이고, 
    $$g(w) = \int_{0}^{\infty} \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot (\frac{2y}{r_{1}w/r_{2} + 1})^{\frac{r_{1} + r_{2}}{2}-1}exp[-y] \begin{vmatrix} \frac{2}{r_{1}w/r_{2} + 1} \end{vmatrix} dy$$


    적분식 안은 $\Gamma(\frac{r_{1} + r_{2}}{2})$ 과 동일하므로, 정리하면
    $$\frac{\Gamma(\frac{r_{1} + r_{2}}{2})(r_{1}/r_{2})^{r_{1}/2}}{\Gamma(r_{1}/2 \Gamma(r_{2}/2)} \cdot \frac{w^{r_{1}/2-1}}{(1+r_{1}w/r_{2})^{(r_{1}+r_{2})/2}}$$

    이것이 F분포 $W = \frac{u/r_{1}}{v/r_{2}}$의 pdf이다.
    ${(2)}$ F분포의 평균과 분산
    -. 다시, U ~ $x^{2}(r_{1})$ 이고, V~$x^{2}(r_{2})$ 라고 하자. 두 분포는 서로 독립이다.
    -.  $F = \frac{u/r_{1}}{v/r_{2}}$ 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.

    일반식 $$E(F^{k}) = (\frac{r_{2}}{r_{1}})^{k}E(U^{k})E(V^{-k})$$

    이 때, 카이제곱의 기타 성질 중 $E(x^{k})$의 성질에 따라 

    $$E(F^{k}) = (\frac{r_{2}}{r_{1}})\frac{2^{k}\Gamma(\frac{r}{2} +k)}{\Gamma(\frac{r}{2})}\frac{2^{-k}\Gamma(\frac{r}{2}-k)}{\Gamma(\frac{r}{2})}$$
    평균 $$E(F) =(\frac{r_{2}}{r_{1}})E(U)\frac{2^{-1}\Gamma(\frac{r}{2}-1)}{\Gamma(\frac{r}{2})}$$이 때, 카이제곱 분포의 기댓값 $E(U) = r_{1}$ 이므로 

    $$E(F) =(\frac{r_{2}}{r_{1}})r_{1}\frac{2^{-1}\Gamma(\frac{r}{2}-1)}{\Gamma(\frac{r}{2})} = \frac{r_{2}}{r_{2} - 2}$$
    분산 https://proofwiki.org/wiki/Variance_of_F-Distribution 참조

    분산은 다음과 같다.

    $$Var(x) = \frac{2r_{2}^{2}(r_{2} + r_{1} - 2)}{r_{1}(r_{2}-4)(r_{2}-2)^{2}}$$

'수리통계' 카테고리의 다른 글

18. 확률표본과 모수, 그리고 통계량  (0) 2023.06.26
17-1 스튜던트의 정리  (0) 2023.06.23
16. 혼합분포  (0) 2023.06.21
15-1 다변량 정규분포  (0) 2023.06.20
15. 정규분포  (2) 2023.06.19