Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 미적분 #사인과 코사인의 도함수
- bayesian inference
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- Media Mix Modeling
- bayesian
- Marketing Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- mmm
- 미적분
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 수리통계
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- Optimization
- lightweightmmm
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
17. T분포와 F분포 본문
-
T분포
1) 표준정규분포와 카이제곱 분포의 결합분포를 T분포라고 한다.
${(1)}$ 모평균과 모표준편차를 알기 어려운 상황에서, 자유도라 불리우는 표본의 갯수에 따라 통계적 성질이 결정된다.
${(2)}$ 자유도를 $n \rightarrow \infty$로 할 경우 정규분포로 수렴하므로, 정규분포의 근사 분포로서 주로 활용된다.
2) T분포의 유도
${(1)}$ pdf의 유도
-. W ~ $N(0,1)$을 따르는 분포라 하고, V ~ $x^{2}(r)$을 따르는 분포라 하자. 두 분포는 서로 독립이다.
-. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉$$h(w,v) = [\frac{1}{\sqrt{2\pi}}exp(-\frac{w^{2}}{2})] \cdot [\frac{1}{\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}v^{\frac{r}{2}-1}e^{-\frac{v}{2}}]$$
-. $T = \frac{w}{\sqrt{v/r}}$ 로 변수변환을 수행하면, U = V라고 할 때 $W = t \cdot \frac{\sqrt{u}}{\sqrt{r}}$
-. 따라서 변환 야코비안 |J|는 아래와 같다.$$|J| = \begin{vmatrix} \frac{\partial u}{\partial v} && \frac{\partial u}{\partial t} \\ \frac{\partial w}{\partial v} && \frac{\partial w}{\partial t} \end{vmatrix} = \begin{vmatrix} 1 && 0 \\ 0 && \frac{\sqrt{u}}{\sqrt{r}}\end{vmatrix} = \frac{\sqrt{u}}{\sqrt{r}}$$
$$g(t,u) = \frac{1}{\sqrt{2\pi}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}u^{\frac{r}{2}-1}exp[-\frac{u}{2}(1+\frac{t^{2}}{r})] \begin{vmatrix} \frac{\sqrt{u}}{\sqrt{r}} \end{vmatrix}$$
-. 이제, u에 대하여 적분하여 변환된 확률변수 T에 대한 주변 pdf를 구하면 다음과 같다.
$$g(t) = \int_{0}^{\infty} \frac{1}{\sqrt{2\pi}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}u^{\frac{r}{2}-1}exp[-\frac{u}{2}(1+\frac{t^{2}}{r})] \begin{vmatrix} \frac{\sqrt{u}}{\sqrt{r}} \end{vmatrix} du $$
이 때, $z = \frac{u}{2}[1 + \frac{t^{2}}{r}]$ 라고 하면 $|J| = \frac{2}{1+\frac{t^{2}}{r^{2}}}$이고, 다시 정리하면
$$\int_{0}^{\infty} \frac{1}{\sqrt{2\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}}(\frac{2z}{1+\frac{t^{2}}{r}})^{\frac{r+1}{2}-1}exp[-z]\begin{vmatrix} \frac{2}{1+\frac{t^{2}}{r^{2}}} \end{vmatrix} dz $$
$$ =\frac{1}{\sqrt{\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}{(1+\frac{t^{2}}{r})^{\frac{r+1}{2}}}}\int_{0}^{\infty}z^{\frac{r+1}{2}-1}exp[-z]dz$$
이 때, 적분식 안은 $\Gamma(\frac{r+1}{2})$와 동일하므로, 이를 반영하여 정리하면
$$ =\frac{\Gamma(\frac{r+1}{2})}{\sqrt{\pi r}\Gamma(\frac{r}{2})2^{\frac{\Gamma}{2}}{(1+\frac{t^{2}}{r})^{\frac{r+1}{2}}}}$$
(단, t는 -$\infty < t < \infty$)
이것이 바로 $T = \frac{w}{\sqrt{v/r}}$의 pdf이다.
-. 다시, W ~ $N(0,1)$을 따르는 분포라 하고, V ~ $x^{2}(r)$을 따르는 분포라 하자. 두 분포는 서로 독립이다.
-. $T = \frac{w}{\sqrt{v/r}}$ 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.
일반식 $$E(T^{k}) = E[w^{k} \cdot (\frac{v}{r})^{-\frac{k}{2}}]=E[w^{k}] \cdot E[(\frac{v}{r})^{-\frac{k}{2}}]$$
이 때, 카이제곱의 기타 성질 중 $E(x^{k})$의 성질에 따라
$$E(T^{k}) = E(w^{k}) \cdot \frac{2^{-k}\Gamma(\frac{r}{2} - \frac{k}{2})}{\Gamma(\frac{r}{2})r^{-\frac{k}{2}}}$$평균 $$E(T) = E(w) \cdot\frac{2^{-\frac{1}{2}}\Gamma(\frac{r}{2} - \frac{1}{2})}{\Gamma(\frac{1}{2})r^{-\frac{1}{2}}}$$
이 때, $E(w) = 0$ 이므로 평균은 결국 0이다.분산 $$E(T^{2}) = E(w^{2}) \cdot\frac{2\Gamma(\frac{r}{2} - \frac{2}{2})}{\Gamma(\frac{2}{2})r^{-\frac{2}{2}}} = E(w^{2})\frac{r}{r-2}$$
이 때, 표준정규분포 W의 $E(w^{2}) = 1$ 이므로
$$Var(T) = E(T^{2}) - E(T)^{2} = \frac{r}{r-2}$$ - F분포
1) 자유도 $r_{1}$과 $r_{2}$를 따르는 서로 독립인 $x^{2}$ 분포에서 파생된 결합분포
${(1)}$ F분포는 분산분석(ANOVA) 등 다양한 통계적 추론 분야에서 활용된다.
2) F분포의 유도
${(1)}$ U ~ $x^{2}(r_{1})$ 이고, V~$x^{2}(r_{2})$ 라고 하자. 두 분포는 서로 독립이다.
-. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉$$h(u,v) = \frac{1}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}U^{\frac{r_{1}}{2}-1} \cdot V^{\frac{r_{2}}{2}-1}exp(-\frac{(U+V)}{2})$$
-. 이 때, $W = \frac{u/r_{1}}{v/r_{2}}$, $Z = V$ 라고 변수변환을 수행하면, 역함수는$ U = \frac{r_{1}zw}{r_{2}} $그 야코비 |J|는
$$|J| =\begin{vmatrix} \frac{\partial Z}{\partial V} && \frac{\partial Z}{\partial W} \\ \frac{\partial U}{\partial V} && \frac{\partial U}{\partial W} \end{vmatrix} = \begin{vmatrix} 1 && 0 \\ 0 && \frac{r_{1}}{r_{2}z}\end{vmatrix} = \frac{r_{1}}{r_{2}}z$$
-. 결합 pdf를 다시 정리하면
$$g(w,z) = \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot z^{\frac{r_{1} + r_{2}}{2}-1}exp[-\frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)]$$
-. 이제, z에 대하여 적분하여 W에 대한 주변 pdf를 구하면 다음과 같다.$$g(w) = \int_{0}^{\infty} \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot z^{\frac{r_{1} + r_{2}}{2}-1}exp[-\frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)] dz$$
이때, $Y = \frac{z}{2}(\frac{r_{1}w}{r_{2}} + 1)$ 로 변수변환하면 그 야코비안 $|J| = \frac{2}{r_{1}w/r_{2} + 1}$ 이고,
$$g(w) = \int_{0}^{\infty} \frac{r_{1}/r_{2}^{r_{1}/2}}{\Gamma(\frac{r_{1}}{2})\Gamma(\frac{r_{2}}{2}) 2^{\frac{r_{1} + r_{2}}{2}}}w^{\frac{r_{2}}{2}-1} \cdot (\frac{2y}{r_{1}w/r_{2} + 1})^{\frac{r_{1} + r_{2}}{2}-1}exp[-y] \begin{vmatrix} \frac{2}{r_{1}w/r_{2} + 1} \end{vmatrix} dy$$
적분식 안은 $\Gamma(\frac{r_{1} + r_{2}}{2})$ 과 동일하므로, 정리하면
$$\frac{\Gamma(\frac{r_{1} + r_{2}}{2})(r_{1}/r_{2})^{r_{1}/2}}{\Gamma(r_{1}/2 \Gamma(r_{2}/2)} \cdot \frac{w^{r_{1}/2-1}}{(1+r_{1}w/r_{2})^{(r_{1}+r_{2})/2}}$$
이것이 F분포 $W = \frac{u/r_{1}}{v/r_{2}}$의 pdf이다.
-. 다시, U ~ $x^{2}(r_{1})$ 이고, V~$x^{2}(r_{2})$ 라고 하자. 두 분포는 서로 독립이다.
-. $F = \frac{u/r_{1}}{v/r_{2}}$ 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.
일반식 $$E(F^{k}) = (\frac{r_{2}}{r_{1}})^{k}E(U^{k})E(V^{-k})$$
이 때, 카이제곱의 기타 성질 중 $E(x^{k})$의 성질에 따라
$$E(F^{k}) = (\frac{r_{2}}{r_{1}})\frac{2^{k}\Gamma(\frac{r}{2} +k)}{\Gamma(\frac{r}{2})}\frac{2^{-k}\Gamma(\frac{r}{2}-k)}{\Gamma(\frac{r}{2})}$$평균 $$E(F) =(\frac{r_{2}}{r_{1}})E(U)\frac{2^{-1}\Gamma(\frac{r}{2}-1)}{\Gamma(\frac{r}{2})}$$이 때, 카이제곱 분포의 기댓값 $E(U) = r_{1}$ 이므로
$$E(F) =(\frac{r_{2}}{r_{1}})r_{1}\frac{2^{-1}\Gamma(\frac{r}{2}-1)}{\Gamma(\frac{r}{2})} = \frac{r_{2}}{r_{2} - 2}$$분산 https://proofwiki.org/wiki/Variance_of_F-Distribution 참조
분산은 다음과 같다.
$$Var(x) = \frac{2r_{2}^{2}(r_{2} + r_{1} - 2)}{r_{1}(r_{2}-4)(r_{2}-2)^{2}}$$
'수리통계' 카테고리의 다른 글
18. 확률표본과 모수, 그리고 통계량 (0) | 2023.06.26 |
---|---|
17-1 스튜던트의 정리 (0) | 2023.06.23 |
16. 혼합분포 (0) | 2023.06.21 |
15-1 다변량 정규분포 (0) | 2023.06.20 |
15. 정규분포 (2) | 2023.06.19 |