Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 미적분 #사인과 코사인의 도함수
- 수리통계
- Media Mix Modeling
- lightweightmmm
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- bayesian inference
- Marketing Mix Modeling
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- mmm
- Optimization
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- bayesian
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
39-1. 비중심 카이스퀘어 분포와 F분포 본문
-
비중심 카이스퀘어 분포
1) 카이제곱 분포와의 비교
${(1)}$ 앞서, 카이제곱 분포를 살펴보며 $N(\mu, \sigma^{2})$을 따르는 확률변수들의 2차형식 $$V = \frac{(X - \mu)^{2}}{\sigma^{2}}$$은 $x^{2}(1)$을 따름을 보였다.
${(2)}$ 이는 $\mu$라는 평균을 갖는 확률변수 X를 $N(0,1)$을 따르는 표준정규분포로 변환한 후 그 제곱을 취한 것이라 볼 수 있다.
${(3)}$ 이제, 자연스럽게 들 수 있는 의문은 다음과 같다.
-. 그렇다면, 평균을 0으로 스케일하지 않은, 즉 다음과 같은 확률변수는 어떤 분포를 따를 것인가?
$$V' = \frac{(X)^{2}}{\sigma^{2}}$$
-. 위 변환확률변수는 굳이 표현하자면 $N(\mu, 1)$을 따르는 분포를 이용한 변환 확률변수이다. 이제, 이 확률변수가 어떤 분포를 따르는지 확인할것이며, 이를 '비중심 카이제곱분포'라고 칭할 것이다.
2) 비중심 카이제곱분포의 유도
${(1)}$ MGF의 유도
$X_{1}, \dots, X_{n}$을 $N(\mu_{i}, \sigma^{2})$ 각각 따르는, 서로 독립인 확률변수라 하자.
다음의 변환확률변수를 정의한다.
$$Y = \sum_{i=1}^{n}\frac{(X_{i})^{2}}{\sigma^{2}}$$
Y의 MGF를 정의하면
$$E[exp(tY)] = E[exp(t\frac{\sum x_{i}^{2}}{\sigma^{2}})] = \prod_{i=1}^{n}E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})]$$
$E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})]$ 를 적분형식으로 나타내면
$$E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})] = \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(t\frac{X_{i}^{2}}{\sigma^{2}} - \frac{(x_{i} - \mu_{i})^{2}}{2\sigma^{2}})dx_{i}$$
적분 내부에 있는 exp 함수를 변형하면 다음과 같이 나타낼 수 있다.
$$t\frac{X_{i}^{2}}{\sigma^{2}} - \frac{(x_{i} - \mu_{i})^{2}}{2\sigma^{2}} \\ = -\frac{x_{i}^{2}(1-2t)}{2\sigma^{2}} + \frac{2x_{i}\mu_{i}}{2\sigma^{2}} - \frac{\mu_{i}^{2}}{\sigma^{2}} \\= \frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)} - \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2}$$
정리한 EXP항을 원래 적분식에 대입하면
$$\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)} - \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i} \\ = exp \begin{bmatrix}\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)}\end{bmatrix}\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$$
이 식에 $\sqrt{\frac{1-2t}{1-2t}}$를 곱하면
$$exp \begin{bmatrix}\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)}\end{bmatrix}\sqrt{\frac{1}{1-2t}}\int_{-\infty}^{\infty} \frac{\sqrt{1-2t}}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$$
식이 매우 복잡해졌으나, 겁먹지 않고 이 식을 차근차근 살펴보면
-. 적분항 $\int_{-\infty}^{\infty} \frac{\sqrt{1-2t}}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$
는 평균이 $\frac{\mu_{i}}{1-2t}$, 분산이 $\frac{1-2t}{\sigma^{2}}$인 정규분포이다. 따라서 그 적분은 1이다.
따라서, 밖으로 튀어나온 상수항만 살아남고, $\sum \mu_{i}^{2} = \theta$로 놓고 이를 총정리하면
$$E[exp(tY)] = \prod_{i=1}^{n}E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})] = \frac{1}{(1-2t)^{n/2}}exp \begin{bmatrix}\frac{t\theta}{\sigma^{2}(1-2t)}\end{bmatrix}$$
이다.
이 mgf를 갖는 확률변수를 비중심 카이제곱분포라고 칭한다.
$\theta=0$, 즉 모든 평균이 0이라고 가정했을 때는 우리에게 익숙한 중심 카이제곱 분포 $x^{2}(n)$의 mgf인
$$m(t) = \frac{1}{(1-2t)^{n/2}}$$이 된다.
${(2)}$ 확률밀도함수
-. 비중심 카이제곱분포의 pdf는 별도로 유도하지 않을것이다. 다만, 다음과 같은 형태가 알려져있다.자유도를 k, 비중심모수를 $\theta$라고 할 때 :
① $$f(x;k,\theta) = \sum_{j=1}^{\infty}\frac{exp(-\theta/2)(\theta/2)^{j}}{j!}f_{Y_{k+2j}(x)}$$, 이 때 $f_{Y_{k+2j}}(X)$는 자유도 $(k+2j)$의 중심 카이제곱분포이다. 즉, 이는 중심 카이제곱분포의 포아송 가중합으로 볼 수 있다.
② $$f(x;k,\theta) = \frac{1}{2}exp(-\frac{(x+\theta)}{2})(\frac{x}{\theta})^{k/4-1/2}I_{k/2-1}(\sqrt{\theta x})$$, 이 때 $I_{k/2-1}(y)$는 다음과 같이 주어지는 특수함수인 베셀함수이다.
$$I_{k/2-1}(y) = (\frac{y}{2})^{2}\sum_{j=1}^{\infty}\frac{(y^{2}/4)^{j}}{j!\Gamma(v+j+1)}$$ - 비중심 F분포
1) 위에서 도출한 비중심 카이제곱분포를 이용하여 비중심 F분포를 유도할 수 있다.
2) 비중심 F분포의 유도
앞서, U와 V가 $X^{2}(r_{1})$, $X^{2}(r_{2})$인 카이제곱분포를 따른다고 할때, F분포를 다음과 같이 정의하였다.
$$F = \frac{U/r_{1}}{V/r_{2}}$$
이제, U가 비중심모수 $\theta$를 갖는 비중심 카이제곱분포임을 가정할 것이다. 즉
$U \sim x^{2}(r_{1}, \theta)$
V는 여전히 중심 카이제곱분포 $x^{2}(r_{2})$를 따른다고 할때, 그 비율로서 정의되는
$$F = \frac{U/r_{1}}{V/r_{2}}$$
를 $F(r_{1}, r_{2}, \theta)$인 비중심 F분포라고 한다.
'수리통계' 카테고리의 다른 글
42. 이원배치 분산분석 (0) | 2023.08.02 |
---|---|
41. 다중비교(사후분석, post-hoc) (0) | 2023.08.01 |
40. 일원배치 분산분석 (0) | 2023.07.30 |
39. 통계학적 2차형식(Quadratic Form) (0) | 2023.07.28 |
38. 최소최대문제와 분류문제(with 선형판별분석) (0) | 2023.07.27 |