문과생 네버랜드의 데이터 창고

39-1. 비중심 카이스퀘어 분포와 F분포 본문

수리통계

39-1. 비중심 카이스퀘어 분포와 F분포

K JI 2023. 7. 31. 18:46
  1. 비중심 카이스퀘어 분포
    1) 카이제곱 분포와의 비교

    ${(1)}$ 앞서, 카이제곱 분포를 살펴보며 $N(\mu, \sigma^{2})$을 따르는 확률변수들의 2차형식 $$V = \frac{(X - \mu)^{2}}{\sigma^{2}}$$은 $x^{2}(1)$을 따름을 보였다.

    ${(2)}$ 이는 $\mu$라는 평균을 갖는 확률변수 X를 $N(0,1)$을 따르는 표준정규분포로 변환한 후 그 제곱을 취한 것이라 볼 수 있다.

    ${(3)}$ 이제, 자연스럽게 들 수 있는 의문은 다음과 같다.
    -. 그렇다면, 평균을 0으로 스케일하지 않은, 즉 다음과 같은 확률변수는 어떤 분포를 따를 것인가? 
    $$V' = \frac{(X)^{2}}{\sigma^{2}}$$
    -. 위 변환확률변수는 굳이 표현하자면 $N(\mu, 1)$을 따르는 분포를 이용한 변환 확률변수이다. 이제, 이 확률변수가 어떤 분포를 따르는지 확인할것이며, 이를 '비중심 카이제곱분포'라고 칭할 것이다.

    2) 비중심 카이제곱분포의 유도
    ${(1)}$ MGF의 유도
    $X_{1}, \dots, X_{n}$을 $N(\mu_{i}, \sigma^{2})$ 각각 따르는, 서로 독립인 확률변수라 하자.
    다음의 변환확률변수를 정의한다.
    $$Y = \sum_{i=1}^{n}\frac{(X_{i})^{2}}{\sigma^{2}}$$

    Y의 MGF를 정의하면
    $$E[exp(tY)] = E[exp(t\frac{\sum x_{i}^{2}}{\sigma^{2}})] = \prod_{i=1}^{n}E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})]$$
    $E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})]$ 를 적분형식으로 나타내면
    $$E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})] = \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(t\frac{X_{i}^{2}}{\sigma^{2}} - \frac{(x_{i} - \mu_{i})^{2}}{2\sigma^{2}})dx_{i}$$
    적분 내부에 있는 exp 함수를 변형하면 다음과 같이 나타낼 수 있다.
    $$t\frac{X_{i}^{2}}{\sigma^{2}} - \frac{(x_{i} - \mu_{i})^{2}}{2\sigma^{2}} \\ = -\frac{x_{i}^{2}(1-2t)}{2\sigma^{2}} + \frac{2x_{i}\mu_{i}}{2\sigma^{2}} - \frac{\mu_{i}^{2}}{\sigma^{2}} \\= \frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)} - \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2}$$
    정리한 EXP항을 원래 적분식에 대입하면
    $$\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)} - \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i} \\ = exp \begin{bmatrix}\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)}\end{bmatrix}\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$$
    이 식에 $\sqrt{\frac{1-2t}{1-2t}}$를 곱하면
    $$exp \begin{bmatrix}\frac{t\mu_{i}^{2}}{\sigma^{2}(1-2t)}\end{bmatrix}\sqrt{\frac{1}{1-2t}}\int_{-\infty}^{\infty} \frac{\sqrt{1-2t}}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$$
    식이 매우 복잡해졌으나, 겁먹지 않고 이 식을 차근차근 살펴보면
    -. 적분항 $\int_{-\infty}^{\infty} \frac{\sqrt{1-2t}}{\sqrt{2\pi}\sigma} exp(- \frac{1-2t}{2\sigma^{2}}(x_{i}-\frac{\mu_{i}}{1-2t})^{2})dx_{i}$
    는 평균이 $\frac{\mu_{i}}{1-2t}$, 분산이 $\frac{1-2t}{\sigma^{2}}$인 정규분포이다. 따라서 그 적분은 1이다.

    따라서, 밖으로 튀어나온 상수항만 살아남고, $\sum \mu_{i}^{2} = \theta$로 놓고 이를 총정리하면 
    $$E[exp(tY)] = \prod_{i=1}^{n}E[exp(t\frac{x_{i}^{2}}{\sigma^{2}})] = \frac{1}{(1-2t)^{n/2}}exp \begin{bmatrix}\frac{t\theta}{\sigma^{2}(1-2t)}\end{bmatrix}$$
    이다.
    이 mgf를 갖는 확률변수를 비중심 카이제곱분포라고 칭한다.
    $\theta=0$, 즉 모든 평균이 0이라고 가정했을 때는 우리에게 익숙한 중심 카이제곱 분포 $x^{2}(n)$의  mgf인
    $$m(t) = \frac{1}{(1-2t)^{n/2}}$$이 된다.

    ${(2)}$ 확률밀도함수
    -. 비중심 카이제곱분포의 pdf는 별도로 유도하지 않을것이다. 다만, 다음과 같은 형태가 알려져있다.자유도를 k, 비중심모수를 $\theta$라고 할 때 :

    ①  $$f(x;k,\theta) = \sum_{j=1}^{\infty}\frac{exp(-\theta/2)(\theta/2)^{j}}{j!}f_{Y_{k+2j}(x)}$$, 이 때 $f_{Y_{k+2j}}(X)$는 자유도 $(k+2j)$의 중심 카이제곱분포이다. 즉, 이는 중심 카이제곱분포의 포아송 가중합으로 볼 수 있다.

    ② $$f(x;k,\theta) = \frac{1}{2}exp(-\frac{(x+\theta)}{2})(\frac{x}{\theta})^{k/4-1/2}I_{k/2-1}(\sqrt{\theta x})$$, 이 때 $I_{k/2-1}(y)$는 다음과 같이 주어지는 특수함수인 베셀함수이다.
    $$I_{k/2-1}(y) = (\frac{y}{2})^{2}\sum_{j=1}^{\infty}\frac{(y^{2}/4)^{j}}{j!\Gamma(v+j+1)}$$

  2. 비중심 F분포
    1) 위에서 도출한 비중심 카이제곱분포를 이용하여 비중심 F분포를 유도할 수 있다.
    2) 비중심 F분포의 유도
    앞서, U와 V가 $X^{2}(r_{1})$, $X^{2}(r_{2})$인 카이제곱분포를 따른다고 할때, F분포를 다음과 같이 정의하였다.
    $$F = \frac{U/r_{1}}{V/r_{2}}$$
    이제, U가 비중심모수 $\theta$를 갖는 비중심 카이제곱분포임을 가정할 것이다. 즉
    $U \sim x^{2}(r_{1}, \theta)$
    V는 여전히 중심 카이제곱분포 $x^{2}(r_{2})$를 따른다고 할때, 그 비율로서 정의되는
    $$F = \frac{U/r_{1}}{V/r_{2}}$$
    를 $F(r_{1}, r_{2}, \theta)$인 비중심 F분포라고 한다.