문과생 네버랜드의 데이터 창고

12. 이항분포 본문

수리통계

12. 이항분포

K JI 2023. 5. 22. 17:39
  1. 시작 : 베르누이 분포

    1) 이항분포베르누이 분포일반화 꼴이다. 따라서 시작은 베르누이 분포부터 확인해야한다
    2) 표본공간이 성공($X(성공) = 1$) 혹은 실패($x(실패) = 0$)으로 이루어져 있는 이산형 분포
    3) 이 때, 이항분포의 확률질량함수(PMF)는 아래와 같다
    $p(x) = p^{x}(1-p)^{1-x} \quad where \ x = \{0,1\}$

    4) 기댓값과 분산은
    $\mu$ $E(X) = \sum_{0}^{1} xp(x) = 0 \cdot p^{0}(1-p)^{1} + 1 \cdot p^{1}  = P$
    $var(x)$ $E[(X-\mu)^{2}]=\sum(x-\mu)^{2}p(x) = (1-p)^{2}p^{1}(1-p)^{0} + (0-p)^{2}p^{0}(1-p)^{1} = p(1-p)$
  2. 이항 분포

    1) 베르누이분포의 시행을 여러번 반복할 때 도출되는 분포

    2) 베르누이 분포에서 유도하는 과정은 아래와 같다
    ${(1)}$ 확률변수 X를 베르누이 확률실험의 성공횟수라고 하자, 즉 $S=\{1,0,0,1,1,0\}$일 때, $X(s) = 3$
    ${(2)}$ 이 때, 이런 실험을 n번 반복될 경우, 성공이 x회일때 실패는 n-x회 일어난다.
    ${(3)}$ 즉, 아래와 같이 모델링이 가능하다
    -. 경우의 수의 관점에서, 성공의 경우의 수는 $\begin{bmatrix}
    n
    \\ 
    x
    \end{bmatrix} = \frac{n!}{(n-x)!}$이 일어날 수 있는 총 경우의 수이고
    -. 베르누이 시행은 독립 시행이기 때문에 각 시행에서의 성공과 실패의 확률은 $p^{x} \cdot (1-p)^{n-x}$와 동등하다.

    3) 위에서 도출된 항들을 모두 결합하면, 이항분포의 PMF는 아래와 같다.
    pmf p(x) = $\begin{cases}
     \frac{n!}{x!(n-x)!}p^{x}(1-p)^{n-x}& \text{ if } x= \{0,1,2,...,n\}\\ 
     0 & \text{ else }
    \end{cases}$

    4) 이항분포의 mgf를 구하면 다음과 같다.

    ${(1)}$ $M(t)=E(e^{tx}) = \sum e^{tx}p(x) = \sum e^{tx}\frac{n!}{(n-x)!}\cdot p^{x}(1-p)^{n-x}$           
                                       $=\sum\frac{n!}{(n-x)!}\cdot(pe^{t})^{x}(1-p)(n-x)$           
                                       $=[(1-p)+pe^{t}]^{n}$

    ${(2)}$ 이를 이용하여 기댓값과 분산을 구하면
    $\mu$ $M'(0) = n \cdot [(1-p) + pe^{t}]^{n-1} \cdot pe^{t}|_{t=0} = n \cdot p$
    $var(x)$ $M''(0) = n \cdot (n-1) \cdot [(1-p) + pe^{t}]^{n-2} \cdot (pe^{t})^{2} + n \cdot [(1-p) + pe^{t}]^{n-1} \cdot pe^{t}|_{t=0}$ $ = n \cdot (n-1) \cdot p^{2} + np$ 이므로
                        $Var(x) = M''(0) - \mu^{2}$ 에서 $n(n-1)p^{2} + np - n^{2}p^{2} = np(1-p)$
  3. 음이항분포

    1) 음이항분포는 성공확률이 P인 베르누이 시행에서 성공과 실패가 랜덤하게 발생할 때, r번 성공을 n번째 시행에서 달성할 확률을 구한다

    2) 예를 들어, 정상적인 주사위를 10번 굴렸을 때 3이 나오면 성공, 그 외에는 실패라고 가정할 때 

    ${(1)}$ $p = 1/6$ 이고, 성공횟수 $r = 6$을 가정할 때, 이 실험을 10번째에 성공할 확률을 구할 수 있는 분포이다.

    3) PMF는 아래와 같은 절차로 유도한다

    ${(1)}$ Y를 r번째 성공하기 전까지 발생한 실패의 총 횟수라고 한다면, X = Y + r은 r회 성공하기 위해 수행한 총 횟수를 나타낸다.

    ${(2)}$ 이는 생각해보면 $y + r - 1$회까지 $r-1$번 성공 횟수를 기록하며, 바로 이번 시행(즉, $y + r$번 시도) 때 성공확률 p를 달성하였으므로
    -. y + r - 1회까지 r - 1번 성공할 확률에 현재의 성공 p를 결합한 PMF 꼴을 가지게 된다. 즉 
$pmf \ p(x) = \begin{bmatrix} \begin{bmatrix}
y+r-1
\\ 
r-1
\end{bmatrix} p^{r-1} (1-p)^{(y+r-1) - (r - 1)} \end{bmatrix} \cdot p = \begin{bmatrix}
y+r-1
\\ 
r-1
\end{bmatrix} p^{r} (1-p)^{y}$

 

'수리통계' 카테고리의 다른 글

14. 감마분포  (0) 2023.05.30
13. 푸아송 분포  (2) 2023.05.26
6-1. 다변량 확률변수의 변환  (0) 2023.05.16
11. 분산 - 공분산 행렬  (0) 2023.05.16
9. 독립인 확률변수  (0) 2023.05.13