Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 수리통계
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- bayesian
- lightweightmmm
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- Media Mix Modeling
- 미적분 #사인과 코사인의 도함수
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- Marketing Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- Optimization
- mmm
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- bayesian inference
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
12. 이항분포 본문
- 시작 : 베르누이 분포
1) 이항분포는 베르누이 분포의 일반화 꼴이다. 따라서 시작은 베르누이 분포부터 확인해야한다
2) 표본공간이 성공($X(성공) = 1$) 혹은 실패($x(실패) = 0$)으로 이루어져 있는 이산형 분포
3) 이 때, 이항분포의 확률질량함수(PMF)는 아래와 같다
$p(x) = p^{x}(1-p)^{1-x} \quad where \ x = \{0,1\}$
4) 기댓값과 분산은
$\mu$ $E(X) = \sum_{0}^{1} xp(x) = 0 \cdot p^{0}(1-p)^{1} + 1 \cdot p^{1} = P$ $var(x)$ $E[(X-\mu)^{2}]=\sum(x-\mu)^{2}p(x) = (1-p)^{2}p^{1}(1-p)^{0} + (0-p)^{2}p^{0}(1-p)^{1} = p(1-p)$ - 이항 분포
1) 베르누이분포의 시행을 여러번 반복할 때 도출되는 분포
2) 베르누이 분포에서 유도하는 과정은 아래와 같다
${(1)}$ 확률변수 X를 베르누이 확률실험의 성공횟수라고 하자, 즉 $S=\{1,0,0,1,1,0\}$일 때, $X(s) = 3$
${(2)}$ 이 때, 이런 실험을 n번 반복될 경우, 성공이 x회일때 실패는 n-x회 일어난다.
${(3)}$ 즉, 아래와 같이 모델링이 가능하다
-. 경우의 수의 관점에서, 성공의 경우의 수는 $\begin{bmatrix}
n
\\
x
\end{bmatrix} = \frac{n!}{(n-x)!}$이 일어날 수 있는 총 경우의 수이고
-. 베르누이 시행은 독립 시행이기 때문에 각 시행에서의 성공과 실패의 확률은 $p^{x} \cdot (1-p)^{n-x}$와 동등하다.
3) 위에서 도출된 항들을 모두 결합하면, 이항분포의 PMF는 아래와 같다.pmf p(x) = $\begin{cases}
\frac{n!}{x!(n-x)!}p^{x}(1-p)^{n-x}& \text{ if } x= \{0,1,2,...,n\}\\
0 & \text{ else }
\end{cases}$
4) 이항분포의 mgf를 구하면 다음과 같다.
${(1)}$ $M(t)=E(e^{tx}) = \sum e^{tx}p(x) = \sum e^{tx}\frac{n!}{(n-x)!}\cdot p^{x}(1-p)^{n-x}$
$=\sum\frac{n!}{(n-x)!}\cdot(pe^{t})^{x}(1-p)(n-x)$
$=[(1-p)+pe^{t}]^{n}$
${(2)}$ 이를 이용하여 기댓값과 분산을 구하면$\mu$ $M'(0) = n \cdot [(1-p) + pe^{t}]^{n-1} \cdot pe^{t}|_{t=0} = n \cdot p$ $var(x)$ $M''(0) = n \cdot (n-1) \cdot [(1-p) + pe^{t}]^{n-2} \cdot (pe^{t})^{2} + n \cdot [(1-p) + pe^{t}]^{n-1} \cdot pe^{t}|_{t=0}$ $ = n \cdot (n-1) \cdot p^{2} + np$ 이므로
$Var(x) = M''(0) - \mu^{2}$ 에서 $n(n-1)p^{2} + np - n^{2}p^{2} = np(1-p)$ - 음이항분포
1) 음이항분포는 성공확률이 P인 베르누이 시행에서 성공과 실패가 랜덤하게 발생할 때, r번 성공을 n번째 시행에서 달성할 확률을 구한다
2) 예를 들어, 정상적인 주사위를 10번 굴렸을 때 3이 나오면 성공, 그 외에는 실패라고 가정할 때
${(1)}$ $p = 1/6$ 이고, 성공횟수 $r = 6$을 가정할 때, 이 실험을 10번째에 성공할 확률을 구할 수 있는 분포이다.
3) PMF는 아래와 같은 절차로 유도한다
${(1)}$ Y를 r번째 성공하기 전까지 발생한 실패의 총 횟수라고 한다면, X = Y + r은 r회 성공하기 위해 수행한 총 횟수를 나타낸다.
${(2)}$ 이는 생각해보면 $y + r - 1$회까지 $r-1$번 성공 횟수를 기록하며, 바로 이번 시행(즉, $y + r$번 시도) 때 성공확률 p를 달성하였으므로
-. y + r - 1회까지 r - 1번 성공할 확률에 현재의 성공 p를 결합한 PMF 꼴을 가지게 된다. 즉
$pmf \ p(x) = \begin{bmatrix} \begin{bmatrix} y+r-1 \\ r-1 \end{bmatrix} p^{r-1} (1-p)^{(y+r-1) - (r - 1)} \end{bmatrix} \cdot p = \begin{bmatrix} y+r-1 \\ r-1 \end{bmatrix} p^{r} (1-p)^{y}$ |
'수리통계' 카테고리의 다른 글
14. 감마분포 (0) | 2023.05.30 |
---|---|
13. 푸아송 분포 (2) | 2023.05.26 |
6-1. 다변량 확률변수의 변환 (0) | 2023.05.16 |
11. 분산 - 공분산 행렬 (0) | 2023.05.16 |
9. 독립인 확률변수 (0) | 2023.05.13 |