19. 우도와 최대우도추정량

Notice

Recent Posts

Recent Comments

Link

« 2026/02 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

문과생 네버랜드의 데이터 창고

19. 우도와 최대우도추정량 본문

수리통계

19. 우도와 최대우도추정량

K JI 2023. 6. 27. 20:16

추정량과 최대우도추정량
1) 추정량이란 모수를 추정케하는 통계량과 연관된 개념이다.

${(1)}$ 확률변수 X에서 추출한 확률표본 $[X_{1}, X_{2}, ..., X_{n}]$이 있다고 가정하고, 이 확률표본의 함수인 통계량을 $T = T($[X_{1}, X_{2}, ..., X_{n}]$)$라고 하자.
-. 이 때, T로 모수 $\theta$를 추정할 수 있다면, 이 T를 모수 $\theta$에 대한 추정량이라고 표현한다.

2) 최대우도추정량이란 최대우도법이란 테크닉을 이용하여 구한 추정량이다.

${(1)}$ 우도(혹은 가능도, likelihood)란, 확률표본들의 실현값들이 주어졌을때(즉, 우리가 관찰 가능한 데이터가 주어졌을 때) 이 데이터가 특정 모수를 가진 분포에서 나왔을 척도를 나타낸다.
-. 한편, 우도는 확률이 아니기 때문에 0 ~ 1 사이의 범위를 가질 필요는 없다. 1 초과의 수가 나올수도 있다.
-. 우도를 계산하기 위한 우도함수는 아래와 같이 나타낼 수 있다.

모수 $\theta$를 따르는 확률변수 X에서 추출한 확률표본 $[X_{1}, X_{2}, ..., X_{n}]$의 결합분포의 pdf를 아래와 같이 정의하자.
$$\prod_{i=1}^{n}f(x_{i};\theta)$$
이 때, 우도함수 $L(\theta)$는 아래와 같이 정의 가능하다
$$L(\theta) = \prod_{i=1}^{n}f(\theta;x_{i})$$
모수 $\theta$와 $x_{i}$의 위치가 바뀐것에 주목하자.
즉, 확률표본의 관측값 $x_{i}$이 주어졌을때의 모수 $\theta$에 대한 확률 함수의 결합이다.

${(2)}$ 최대우도법이란 어떤 분포가 가진 모수 $\theta$를 가장 잘 추정하도록 하는(= 우도가 가장 높은) 통계량을 제시하는 방법론이다.

데이터(파란색 히스토그램)가 주어졌을 때, 이 데이터는 어느 확률변수에서 추출되었을까?
평균을 78.6 -> 86.6 -> 88.6 -> 90.6 으로 움직이면서 우도(로그우도)를 계산하면
평균이 88.6일때 우도값은 55882로 가장 크다.

즉, 데이터로부터 우리는 이 데이터가 $N(88.6, 0.128^{2})$ 로부터 추출되었음을 추론해낼 수 있다.

${(3)}$ 최대우도법을 활용하여 최대우도추정량을 구하는 방법론은 아래와 같다.

우도함수를 정의한다. 즉
$$L(X; \theta) = \prod_{i=1}^{n}(x_{n};\theta)$$

우리의 목표는 $L(X; \theta)$를 최대화하는 $\theta$를 구하는 것이다.
즉, $\theta = Argmax[L(\theta)]$
라는 함수를 푼다.

한편, 우도함수를 그대로 활용하기에는 이 함수는 곱 $\prod$로 이루어져 있으므로 다루기가 매우 까다롭다.

로그함수는 단조함수이자 순증가하는 함수이고, 곱의 연산을 합의 연산으로 바꾸기 때문에 계산을 용이하게 한다.
다시 말해 $$l(x_{n} ; \theta) = log[L(\theta)]$$ 라고 할 때
$l(x_{n};\theta)$를 최대화 하는것은 $L(\theta)$를 최대화 하는것과 동치이다.
이를 특별히 로그우도함수라고 부른다.

최대우도추정값은
$\frac{\partial l(\theta)}{\partial \theta} = 0$
의 방정식을 풀어서 도출한다.

-. 물론, 정류점을 최대우도지점으로 도출한다는 아이디어는 우도함수 $L(\theta)$ 가 단조성을 가진다는 증명이 우선되여야 한다.
-. 우도함수가 단조성을 가진다는 증명은 대수의 법칙을 학습한 후 시도한다.

예시로 보는 최대우도추정법
1) $[X_{1}, ..., X_{n}]$을 다음 pdf를 따르는 분포에서 추출한 확률표본이라고 하자.

$$f(x;\theta) = \frac{1}{\sqrt{2\pi}\sigma} \cdot exp\{-\frac{1}{2}(\frac{x-\mu}{\sigma})^{2}\}$$
즉, 확률변수 X는 정규분포를 따른다.

${(1)}$ 모수 $\mu$에 대한 최대우도추정량을 구하라

$\theta = (\mu, \sigma)$의 벡터로 정의할 때
정규분포의 우도함수는 아래와 같이 정의 가능하다.
$$L(\theta;x_{i}) = \prod^{n} \frac{1}{\sqrt{2\pi}\sigma} \cdot exp\{-\frac{1}{2}(\frac{x_{i}-\mu}{\sigma})^{2}\}$$

이를 로그우도함수로 바꾸면
$$l(\theta;x_{i}) = log(\prod^{n} \frac{1}{\sqrt{2\pi}\sigma} \cdot exp\{-\frac{1}{2}(\frac{x_{i}-\mu}{\sigma})^{2}\})$$
$$ = \sum^{n} log(\frac{1}{\sqrt{2\pi}\sigma} \cdot exp\{-\frac{1}{2}(\frac{x_{i}-\mu}{\sigma})^{2}\})$$
$$= -\frac{n}{2}log(2\pi) - nlog\sigma - \frac{1}{2}\sum^{n}(\frac{x_{i} - \mu}{\sigma})^{2}$$

구한 로그우도함수를 우리가 원하는 $\mu$에 대하여 편미분하면
$$\frac{\partial l(\theta)}{\partial \mu} = -\sum^{n}(\frac{x_{i} - \mu}{\sigma} ) \cdot (-\frac{1}{\sigma}) = 0$$
위 방정식을 풀기위해 상수항을 전부 좌변으로 이항하면
$$ = -\sum^{n}(\frac{x_{i} - \mu}{\sigma} ) = 0 $$
$$ = -n\mu \cdot \sum^{n}(x_{i}) = 0$$
이제, 방정식을 $\mu$에 대한 식으로 정리하면
$$ \mu = \frac{\sum^{n}(x_{i})}{n} = \overline{x} $$

즉, 평균은 정규분포의 모수 $\mu$(모평균)의 최대우도추정량이다.

${(2)}$ 모수 $\sigma$에 대한 최대우도추정량을 구하라

위에서 구한 로그우도함수를 우리가 원하는 $\sigma$에 대하여 편미분하면
$$\frac{\partial l(\theta)}{\partial \sigma} = -\frac{n}{\sigma} + \frac{1}{\sigma^{3}} \sum^{n}(x_{i} - \mu)^{2} = 0$$
위 방정식을 풀기위해 상수항을 전부 좌변으로 이항하면
$$ = \frac{n\sigma^{3}}{\sigma} = \sum^{n}(x_{i} - \mu)^{2}$$

이제, 방정식을 $\sigma$에 대한 식으로 정리하면
$$ \sigma^{2}= \frac{\sum^{n}(x_{i} - \mu)^{2}}{n} $$

한편, 위에서 우리는 $\mu$의 최대우도추정량이 $\overline{x}$임을 밝혔으므로, 이를 대체하면

$$ \sigma^{2}= \frac{\sum^{n}(x_{i} - \overline{x})^{2}}{n} $$
즉, 표본분산은 모분산의 최대우도추정량이다.

'수리통계' 카테고리의 다른 글

21. 순서통계량 (0)	2023.06.29
20. 신뢰구간 (0)	2023.06.28
18. 확률표본과 모수, 그리고 통계량 (0)	2023.06.26
17-1 스튜던트의 정리 (0)	2023.06.23
17. T분포와 F분포 (0)	2023.06.22

'수리통계' Related Articles

문과생 네버랜드의 데이터 창고

19. 우도와 최대우도추정량 본문

19. 우도와 최대우도추정량

'수리통계' 카테고리의 다른 글

티스토리툴바