Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 미적분 #사인과 코사인의 도함수
- lightweightmmm
- Marketing Mix Modeling
- bayesian inference
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- mmm
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- Optimization
- 미적분
- bayesian
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- 수리통계
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- Media Mix Modeling
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
18. 확률표본과 모수, 그리고 통계량 본문
-
개요
1) 현대 통계학의 문제에서 대부분의 의문은 어떤 확률변수 X에 대하여 다음의 질문에 답을 얻는것이다.
${(1)}$ 어떤 확률변수 X에 대하여, 그 확률변수 X의 pdf(혹은 pmf)는 무엇일까?
${(2)}$ pdf(pmf)는 안다고 해도, 그 pdf(pmf)에서 나타나는 파라미터 $\theta$는 무엇일까?
2) 이 중, 두 번째 질문에 답변하기 위해 필요한 개념이 바로 표본과 통계량이다. - 표본
1) 어떤 확률변수 X가 집합 $\omega$에 대해 pdf(혹은 pmf)를 정의 가능하다고 하자.
${(1)}$ 이 때, 확률변수 X와 동일한 분포를 가지면서, X를 통해 n번 샘플링한 [X_{1},X_{2}, ..., X_{n}]가 서로 독립일 경우 확률표본이라고 표현한다.
-. 위에서 정의한 ①동일한 분포, ②독립일 경우를 특별히 i.i.d(Independent and Identically Distributed)라는 명칭으로 부른다.
-. iid 조건은 통계적 추론에서 매우 자주 가정하는 조건으로 개념을 이해하고 넘어가는 것이 좋다.
${(2)}$ 확률 표본 $[X_{1},X_{2}, ..., X_{n}]$에 대하여 현실에 결과로 도출된 값들을 실현이라고 표현한다.
-. 이 때, 이 실현값들은 $[x_{1},x_{2}, ..., x_{n}]$ 으로 표현한다. - 통계량
1) 확률 표본 $[X_{1},X_{2}, ..., X_{n}]$에 대한 변환 함수 $T =T([X_{1},X_{2}, ..., X_{n}])$를 정의하자. 이를 통계량 이라고 한다.
${(1)}$ 대표적인 통계량 몇가지를 뽑아보면 아래와 같다.
-. $\frac{x_{1} + x_{2} + ... + x_{n}}{n} = \overline{x}$, T가 평균을 구하는 함수일 때 이는 통계량이다.
-. $\sigma^{2} = \frac{\sum(x_{i} - \overline{x})^{2}}{n}$, 즉 T가 분산을 구하는 함수일 때 이는 통계량이다.
2) 한편, 이와 같은 논리를 확률 표본 $[X_{1},X_{2}, ..., X_{n}]$ 뿐만 아니라 그 원천인 확률변수 X에 대하여도 적용할 수 있다.
${(1)}$ 이 과정을 통해 도출된 $\theta = T(X)$를 모수라고 한다. - 불편 추정량
1) 우리의 목적은 다음과 같다.
${(1)}$ 현실에서 실현된 확률 표본들의 실현을 토대로
${(2)}$ 통계량을 만들고
${(3)}$ 이를 토대로 원천인 확률변수 X의 모수를 추정하는 것이다.
2) 이때, 통계량과 모수를 연결짓는 징검다리로서 불편추정량이란 개념이 등장한다.
${(1)}$ 불편추정량의 개념은 아래와 같다.
-. 모수 $\theta$를 갖는 $pdf(f; \theta)$를 가지는 확률변수 X를 정의하자.
-. 이 때, X에서 독립적으로 추출한(i.i.d) 확률표본 $[X_{1},X_{2}, ..., X_{n}]$를 정의하자.
-. 이 확률표본을 이용한 통계량 $T = T([X_{1},X_{2}, ..., X_{n}])$를 정의하자.
-. 이 때, 이 통계량의 기댓값 $E(T) = \theta$, 즉 그 기댓값이 모수와 같을경우 T를 $\theta$의 불편추정량 이라고 표현한다.
확률변수, 확률표본, 모수, 통계량, 불편추정량의 관계 예시도
확률변수 X가 베르누이 시행(동전을 던졌을때 앞면이면 1, 뒷면이면 0)을 따를 때,
그 확률표본 $X_{1}, ..., X_{n}$의 실현 $x_{1}, ..., x_{n}$의 평균 $\overline{x}$ 는
확률변수 X의 '앞면이 나올 확률' $\theta$ 의 불편추정량이다.
이는 뒤에서 증명할 것이며, 일단은 이런 관계들을 서로 맺고 있다고 확인하자
'수리통계' 카테고리의 다른 글
20. 신뢰구간 (0) | 2023.06.28 |
---|---|
19. 우도와 최대우도추정량 (0) | 2023.06.27 |
17-1 스튜던트의 정리 (0) | 2023.06.23 |
17. T분포와 F분포 (0) | 2023.06.22 |
16. 혼합분포 (0) | 2023.06.21 |