Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- bayesian inference
- 수리통계
- mmm
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- Optimization
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- lightweightmmm
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 미적분 #사인과 코사인의 도함수
- bayesian
- Media Mix Modeling
- Marketing Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
21. 순서통계량 본문
-
순서통계량이란 무엇인가?
1) 모수통계와 비모수통계
${(1)}$ 지금까지 살펴본 통계적 추론은 모두 어떤 확률분포를 가정하고 논의를 진행해왔다
-. 이항분포, 정규분포 등 분포 가정에서 시작하여 이 분포에서 추출한 확률표본들을 기반으로 통계량을 정의하였다.
-. 분포 가정이 없었다 하더라도, 그 확률표본들의 평균은 정규분포를 따른다는 중심극한정리에 의거해서 논의를 진행했기 때문에 확률분포에서 자유롭지 않다.
-. 이처럼, 어떤 분포를 가정하고 통계적 추론을 수행하는 통계적 방법론을 모수통계라 한다.
${(2)}$ 모수통계의 맹점은, 매우 엄격한 통계적 가정을 만족해야 비로소 추론이 가능하다는 점이다.
-. 표본들의 원 확률변수(즉, 모집단의 확률변수)가 어떤 분포를 따른다고 강력하게 가정이 가능하거나
-. 어떤 분포를 따르는지 모른다 하더라도, 샘플수가 충분히 많아 그 평균(과 연관된 통계량) 중심극한정리에 의해 정규분포로 가정할 수 있거나
-. 위 두가지 중 한가지 가정을 만족하지 못할경우 모수통계는 잘못된 검정결과를 낼 가능성이 크다.
${(3)}$ 모수에 대한 가정을 하지 않을수 있다면, 이런 엄격한 가정에서 자유로워질 수 있다. 모수에 대한 가정을 하지 않는다는 점에서, 이런 방법론들을 비모수 통계라고 부른다.
2) 순서통계량과 비모수통계
${(1)}$ 순서통계량은 대표적인 비모수통계로, 확률 표본들의 순서를 이용하여 통계적 추론을 수행한다.
-. 엄밀한 정의는 아래와 같다.
$pdf \ f(x)$를 가지는 연속형 확률분포를 따르는 확률변수 X에서
확률표본 $[X_{1}, ..., X_{n}]$를 독립적으로 추출(i.i.d 가정)했다고 하자.
$[Y_{1}, ..., Y_{n}]$을 $[X_{1}, ..., X_{n}]$을 크기 순서대로 오름차순으로 재배열한 확률변수라고 하자.
이 때, 만약에 운이 좋아 [x_{1}, ..., x_{n}]이 순서대로 배열되었다고 가정했을 때 $Y_{n}$의 역함수는
$x_{1} = y_{1}, ..., x_{n} = y_{n}$ 으로 정의 가능하고,
이때의 야코비안은 다음과 같다.
$$|J| = det\begin{vmatrix}
\frac{\partial x_{1}}{\partial y_{1}} & \dots & \frac{\partial x_{1}}{\partial y_{n}} \\
\vdots & \ddots & \vdots \\
\frac{\partial x_{n}}{\partial y_{1}}& \dots & \frac{\partial x_{n}}{\partial y_{n}}
\end{vmatrix} = det\begin{vmatrix}
1 & \dots & 0 \\
\vdots & \ddots_{1} & \vdots \\
0 & \dots & 1
\end{vmatrix} $$ = 1
한편, $y_{1}, ..., y_{n}$의 순서는 오름차순으로 고정되어 있으나,
$[x_{1}, ..., x_{n}]$ 이 배열되는 순서는 $n!$만큼의 경우의 수가 존재한다.
따라서, 이를 반영하고 $y_{n}$에 대한 결합분포로 pdf를 나타내면
$$g(y_{1}, y_{2}, ..., y_{n}) = n! f(y_{1})f(y_{2})\dots f(y_{n})$$
이 결합분포를 따르는 확률변수를 이용한 통계량을 순서통계량이라고 한다.
'수리통계' 카테고리의 다른 글
23. 가설검정 (0) | 2023.07.03 |
---|---|
22. 분위수와 Q-Q plot (0) | 2023.06.30 |
20. 신뢰구간 (0) | 2023.06.28 |
19. 우도와 최대우도추정량 (0) | 2023.06.27 |
18. 확률표본과 모수, 그리고 통계량 (0) | 2023.06.26 |