문과생 네버랜드의 데이터 창고

21. 순서통계량 본문

수리통계

21. 순서통계량

K JI 2023. 6. 29. 18:13
  1. 순서통계량이란 무엇인가?
    1) 모수통계와 비모수통계

    ${(1)}$ 지금까지 살펴본 통계적 추론은 모두 어떤 확률분포를 가정하고 논의를 진행해왔다

    -. 이항분포, 정규분포 등 분포 가정에서 시작하여 이 분포에서 추출한 확률표본들을 기반으로 통계량을 정의하였다.
    -. 분포 가정이 없었다 하더라도, 그 확률표본들의 평균은 정규분포를 따른다는 중심극한정리에 의거해서 논의를 진행했기 때문에 확률분포에서 자유롭지 않다.
    -. 이처럼, 어떤 분포를 가정하고 통계적 추론을 수행하는 통계적 방법론을 모수통계라 한다.

    ${(2)}$ 모수통계의 맹점은, 매우 엄격한 통계적 가정을 만족해야 비로소 추론이 가능하다는 점이다.

    -. 표본들의 원 확률변수(즉, 모집단의 확률변수)가 어떤 분포를 따른다고 강력하게 가정이 가능하거나
    -. 어떤 분포를 따르는지 모른다 하더라도, 샘플수가 충분히 많아 그 평균(과 연관된 통계량) 중심극한정리에 의해 정규분포로 가정할 수 있거나
    -. 위 두가지 중 한가지 가정을 만족하지 못할경우 모수통계는 잘못된 검정결과를 낼 가능성이 크다.

    ${(3)}$ 모수에 대한 가정을 하지 않을수 있다면, 이런 엄격한 가정에서 자유로워질 수 있다. 모수에 대한 가정을 하지 않는다는 점에서, 이런 방법론들을 비모수 통계라고 부른다.

    2) 순서통계량과 비모수통계
    ${(1)}$ 순서통계량은 대표적인 비모수통계로, 확률 표본들의 순서를 이용하여 통계적 추론을 수행한다.
    -. 엄밀한 정의는 아래와 같다.
    $pdf \ f(x)$를 가지는 연속형 확률분포를 따르는 확률변수 X에서
    확률표본 $[X_{1}, ..., X_{n}]$를 독립적으로 추출(i.i.d 가정)했다고 하자.

    $[Y_{1}, ..., Y_{n}]$을 $[X_{1}, ..., X_{n}]$을 크기 순서대로 오름차순으로 재배열한 확률변수라고 하자.

    이 때, 만약에 운이 좋아 [x_{1}, ..., x_{n}]이 순서대로 배열되었다고 가정했을 때 $Y_{n}$의 역함수는
    $x_{1} = y_{1}, ..., x_{n} = y_{n}$ 으로 정의 가능하고,
    이때의 야코비안은 다음과 같다.

    $$|J| = det\begin{vmatrix}
    \frac{\partial x_{1}}{\partial y_{1}} & \dots & \frac{\partial x_{1}}{\partial y_{n}} \\ 
    \vdots & \ddots  & \vdots \\ 
    \frac{\partial x_{n}}{\partial y_{1}}& \dots & \frac{\partial x_{n}}{\partial y_{n}}  
    \end{vmatrix} = det\begin{vmatrix}
    1 & \dots & 0 \\ 
    \vdots & \ddots_{1}  & \vdots \\ 
    0 & \dots & 1  
    \end{vmatrix} $$ = 1

    한편, $y_{1}, ..., y_{n}$의 순서는 오름차순으로 고정되어 있으나,
    $[x_{1}, ..., x_{n}]$ 이 배열되는 순서는 $n!$만큼의 경우의 수가 존재한다.

    따라서, 이를 반영하고  $y_{n}$에 대한 결합분포로 pdf를 나타내면

    $$g(y_{1}, y_{2}, ..., y_{n}) = n! f(y_{1})f(y_{2})\dots f(y_{n})$$ 
    이 결합분포를 따르는 확률변수를 이용한 통계량을 순서통계량이라고 한다.
     

'수리통계' 카테고리의 다른 글

23. 가설검정  (0) 2023.07.03
22. 분위수와 Q-Q plot  (0) 2023.06.30
20. 신뢰구간  (0) 2023.06.28
19. 우도와 최대우도추정량  (0) 2023.06.27
18. 확률표본과 모수, 그리고 통계량  (0) 2023.06.26