일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- bayesian
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- Marketing Mix Modeling
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- Optimization
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 수리통계
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- mmm
- Media Mix Modeling
- 미적분 #사인과 코사인의 도함수
- bayesian inference
- 미적분
- lightweightmmm
- Today
- Total
목록분류 전체보기 (99)
문과생 네버랜드의 데이터 창고
양측검정 1) 가설검정에서 계속해서 확인했던 가설검정은 모두 한쪽 방향으로만 가설을 검정하는 단측검정이었다. ${(1)}$ 예를 들어, 마지막 예제에서 봤던것과같은 다음과 같은 가설이다 $$H_{0} : T_{1} = \omega_{0} \ vs \ H_{1} : T_{1} > \omega_{0}$$ ${(2)}$ 양측검정은 위와 같은 가설을 확장하여, 다음과 같은 가설을 검정할 수 있도록 한다 $$H_{0} : T_{1} = \omega_{0} \ vs \ H_{1} : T_{1} \neq \omega_{0}$$ -. '좌측이 크다'는 가설이 '같지 않다'로 바뀐것에 주목하자 2) (정규분포를 활용한) 평균에 대한 대표본 양측검정 ${(1)}$ X가 평균 $\mu$, 분산 $\sigma^{2}$를 가지..

가설과 가설검정 1) 가설이란? ${(1)}$ 가설, 특히 통계적 가설이란 모수 또는 분포에 대하여 연구자가 주장하는 내용을 말한다. -. 예를 들어서, 홈페이지의 새로운 UI에 대하여 '잠재적 사용자'란 모집단이 존재한다고 가정할 때 -. 사이트에 실제로 유입된 표본들의 (원본 / 개선안)의 클릭률 차이가 모집단에서도 마찬가지로 유의미할 것이라도 주장할 수 있다. 2) 가설 검정이란? ${(1)}$ 연구자가 주장한 가설이 실제로도 유의미한지 참 / 거짓을 판별하는 방법론을 가설검정이라고 한다. ${(2)}$ 가설 검정엔 귀무가설과 대립가설이라는 두 개념이 등장한다. -. 대립가설 : 연구가설이라고도 표현한다. 연구자가 관심을 갖고 있는(즉 연구자가 주창한) 가설을 의미한다. -. 귀무가설 : 영가설이라..

분위수란? 1) 앞서 우리는 확률변수 $[X_{1}, ..., X_{n}]$를 크기 순서대로 정렬하여 추론을 수행하는 순서통계량에 대해 알아보았다. ${(1)}$ 이제 떠올려볼 수 있는 자연스러운 다음 단계는, 순서를 구할수 있었으니 그 순서를 이용하여 확률변수들을 단계로서 구분지을 수 있는 구간값을 구하는 것이다. -. 예를 들어, 우리나라 복지제도에서 수급 대상자를 선정하는 주요 기준인 중위수(Median)는 우리나라 모든 국민 가구를 순서대로 정렬하였을 때 정확히 중간에 있는 사람의 소득을 의미한다. 2) 분위수의 정의와 공식 ${(1)}$ X를 연속형 누적확률함수(CDF) $F(x)$를 갖는 확률변수라고 하자. -. 이 때, $0 < p < 1$에 대하여 p순위 분위수는 다음과 같이 정의한다. $..
순서통계량이란 무엇인가? 1) 모수통계와 비모수통계 ${(1)}$ 지금까지 살펴본 통계적 추론은 모두 어떤 확률분포를 가정하고 논의를 진행해왔다 -. 이항분포, 정규분포 등 분포 가정에서 시작하여 이 분포에서 추출한 확률표본들을 기반으로 통계량을 정의하였다. -. 분포 가정이 없었다 하더라도, 그 확률표본들의 평균은 정규분포를 따른다는 중심극한정리에 의거해서 논의를 진행했기 때문에 확률분포에서 자유롭지 않다. -. 이처럼, 어떤 분포를 가정하고 통계적 추론을 수행하는 통계적 방법론을 모수통계라 한다. ${(2)}$ 모수통계의 맹점은, 매우 엄격한 통계적 가정을 만족해야 비로소 추론이 가능하다는 점이다. -. 표본들의 원 확률변수(즉, 모집단의 확률변수)가 어떤 분포를 따른다고 강력하게 가정이 가능하거나 ..

계속해서, 모수 $\theta$를 추정하는 문제로 들어가보자. 1) 우리가 추정하는 모수에 대한 추정량 $\widehat{\theta}$가 있다고 가정하자. ${(1)}$ 이 떄, 우리가 추정한 이 추정량 $\widehat{\theta}$가 정말 $\theta$에 대한 완전한(즉, 오차가 없는) 추정량일 확률은 낮다. -. 사실, $\theta$를 어떤 확률분포를 따르는 확률변수라고 가정한다면, 오차가 전혀 없을 확률 즉 $P(\theta = \widehat{\theta})$일 확률은 0과 같다.(정확한 지점에서의 확률은 0이다.) ${(2)}$ 아예 정확한 추정량을 구하는것은 불가능하지만, 매우매우 근접한 '좋은 품질의 추정량'을 구하는것은 충분히 가능하다. -. 이제, 관점을 바꿔서, 우리가 추정한 ..

추정량과 최대우도추정량 1) 추정량이란 모수를 추정케하는 통계량과 연관된 개념이다. ${(1)}$ 확률변수 X에서 추출한 확률표본 $[X_{1}, X_{2}, ..., X_{n}]$이 있다고 가정하고, 이 확률표본의 함수인 통계량을 $T = T($[X_{1}, X_{2}, ..., X_{n}]$)$라고 하자. -. 이 때, T로 모수 $\theta$를 추정할 수 있다면, 이 T를 모수 $\theta$에 대한 추정량이라고 표현한다. 2) 최대우도추정량이란 최대우도법이란 테크닉을 이용하여 구한 추정량이다. ${(1)}$ 우도(혹은 가능도, likelihood)란, 확률표본들의 실현값들이 주어졌을때(즉, 우리가 관찰 가능한 데이터가 주어졌을 때) 이 데이터가 특정 모수를 가진 분포에서 나왔을 척도를 나타낸다...

개요 1) 현대 통계학의 문제에서 대부분의 의문은 어떤 확률변수 X에 대하여 다음의 질문에 답을 얻는것이다. ${(1)}$ 어떤 확률변수 X에 대하여, 그 확률변수 X의 pdf(혹은 pmf)는 무엇일까? ${(2)}$ pdf(pmf)는 안다고 해도, 그 pdf(pmf)에서 나타나는 파라미터 $\theta$는 무엇일까? 2) 이 중, 두 번째 질문에 답변하기 위해 필요한 개념이 바로 표본과 통계량이다. 표본 1) 어떤 확률변수 X가 집합 $\omega$에 대해 pdf(혹은 pmf)를 정의 가능하다고 하자. ${(1)}$ 이 때, 확률변수 X와 동일한 분포를 가지면서, X를 통해 n번 샘플링한 [X_{1},X_{2}, ..., X_{n}]가 서로 독립일 경우 확률표본이라고 표현한다. -. 위에서 정의한 ①동..
T분포를 발견한 스튜던트가 T분포 증명 과정에서 파생시킨 따름 정리들 1) 다음의 네개 따름 정리를 한데 묶어 '스튜턴트의 정리'라고 표현한다. 2) 스튜던트의 정리는 추론통계에서 주로 사용되는 T검정은 물론이고 정규분포와 관련된 다양한 추론에 활용되므로 각각의 정리가 어떤 의미인지는 알고 넘어가는 것이 좋다. $X_{1}, X_{2}, ..., X_{n}$을 각각 평균 $\mu$와 분산 $\sigma^{2}$을 따르는 i.i.d인 확률변수라고 하자. 확률변수 $\overline{X} = \frac{1}{n}\sum_{i=}^{n}(X_{i})$ 그리고 $S^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(X_{i} - \overline{X})^{2}$ 이라고 정의할때, 아래의 정리는 참이다..