일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- bayesian
- Media Mix Modeling
- lightweightmmm
- Optimization
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- 수리통계
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- bayesian inference
- mmm
- Marketing Mix Modeling
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- 미적분 #사인과 코사인의 도함수
- Today
- Total
목록분류 전체보기 (99)
문과생 네버랜드의 데이터 창고

다중비교의 의미와 필요성 1) 분산분석과의 관계 ${(1)}$ 분산분석을 살펴보면서, 분산분석이 다음의 가설을 검정한다는것을 보였다 다음의 가설을 검정하고자 한다. $$H_{0} : \mu_{1} = \mu_{2} = \dots \mu_{b} \ VS \ H_{1} : 적어도 \ 하나는 \ 같지 \ 않다$$ ${(2)}$ 확률변수 $X_{1}, \dots, X_{n}$ 에 대하여 분산분석 결과 가설 $H_{1}$을 채택했다고 가정하자. -. 이 때, 우리가 알 수 있는 정보는 그저 '적어도 평균 $\mu_{j}$ 중 하나는 같지 않다'는 정보뿐이다. -. 구체적인 인사이트를 얻기 위해서는, 어떤 확률변수 사이에 유의미한 차이가 있는지를 구체적으로 확인해야한다. ${(3)}$ 가장 직관적으로 떠올려볼 수 ..
비중심 카이스퀘어 분포 1) 카이제곱 분포와의 비교 ${(1)}$ 앞서, 카이제곱 분포를 살펴보며 $N(\mu, \sigma^{2})$을 따르는 확률변수들의 2차형식 $$V = \frac{(X - \mu)^{2}}{\sigma^{2}}$$은 $x^{2}(1)$을 따름을 보였다. ${(2)}$ 이는 $\mu$라는 평균을 갖는 확률변수 X를 $N(0,1)$을 따르는 표준정규분포로 변환한 후 그 제곱을 취한 것이라 볼 수 있다. ${(3)}$ 이제, 자연스럽게 들 수 있는 의문은 다음과 같다. -. 그렇다면, 평균을 0으로 스케일하지 않은, 즉 다음과 같은 확률변수는 어떤 분포를 따를 것인가? $$V' = \frac{(X)^{2}}{\sigma^{2}}$$ -. 위 변환확률변수는 굳이 표현하자면 $N(\mu,..
분산분석이란 무엇인가? 1) 분산분석이란 2개 이상의 확률변수간에 평균 차이를 그 분산을 이용하여 검증하는 분석 방법론이다. ${(1)}$ 왜 평균 차이를 검정하는데 (표본)분산을 이용하는지는 아래의 일원배치 분산분석 유도를 보면 이해할 수 있다. -. 가설 검정에 대한 우도비함수를 정의하면서 정리하면 결국에는 분자 분모 모두 표본분산만이 남게 된다. -. 표본 분산의 비율로 정의된 이 통계량은 분자 분모의 표본분산식이 $X^{2}$를 따른다고 할 때, 그 비율로서 정의되는 F분포를 활용한다. 2) 분산분석을 수행하기 전에 만족해야하는 조건은 아래와 같다. ${(1)}$ 각 확률변수는 정규분포를 따라야한다 : 구체적으로는, 분산분석 모델을 적합하고 나서 그 잔차가 정규분포를 따라야 한다. -. 마찬가지로..
2차형식이란? 1) 수학에서 2차형식이란 항이 모두 2차인 동차 다항식을 의미한다. ${(1)}$ 예를 들면 아래와 같은 경우이다. $$4x^{2} + 2xy - 3y^{2}$$ -. 위 다항식의 경우, 변수 x와 y에 대하여 2차 형식이다. 2) 구체적으로는, 이차형식은 아래와 같은 형태로 나타낼 수 있는 형태를 의미한다. ${(1)}$ 선형결합 형식으로 나타낼 때 -. $q_{A}(x_{1}, \dots x_{n}) = \sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}x_{i}x_{j}$ ${(2)}$ 행렬 형식으로 나타낼 때 -. $q_{A}(x_{1}, \dots, x_{n}) = x^{T}Ax$ 3) 특히, 행렬형식으로 나타낼 때 행렬 A의 고유 분해 결과에 따라 성질이 달라진다. ..
최소최대 문제를 풀기 1) 최소최대 문제란, 검정과 관련된 기각역의 최소 및 최대를 결정하는 방법론을 의미한다. 2) 다음과 같이 도출할 수 있다. ${(1)}$ 확률표본 $[X_{1}, \dots, X_{n}]$과 관련된 어떤 함수를 다음과 같이 정의하자 $$\delta = u(X_{1}, \dots X_{n})$$ 이 함수는 다음과 같은 검정을 수행할때 활용하는 함수이다. $$H_{0} : \theta = \theta_{1} \ vs \ H_{1} : \theta = \theta_{2}$$ 이 때, 이 함수와 관련된 손실함수를 정의하자. 즉, 함수 $\delta$에 대하여 ①정답인 경우 : $\epsilon(\theta, \delta = \theta_{1}) = 0$ 이고 $\epsilon(\thet..
축차확률비 검정이란 무엇인가? 1) 앞서 우도비 검정을 이용하여 균일최강력검정을 수행하는 방법론을 살펴보았다. ${(1)}$ 우도함수는 계속해서 다음과 같이 정의하였다. n이 표본의 갯수라고 할 때 $$L(\theta;n) = f(x_{1};\theta) \cdot f(x_{2};\theta) \dots f(x_{n};\theta)$$ ${(2)}$ 위 우도식을 이용한 우도비 검정은 최량 기각역을 가진다는것을 네이만-피어슨 정리를 이용해 보였다. 즉 $$\frac{L(\theta_{H0};n)}{L(\theta_{n};n)} \leq k$$의 형태로 나타나는 우도비검정은 최량기각역을 가지고, 이를 이용해 최강력검정을 수행할 수 있다. 2) 그러나, 현실에서는 다음의 문제가 발생할 수 있다. ${(1)}$..

최강력 검정의 정의 1) 가설검정과 최강력검정(Most Powerful tests) ${(1)}$ 가설 검정과 관련된 몇가지 개념들을 이전에 정리했었다. 가설검정과 기각역, 가설검정의 오류와 검정력에 대한 개념이 그것이다. ${(2)}$ 이제, 이 개념들을 발전시켜서 '가장 효율성이 높은 가설 검정 방법'을 도출하는 방법론을 배운다. 아래 개념들을 복습하자. 가설 검정 ${(1)}$ 연구자가 주장한 가설이 실제로도 유의미한지 참 / 거짓을 판별하는 방법론을 가설검정이라고 한다. ${(2)}$ 가설 검정엔 귀무가설과 대립가설이라는 두 개념이 등장한다. -.대립가설: 연구가설이라고도 표현한다.연구자가 관심을 갖고 있는(즉 연구자가 주창한) 가설을 의미한다. -.귀무가설: 영가설이라도고 표현한다. 대립가설에 ..
최소충분통계량 1) 최소충분통계량이란? ${(1)}$ 하나의 분포에 대하여 충분통계량은 여러개가 존재할 수 있다. -. 그러면, 전체 표본의 성질을 매우 잘 보존하면서도 요약의 수준이 높은 가장 최소의 충분통계량은 무엇인가? -. 여기에 대하여, 다음의 사고실험을 계획해 볼 수 있다. 어떤 분포에 대하여 충분통계량 $S(X)$가 존재한다고 하자. 그리고, 전지전능한 통계의 신이 이 분포의 모든 충분통계량 집합 $T'(X) = \{t(x;\theta) | \theta \in \Omega\}$를 제시했다고 하자. 만약, $S(X)$가 최소한의 충분통계량이라면, 우리는 다음의 꼴로 모든 $T'(X)$에 대하여 나타낼 수 있다. $$S(X) = u(T'(X))$$ 물론, 그 역은 성립하지 않는다. -. 만약, ..