일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 미적분
- lightweightmmm
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- Marketing Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 미적분 #사인과 코사인의 도함수
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- bayesian
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- Optimization
- Media Mix Modeling
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- bayesian inference
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 수리통계
- mmm
- Today
- Total
문과생 네버랜드의 데이터 창고
추천 시스템이란 무엇인가? 본문
추천시스템이란?
1. 추천은 인류의 삶과 항상 함께해왔다
-. 예를 들어, '내가 지금 결혼 적령기인데 어떤 반려를 만나야 내가 행복해질 수 있을까?', '농사를 지어야하는데 지금 나한테 가장 적합한 품종은 무엇인가?'는 항상 고대부터 인류를 고민케 했던 질문이었다.
-. 이런 질문을 해결해주기 위해, 인류는 중매, 영매사, 혹은 대규모 치수를 담당하는 중앙 정부와 같은 추천 시스템을 통해 적절한 추천 결과를 얻고 삶의 최적화를 수행해 왔다.
2. 통계학, 수학과 같은 이론적 발달에 더해 컴퓨터 과학의 발전으로, 추천 문제는 점점 인간이 수행하는 영역에서 컴퓨터가 알고리즘으로 수행하는 영역으로 들어오기 시작했다.
-. 2000년부터 2015년까지, 인터넷 사용자는 738만명에서 3.2억명까지 폭증하였고, 약 43%의 인구는 어떤 방식으로든 인터넷 기반 서비스를 이용하고 있다는 의미이기도 하다.
-. 이미 아마존, 유튜브, 넷플릭스, 스포티파이, 링크드인, 페이스북같은 거대 빅테크 기업들은 추천시스템을 통해 수많은 고객들을 유인하였고, 그보다 더 많은 미디어 회사들이 고객들에게 추천 시스템을 제공하고 있다.
3. 추천 시스템은 고객의 선호와 같은 수많은 정보들을 긁어모아 고객이 가장 선호할만한 아이템을 예측한다.
-. 유저가 직접 선호도를 평가하는 명시적 정보(Explicity Information)와, 유저가 직접 선호도를 평가하진 않지만 유저의 행동으로 유추 가능한 암시적 정보(Implicity Information)을 활용한다.
-. 이 데이터는 유저가 매긴 평점, 혹은 구매 이력, 사이트내에서 이동한 여정(Journey)이 될 수도 있다.
4. 추천 시스템의 종류
-. 인구통계학 기반 필터링 : 사용자의 인구통계학적 데이터에 기반하여 선호를 추정하는 형태의 추천시스템이다. 사용자가 특정 인구집단에 속해있다면, 그 사용자는 인구집단의 선호를 따라갈 확률이 크다.
5. 컨텐츠 기반 필터링
-. 사용자가 아니라, 상품의 특성을 기반으로 가장 유사한 상품을 추천하는 형태의 추천 방법이다.
-. 컨텐츠 기반 필터링은 컨텐츠의 특성을 분석하는 Content Analyzer와 컨텐츠의 특성을 유저에 맞게 재가공 하는 Profile Learner, Profile Learner에서 도출된 특성값을 기반으로 유사 상품을 추천하는 Filtering Component 로 구분할 수 있다.
6. 협업 필터링
-. 같은 공간에 존재하지만 위치가 다른 데이터를 이용하여 추천을 수행하는 방법론
-. 예를 들어, 유저의 구매 내역이라는 같은 공간에 존재하는 위치가 다른 '유저 A'와 유저 B'의 경우, 둘이 충분히 유사하다면 A에게 B의 내역을 추천할 수 있다.
-. 유저의 선호를 바로 이용 가능하다는 장점이 있으나, 추천할만한 내역이 존재하지 않는 신규 유저나, 지나치게 내역이 적은 유저에 대해서는 추천을 수행할 수 없다는 콜드 스타트 문제 라는 단점이 존재한다.
7. 하이브리드 방법론
-. 컨텐츠 기반 필터링과 협업 기반 필터링은 각각 고유한 장단점을 보유하고 있기 때문
-. 이 둘을 결합하여 콜드스타트 문제를 해결하면서도 더 만족도가 높은 추천시스템을 만들려는 노력이 이어지고 있음
<참고 문헌>
- S.M Mahdi Seyednezhad et.al, “A Review on Recommendation Systems: Context-aware to Social-based”, Arxiv(2018),
- Zitao Liu Et.al, “Hierarchical Bayesian Personalized Recommendation”, Arxiv(2019)
- Keunho Choi et.al, “A hybrid online-product recommendation system: Combining implicit rating-based collaborative filtering and sequential pattern analysis”, Electronic Commerce Research and Applications Vol 11, Issue 4(2012), pp 309-317