문과생 네버랜드의 데이터 창고

추천 시스템이란 무엇인가? 본문

추천시스템

추천 시스템이란 무엇인가?

K JI 2023. 5. 7. 14:12

추천시스템이란?

1. 추천은 인류의 삶과 항상 함께해왔다
-. 예를 들어, '내가 지금 결혼 적령기인데 어떤 반려를 만나야 내가 행복해질 수 있을까?', '농사를 지어야하는데 지금 나한테 가장 적합한 품종은 무엇인가?'는 항상 고대부터 인류를 고민케 했던 질문이었다.
-. 이런 질문을 해결해주기 위해, 인류는 중매, 영매사, 혹은 대규모 치수를 담당하는 중앙 정부와 같은 추천 시스템을 통해 적절한 추천 결과를 얻고 삶의 최적화를 수행해 왔다.

지금 나의 위치와, 올해 기후를 봤을 때 어떤 품종을 뿌려야 풍족해질 수 있을것인가는 인류를 오랫동안 고민케했던 추천 문제였다.

2. 통계학, 수학과 같은 이론적 발달에 더해 컴퓨터 과학의 발전으로, 추천 문제는 점점 인간이 수행하는 영역에서 컴퓨터가 알고리즘으로 수행하는 영역으로 들어오기 시작했다.
-. 2000년부터 2015년까지, 인터넷 사용자는 738만명에서 3.2억명까지 폭증하였고, 약 43%의 인구는 어떤 방식으로든 인터넷 기반 서비스를 이용하고 있다는 의미이기도 하다.

-. 이미 아마존, 유튜브, 넷플릭스, 스포티파이, 링크드인, 페이스북같은 거대 빅테크 기업들은 추천시스템을 통해 수많은 고객들을 유인하였고, 그보다 더 많은 미디어 회사들이 고객들에게 추천 시스템을 제공하고 있다.

 

넷플릭스의 기존 추천시스템 성능을 10% 개선하는 최초의 사람에게 100만 달러의 상금을 주는 Netflix Prize는 현대 추천시스템에서 기념비적인 사건 중 하나였다.

 

3. 추천 시스템은 고객의 선호와 같은 수많은 정보들을 긁어모아 고객이 가장 선호할만한 아이템을 예측한다.
-. 유저가 직접 선호도를 평가하는 명시적 정보(Explicity Information)와, 유저가 직접 선호도를 평가하진 않지만 유저의 행동으로 유추 가능한 암시적 정보(Implicity Information)을 활용한다.
-. 이 데이터는 유저가 매긴 평점, 혹은 구매 이력, 사이트내에서 이동한 여정(Journey)이 될 수도 있다.

4. 추천 시스템의 종류
-. 인구통계학 기반 필터링 : 사용자의 인구통계학적 데이터에 기반하여 선호를 추정하는 형태의 추천시스템이다. 사용자가 특정 인구집단에 속해있다면, 그 사용자는 인구집단의 선호를 따라갈 확률이 크다.

Jill의 평점은 어떻게 될 것인가? 인구통계학적 필터링은 추정이 필요한 대상과 인구통계학적으로 가장 가까운 다른 사람의 평점을 기반으로 그 사람의 평점을 예측한다, 아마도, 714번지에 사는 여성(Gender = F)인 Jill은 평점을 '+'로 매길 확률이 크다. S.M Mahdi Seyednezhad et.al, 2018

5. 컨텐츠 기반 필터링

-. 사용자가 아니라, 상품의 특성을 기반으로 가장 유사한 상품을 추천하는 형태의 추천 방법이다. 
-. 컨텐츠 기반 필터링은 컨텐츠의 특성을 분석하는 Content Analyzer와 컨텐츠의 특성을 유저에 맞게 재가공 하는 Profile Learner, Profile Learner에서 도출된 특성값을 기반으로 유사 상품을 추천하는 Filtering Component 로 구분할 수 있다.

6. 협업 필터링
-. 같은 공간에 존재하지만 위치가 다른 데이터를 이용하여 추천을 수행하는 방법론
-. 예를 들어, 유저의 구매 내역이라는 같은 공간에 존재하는 위치가 다른 '유저 A'와 유저 B'의 경우, 둘이 충분히 유사하다면 A에게 B의 내역을 추천할 수 있다.

-. 유저의 선호를 바로 이용 가능하다는 장점이 있으나, 추천할만한 내역이 존재하지 않는 신규 유저나, 지나치게 내역이 적은 유저에 대해서는 추천을 수행할 수 없다는 콜드 스타트 문제 라는 단점이 존재한다.

7. 하이브리드 방법론

-. 컨텐츠 기반 필터링과 협업 기반 필터링은 각각 고유한 장단점을 보유하고 있기 때문

-. 이 둘을 결합하여 콜드스타트 문제를 해결하면서도 더 만족도가 높은 추천시스템을 만들려는 노력이 이어지고 있음

 

<참고 문헌>

- S.M Mahdi Seyednezhad et.al, “A Review on Recommendation Systems: Context-aware to Social-based”, Arxiv(2018),

- Zitao Liu Et.al, “Hierarchical Bayesian Personalized Recommendation”, Arxiv(2019)

- Keunho Choi et.al, “A hybrid online-product recommendation system: Combining implicit rating-based collaborative filtering and sequential pattern analysis”, Electronic Commerce Research and Applications Vol 11, Issue 4(2012), pp 309-317