추천 시스템 Basic Review
1. 추천 시스템 등장
- 인터넷은 폭발적인 성장과 수많은 정보가 쏟아지는 공간
- 인터넷 관련 비즈니스 활성화
- e-Business, e-Commerce 등
- 수많은 정보(+데이터)로 사용자가 적절한 결정을 내리기 어려움
2. 추천시스템 정의
- 사용자(User)로부터 선호도(preference)여부를 데이터화
- Explicit Feedback(평점 등)
- Implicit Feedback(사용자의 행동 패턴 등)
- 사용자의 선호도와 제한사항(constraints)를 바탕으로 가장 적절한 아이템 점수 계산
- 사용자에게 가장 관련 있는 아이템 순서대로 리스트(list) 형태로 제시
3. 추천시스템 연구 현황
- 정보검색(Information Retrieval) 분야와 비슷하지만, 비교적 새로운 연구 분야
- 최근 다양한 형태의 추천시스템 연구 진행중(-ing)
- 여러 기업과 학회에서 다양하게 연구 진행중(-ing)
- SIGIR, WWW, ACM RecSys, IEEE 등
- 유튜브, 넷플릭스, 왓챠, IMDB, 쿠팡, 아마존, Last.FM, 멜론 등
- Netflix Prize 추천 대회
❓ 추천 시스템을 왜 사용해야 할까?
서비스 제공자는 추천시스템을 사용하고 싶은 다양한 이유가 있을 수 있다.
1. 더 많은 아이템을 판매하 수 있다.
- 상업, 기업에서 추천시스템을 사용하는 가장 큰 이유
2. 더 다양한 아이템을 판매할 수 있다.
- 소비자가 보지 못한 상품을 판매할 수 있다.
3. 소비자 만족도가 증가한다.
- 플랫폼을 사용하면서 만족도가 증가하고, 플랫폼에 더 머무르는 이유가 된다.
4. 충성도 높은 고객이 증가한다.(개인적으로 가장 큰 이유라고 생각)
5. 고객이 원하는 것이 무엇인지 알 수 있다.(니즈 파악)
- 데이터가 쌓이면 쌓일 수록 추천 알고리즘의 성능 향상
=> 종합적으로 보면 유저 경험을 향상시켜서 서로 연관되어 맞물려 나타나는 결과들 같다. 유저 경험을 향상시킨다는건 뭘까?
추천 시스템 활용 예시
- 넷플릭스 콘텐츠 추천
- 계정 생성시 선택된 '좋아하는 컨텐츠'를 기반으로 콘텐츠 추천
- 인스타그램 팔로우 추천
- 팔로잉하고 있는 계정 유형과, 피드에서 자주 클릭한 계정을 분석해 피드에 광고 노출
- 계정 팔로우할 경우 해당 계정과 비슷한 계정 추가적으로 추천
- 쿠팡 상품 추천
- 구매 목록, 상품 검색 키워드, 클릭한 상품을 기반으로 다양한 상품 추천
추천 시스템 데이터의 종류
Items | Users | Transactions |
추천할 항목 | 여러 목적과 특징을 갖는 집단 | 유저와 아이템간의 상호 작용 |
가치와 데이터의 복잡도에 따라 구분할 수 있다. | 행동 패턴 등 으로 유저 모델링 | 유저가 인터넷에 남긴 로그에서 중요한 정보 추출 |
Low: 뉴스, 책, 영화 등 | 협업 필터링: 여러 아이템에 대한 평점 리스트 | 해시태그, 평점, Implicit한 정보 모두 활용 가능 |
High: 금융, 상품, 직업, 여행 등 | 사회적인 요인을 활용한 추천 시스템 등 |
추천 시스템이 풀고자 하는 문제
1. 랭킹 문제
- 특정 유저가 특정 아이템에 대한 평점(or 점수)을 정확하게 예측할 필요 없음
- 특정 아이템을 좋아할만한 Top-K 유저를 선정할 수 있음
- 특정 유저가 좋아할만한 Top-K 아이템을 선정할 수 있음
2. 예측 문제
- 유저 - 아이템 조합에서 평점(or 점수)를 예측
- 유저 - 아이템 행렬을 채우는 문제
- 유저(m명) - 아이템(n개)의 m x n 행렬, 그러나 비어있는 부분 존재(sparse한 데이터)
- 관측값(Observed value)은 모델 학습에 사용
- 결측값(Missing value)는 모델 평가에 사용
'Recommendation System' 카테고리의 다른 글
추천시스템의 한계 (0) | 2023.04.21 |
---|---|
추천 시스템의 종류 (1) | 2023.04.13 |
Introduction to Recommend System (0) | 2023.04.13 |