추천해주는 서비스보다 추천하지 않는 서비스를 찾는 것이 더 빠를 정도로 우리는 매일 추천을 받으며 살아갑니다. 오늘 입으면 좋을 옷, 빠르게 갈 수 있는 길, 맛집, 영화, 심지어 소개팅도 추천을 통해 이뤄집니다. 추천은 그 범위가 넓어졌을 뿐 아니라 굉장히 정교해졌습니다. 이렇게 추천시스템이 발전한데에는 사용자 기반의 데이터 수집이 가능해졌다는 점이 큽니다. 데이터 없이 추천도 없기 때문이죠.
그렇다면 어떤 데이터들을 바탕으로 추천시스템이 발전했을까요?
수 많은 데이터들이 있지만 추천 시스템 발전에 나름 혁혁한 공을 세운 데이터들이 있습니다.
사용자 입력정보
각자의 개성이 또렷한 요즘시대엔 유행하는 옷을 입지 않은 것보다 같은 옷을 입고 온 직장동료를 마주하는 것이 더 괴롭습니다. 모바일 디바이스가 시장을 주도하면서 개개인의 사용자기반 추천이 가능해졌습니다. 그래서 내가 추천 받은 옷이나 영화가 모든 사용자에게 동일하게 추천된다는 것을 알게되면 배신감 마저 듭니다.
한 번도 만나 본적 없는 익명의 사용자에게 추천을 해주어야 하다보니 서비스는 최대한 많은 입력정보를 얻어야 경쟁력이 있습니다. 서비스 기획자들은 아이디, 패스워드 뿐 아니라 성별, 연령, 거주지, 프로필 사진, 취향 등 사용자의 정보를 얻기위해 머리를 싸매고 고민하고 있죠.
평점
그러나, 사용자가 입력한 기본 정보만으로 추천율을 높일 수는 없습니다. 좋아하는 카테고리에 ‘IT’를 입력했다고 하더라도 IT내에 어떤 상품이나 서비스를 원할지는 모르니까요. 그래서 ‘평점’ 데이터가 등장합니다. 별점, 점수제, 좋아요/싫어요 등 그 형태는 다양하지만 사용자의 선호도를 정량적으로 파악할 수 있습니다. 1996년, 이 평점데이터를 바탕으로 사용자에게 책을 추천해준 회사가 있습니다. 바로’아마존(Amazon)’입니다.
아마존은 사용자에게 책을 판매했을 뿐 아니라 책을 읽은 후에 감상이 어떤지 사용자가 직접 별점을 매기도록 하였습니다. 수 많은 사용자들이 별점 매기기에 참여하였고 아마존은 이를 바탕으로 1998년 상품기반 협업필터링 (item-based collaborative flitering) 시스템을 공개하게 됩니다. 사용자 간의 유사성을 비교하는 협업필터링 시스템은 이후 좋아요와 같이 선호도를 지표로 하는 넷플릭스(Netflix)나 유튜브(YouTube) 등의 서비스에게도 큰 영향을 끼치게 됩니다.
후기
평점은 직관적입니다. 하지만 이유를 알려주지는 않습니다. 예를 들어, 어벤저스 영화의 평점이 동일하게 만점이더라도 A사용자는 아이언맨 때문에 B사용자는 헐크 때문에 만점을 주었을 수도 있습니다. 이런 경우, 평점보다는 어벤저스 시리즈 전체에 걸쳐서 좋아하는 인물이 등장하는 빈도수가 추천에 중요한 지표가 되는 것이죠.
평점에 대한 이유는 후기로 남깁니다. 2010년대에 들어 모바일로 사람들의 생활환경이 빠르게 옮겨가면서 어디서든 손쉽게 후기를 작성하게 되었고 후기의 양도 방대해졌습니다. 그리고 텍스트 마이닝, 벡터 값 추출 등의 인공지능 기술로 정성적인 자료를 정량화 할 수 있게 되어 작성된 후기로부터 사용자의 취향을 보다 명확하게 읽어낼 수 있게 되었습니다.
버드뷰가 운영하는 국내 화장품 리뷰앱 ‘화해’가 2019년 선보인 For You도 사용자의 후기를 기반으로 화장품을 추천하는 서비스입니다. 후기가 서비스 내에서 지니는 가치가 크기 때문에 후기를 바탕으로 상품과 서비스를 추천하는 시스템은 서비스 사용자의 만족도를 크게 향상 시킬 수 있어 다양한 서비스에서 주목 받고 있습니다.
발자취 (방문 데이터)
지금까지는 사용자가 직접 입력하는 데이터들을 살펴보았습니다. 그런데, 만약 입력 데이터가 전혀 없다면 어떨까요? 둘러보기만하는 사용자한테도 ‘추천’은 해주어야 하는데 말이죠. 이를 해결해주는 것이 콘텐츠 기반 필터링(Content-based filtering)입니다. 콘텐츠 기반 필터링은 상품이나 서비스 기반의 추천 시스템으로 사용자 관련 데이터가 없을 때, 사용자가 관심을 보였던 상품이나 서비스와 유사한 것들을 추천할 수 있도록 합니다. 기저귀에 관심을 보인 사용자가 있다면 유아용품을 추천해주는 것이죠. 이는 상품이나 서비스 조회수가 낮은 이용객, 가입이 되지 않은 방문자를 타겟으로 하기 좋은 추천 시스템입니다. 그래서 대부분의 기업들은 협업 필터링과 콘텐츠 기반 필터링을 함께 사용하는 하이브리드 필터링(Hybrid filtering)시스템을 사용합니다.
콘텐츠 기반 필터링은 사용자의 발자취를 기반으로 추천 뿐 아니라 타겟 광고 등을 가능하게 합니다. 이전에 잠깐 봤던 상품이나 서비스가 자신의 SNS나 온라인 기사 지면의 광고 배너에 등장할 수 있는 이유도 바로 이 방문 데이터 덕분입니다. 내가 어디를 방문했는지. 어떤 상품과 서비스에 잠깐 관심을 보였는지. 그 발자취가 웹 상에는 모두 로그(log)로 남아 있습니다.
추천은 더 다양한 데이터가 많이 쌓이면 쌓일수록 더욱 좋아집니다.
그렇다면, 이제는 어떤 유형의 데이터를 주목해야 할까요?
시선 데이터
“아까 지나쳤던 그 꽃무늬 드레스가 어디있지? 그거 괜찮아보였는데!”
쇼핑몰을 이용하는 고객이라면 이런 불만이 있었던 적이 있을 겁니다.
요즘 쇼핑몰은 최대한 많은 상품을 노출하기 위해 같은 페이지에서 동일한 상품을 보여주지 않기 때문에 기억 한 켠에 남아 있는 상품을 찾기가 어렵습니다.
그런데, 만약 사용자의 시선정보가 플랫폼에 저장되어 있다면 어떨까요?
쇼핑몰을 둘러본 후, 홈 화면을 클릭했을때 ‘그 꽃무늬 드레스’가 눈 앞에 나타난다면?
실제로 비주얼캠프는 101명의 20-30대 여성을 대상으로 시선기반 상품추천 프로젝트를 진행했습니다. 실시간으로 쇼핑몰 이용자의 시선을 추천 및 분석하여 상품을 추천해주는 것이었는데요. 테스터의 무려 71.2%가 추천된 페이지에 반응하였고, 70.3%가 시선기반 추천이 쇼핑몰에 적용된다면 좋을 것 같다고 답변했습니다.
시선 데이터는 가장 직관적인 행동 데이터로 사용자에게 별도의 참여를 유도하지 않고도 관심도를 파악할 수 있는 데이터입니다. 특히, 어떤 부분을 보고 있는지 (x,y좌표 값), 얼마나 집중해서 보고 있는지 (fixation 값,히트맵) 등을 정량적으로 추출하기 때문에 응시하고 있는 페이지 내에서 어떤 콘텐츠를 유심히 봤는지 파악하여 사용자 프로파일링을 정교하게 할 수 있습니다.
상세페이지를 예로 들어본다면, 제품이미지/가격정보/제품개요/상세설명/리뷰 등 페이지 구성 요소들에 대한 집중도를 파악할 수 있게 되는 것이죠. 쇼핑몰 MD나 기획자라면 이 구성 요소들이 고객의 구매 성향을 파악하는데 중요한 역할을 한다는 것을 이해하고 있을 것입니다. 시선데이터를 분석하면 사용자가 리뷰에 예민한지, 가격을 신경쓰는지 파악할 수 있게 됩니다.
Action기반의 기존 데이터는 한계가 있습니다. 진짜 고객의 마음을 읽으려면 Action하기 전에 고객의 관심사도 파악할 수 있어야 합니다.
시선 데이터를 활용하면 앞으로 쇼핑몰은 더 꼼꼼하게 추천 서비스를 만들어 상품 클릭률을 높일 수 있고, 구매요소에 맞춰 타겟 추천 서비스와 마케팅을 진행할 수 있을 것입니다. 그리고 이런 서비스를 이용하는 사용자는 더 편리해지겠죠. 말하지 않아도 원하는 것을 알고 있으니까요.
초 개인화 시대,
시선 데이터로 더 많은 고객을 만족 시킬 수 있는 추천 서비스를 만들어보는 것은 어떨까요?
<Reference>
– DBR 성공의 핵심요소로 떠오른 ‘추천시스템’ 비즈니스의 본질먼저 꿰뚫는 것을 추천
– [1] B. Jeon and H. Ahn, “사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용,” 지능정보연구, vol. 21, no. 2, pp. 1–18, Jun. 2015.
– B. Smith and G. Linden, “Two Decades of Recommender Systems at Amazon.com,” in IEEE Internet Computing, vol. 21, no. 3, pp. 12-18, May-June 2017