본문 제목

네이버 뉴스 추천 알고리즘 이해하기(AiRS)

디지털 마케팅/디지털 언론 홍보

by 노엘(Noelle) 2021. 7. 28. 13:23

본문

출처 : NAVER Search and Tech

국내 뉴스 소비가 가장 활발하게 이루어지고 있는 네이버 뉴스, 국내 언로 홍보 마케팅 전략에서 무시할 수 없는 마케팅 영역인 것은 의심의 여지가 없을 것입니다. 네이버 뉴스 추천은 몇 해 전 일부 뉴스 배치에 관련한 이슈도 있었으나, 현재 대부분의 국내 온라인 뉴스 소비자들 대부분 네이버 뉴스를 참고할 것이라고 무리 없이 예상할 수 있습니다. 최근 몇 년간 네이버는 사용자 경험에 대하여 AI와 빅데이터를 활용한 개선 작업을 꾸준히 진행하였으며 뉴스 추천을 통해 사용자에게 맞춤 기사 정보를 제공하고 있습니다. 국내 언론 홍보 마케팅 차원에서 뉴스 추천의 알고리즘을 이해하는 것은 마케터가 국내 PR에 대하여 효과적인 전략을 구성하는데 도움이 될 것 같아 이 글을 올립니다.

(하기 내용은 NAVER Search and Tech 블로그의 내용을 토대로 작성하였고, 뉴스 자료의 신뢰도에 대하여 다루는 것이 아님을 참고해주세요.)

 

네이버 뉴스 추천 고려사항과 노출 영역

네이버는 하루에도 1,300만 명에 달하는 사용자가 방문하여 매일 2만 5천 건의 뉴스 기사들을 언론 언론부터 제공받습니다. 국내 뉴스 플랫폼 중 가장 많은 기사를 다루고 있으며 소비되고 있습니다. 이 수많은 기사를 수많은 사람들이 사용하고 있지만, 각 사용자들마다 추천되는 뉴스는 다릅니다. 어떤 부분을 고려하고 어떤 원리로 노출이 되는 것일까요?


네이버 뉴스추천 고려사항

- 사용자 선호도 예측

- 뉴스 품질 측정(자동화+수동)

- 시의 적절성 및 이슈성 감지 : 시의성 기사와 공통 기사 구분

- 매체 별 시스템 구조


뉴스 추천이 이루어지는 영역

- 모바일 MY뉴스 전 영역 (http:////m.naver.com/)

- PC 뉴스홈 '헤드라인 뉴스' (https://news.naver.com/main/home.nhn)

- 모바일/PC 섹션(정치/경제/사회/생활/세계/IT)홈 상단의 '헤드라인 뉴스' 

- PC 우측영역의 '분야별 주요 뉴스'

- 모바일 기사본문 하단 '함께 볼만한 뉴스'

출처 : NAVER Search and Tech

 

네이버 뉴스추천 알고리즘 AiRS

네이버 뉴스추천 시스템의 목적은 사용자들의 관심분야를 파악하여 원하는 컨텐츠를 다양하게 보여줄 수 있는 기술 기반 서비스 제공이 목적입니다. 이에 사용되는 시스템(알고리즘)은 AiRS라고 불리며 ‘AI Recommender System’의 약자라고 보시면 됩니다. 원리는 아래와 같습니다.

협력 필터(Collaborative Filtering) : 사용자들의 컨텐츠 소비 패턴을 분석합니다. 협력 필터를 통해 나와 같은 컨텐츠를 본 사람들이 많이 보는 컨텐츠를 기반으로 추천이 됩니다. 

출처 : NAVER Search and Tech

인공신경망(RNN)기반의 QM(Quality Model) : 컨텐츠를 소비한 순서까지 고려한 딥러닝

출처 : NAVER Search and Tech

우선 알고리즘은 사용자가 소비한 문서들과 그 순서를 확인(Document Sequence)하고 해당 문서들을 시스템에 보내줍니다(Doc2Vec 문서 임베딩). 인공신경망은 전달받은 문서들과 순서들을 기반으로 관련된 다른 컨텐츠를 찾아봅니다(LSTM Layer). 이후 사용자가 소비한 문서 외에 추천할 문서를 구분하여 사용자에게 추천합니다.
참고로 사용자가 AiRS를 끄면 뉴스 추천은 뉴스속보 기사로 대체됩니다. 

 

네이버 뉴스 추천 품질 판단 기준

그렇다면, 앞서 말한 뉴스의 품질 판단 기준은 무엇이 있을까요?
문서의 품질은 사용자 피드백(기사 클릭수, 체류시간)을 고려하는 QE모델을 통해 예측 적용됩니다. 더불어 기사가 충실한 내용을 담고 있는지를 Deep Neural Network 기반의 모델로 판단하게 되며, 이 모델은 아래 고려요소를 입력받아 품질 점수를 추론합니다.

- 기사 제목

- 본문

- 기자정보

- 섹션 정보

- 컨텐츠 타입 정보

- 이미지 혹은 동영상 관련 정보

 

AiRS 알고리즘에 관련한 주요 QnA

AiRS 알고리즘의 경우 뉴스 추천이라는 민감한 영역을 담당하는 만큼 사용자들의 알고리즘 신뢰성에 대한 의문들이 제기되었으며 네이버에서는 이러한 의문들에 대하여 아래와 같이 답변하고 있습니다.

(인터애드의 의견이 아니며 NAVER Search and Tech을 통해 네이버가 공개한 QnA 내용을 인터애드에서 각색한 것입니다. 원본 내용은 컨텐츠 아래 링크를 통해 확인해 주세요)

 

기획/심층기사보다 속보/이슈성 기사가 많이 보이는 이유
네이버 답변) 기본적으로 클릭이 많이 발생한 기사가 추천될 확률이 높다. 그러나 클릭이 많지 않더라도 과거 이슈가 되어 클릭이 많았거나 연관성이 있으면 노출될 수 있다. 또한 사회적 관심이 클 경우 시의성을 고려해 노출될 수 있다. 단, 전송량 대비 심층/기획 기사가 절대적으로 부족하므로 노출이 어려운 부분은 한계점이다.

정치적 특정 성향에 유리하게 추천한다는 의견
네이버 답변) 사건을 기준으로 추천 데이터와 로그에 의해 노출되는 것이며, 알고리즘 자체에는 기사 및 사용자의 정치성향을 특정 짓거나 구분하지 않는다. 기술적으로도 불가능하다. 모든 결과는 이를 소비하는 사용자의 상호적인 결과이다.

무심코 클릭한 기사가 자주 추천된다는 의견, 개인화 추천에 언제까지 적용되는가?
네이버 답변) 무심코 클릭하였다고 하여도 반복적으로 클릭하였다면 사용자의 관심도가 크다고 알고리즘은 판단함. 그리고 해당 클릭에 대하여 비슷한 주제가 추천되는 것은 적용은 최장 2주까지도 진행될 수 있습니다. 

댓글, 감정표현, ‘이 기사를 추천합니다’가 개인화에 영향을 주는가?
네이버 답변) ‘이 기사를 추천합니다’는 개인화에 영향을 주지만, 댓글과 감정표현에 대한 것은 적용되지 않는다.

필터 버블 (관심사에 맞추어 필터링된 정보로 인해 편향된 정보에 갇히는 현상)
네이버 답변) AiRS에는 비개인화 모델이 따로 존재하여 다중의 관심, 언론사가 갖는 관심을 갖는 이슈를 찾아서 추천한다. 협력 필터(CF)를 통해 범사용자적 관심분야를 판별하여 추천한다. 그리고 인공신경망을 통해 이미 클릭한 기사는 시스템적으로 재 추천되지 않는다.

구독한 언론사는 개인화에 추천되는가?
개인화에 추천될 확률이 높아진다. 그러나 추천 가산점이 부여되는 것이며 단순히 구독만으로 전체 추천에 영향은 제한적이다.

https://blog.naver.com/naver_search/222439522292

 

네이버 뉴스 추천 알고리즘에 대해 (QnA)

AiRS 알고리즘 관련해 사용자의 문의가 많았던 내용 위주로 다음과 같은 QnA를 선정했습니다. 해당 내...

blog.naver.com

반응형

댓글 영역