본문 제목

구글 MUM 알고리즘이란?

디지털 마케팅/검색엔진최적화

by 노엘(Noelle) 2021. 10. 12. 13:15

본문

Google MUM 알고리즘

구글은 지난 5월 블로그를 통해 MUM 알고리즘 (Multitasking Unified Model) 에 대하여 공개하였습니다. 공개 이후 MUM 알고리즘은 검색 결과에 즉시 반영되었고, 이에 대하여 많은 SEO 웹마스터들은 새로운 알고리즘에 적용 반영이 불가피하게 되었습니다. 

이후 몇 개월간 MUM 알고리즘에 대하여 많은 의문과 이에 대한 실험이 있었습니다. 최근 구글의 공식 유튜브 채널인 Google Search Central에서 MUM 알고리즘의 검색 순위 반영에 대한 질문이 있었고, 관련 질문에 John Mueller는 MUM 알고리즘은 검색에 반영이 되고 있으나 그 경로에 대해서는 구글 내부에서도 파악하는 수준에 있다고 하였습니다. 그의 대답은 이 아주 세밀한 단위로 사물 및 의미를 이해하는 MUM 알고리즘은 상당한 고도의 AI 엔진을 기반으로 하며 이해하기는 쉽지 않으나 사용자 검색 환경 차원에서는 상당한 의미를 두고 있는 것으로 설명하며, 구글이 BERT를 시작으로 한 의미어 기반의 AI 기술을 보다 적극적으로 활용할 것이라는 예상을 하게 하였습니다. 

이번에는 구글의 MUM 알고리즘에 대하여 간단하게 이해할 수 있는 정도로 알아보도록 하겠습니다.


 


MUM 알고리즘이란?

MUM은 Multitasking Unified Model의 약자입니다. ‘다각적 통합 모델’ 이라고 생각하시면 됩니다. 어려운 의미의 단어들의 조합이지만, MUM 알고리즘의 본 목적인 질문(Query)을 세밀하게 이해하고 적확하고 풍부한 답변을 제공한다는 측면에서 생각하면 이해하기 쉽습니다. 복잡하고 긴 질문이 있을 경우 이를 다각적으로 해석하고 통합하여 검색 결과로 보여주는 것입니다. 


MUM알고리즘의 기반은 의미어 언어 모델인 BERT입니다. BERT 알고리즘은 크롤링된 컨텐츠를 단순히 키워드의 조합이 아닌 의미어 단위로 이해합니다. BERT의 언어이해를 바탕으로 MUM 알고리즘은 이렇게 수집된 크롤링 데이터를 토대로 사용자의 질의를 보다 세밀하게 분석합니다. 질문의도, 검색 이력, 습관 등을 고려하여 사용자가 원하는 데이터를 통합하여 보여줍니다. 하여 MUM 알고리즘은 직접적인 답변이 없는 복잡한 질문에도 답할 수 있도록 설계된 고도의 AI 알고리즘이라고 볼 수 있습니다.

 

 

MUM 알고리즘의 역할



질문의 이해와 분석

MUM 알고리즘이 BERT 알고리즘과 다른 부분이기도 한 언어의 의미 뿐만 아니라 언어를 생성할 수 있는 알고리즘이라는 것은 사용자의 검색의도를 이해하고 이를 올바른 질의로 재생성할 수 있다는 것입니다. 예를 들어 검색자가 ‘등산’에 관련된 질의를 할 경우 MUM 알고리즘은 질문을 포함한 사용자의 정보에 따라서 ‘피트니스’에 관련된 결과뿐만 아니라 계절을 고려해 ‘방수 재킷’을 준비해야 하는지, 가을에는 젖은 낙엽에도 미끄러지지 않을 등산화를 준비해야 하는지 또는 기존에 검색한 지역을 배경으로 새로운 등산경로를 보여주기도 합니다. 검색자와 질문의 모든 소스를 세세하게 분리하고 이해하여 적합한 정보를 전달해 주게 됩니다. 


언어장벽

MUM 알고리즘은 검색어로 작성되지 않은 출처에서 의미단위로 크롤링하여 저장하므로 한국 관심이 있는 이력을 가진 해외 사용자가 한국어가 아닌 본인의 모국어로 ‘등산’에 관련된 질의를 할 경우 MUM 알고리즘은 설악산에 대한 결과를 보여줄 수 있습니다. 뿐만 아니라 한국어 ‘설악산’으로 검색할 경우 볼 수 있는 결과들도 노출이 된다는 점에서 언어 장벽을 뛰어 넘은 결과를 보여준다고 볼 수 있습니다.


유형이 다른 정보의 이해

타국어 사이트 검색 결과와 마찬가지로 MUM 알고리즘은 다양한 유형의 정보를 의미적으로 이해합니다. 가장 대표적인 예로 이미지 검색입니다. 사용자가 자신의 등산화를 사진으로 찍고 ‘이 등산화로 설악산 등반이 가능할까요?’라는 질의를 했을 때, MUM 알고리즘은 이 질의를 이해하여 결과를 보여준다는 것입니다. 


 


개선되어야 할 사항



한국어 적용

우선 MUM 알고리즘은 아직까지는 한국어에 대한 데이터가 부족하다고 볼 수 있기 때문에 영어에 대한 질의에만 작동할 것이라 예상됩니다. 관련한 내용이 구글 한국어 블로그에 게재가 되지 않는다는 것과 구글의 한국어 의미어 이해 수준이 아직 BERT 알고리즘에 적용하기도 벅찰 수 있습니다. 현재까지는 국내에서는 네이버가 한국어 의미적 언어 이해 모델 분야는 앞서 있으며 최근 네이버 서치 앤 텍에서 공개한 바에 따르면 검색어에 대한 주제 단위에서 결과를 분류하여 보여주는 변화를 보았을 때, 아마도 네이버에서 먼저 도입하지 않을까 추측해 봅니다.


시스템 편향 오류

또한 AI 언어모델에서 발생하는 시스템 편향에 대한 우려도 빼놓을 수 없습니다. 이에 대하여 구글은 블로그를 통해 시스템 편향을 피하기 위해 해당 패턴을 추적하고 있으며, MUM 알고리즘을 구글의 모든 사업과 제품에 도입하는 것을 표명한 만큼 편향 오류를 줄이기 위한 다양한 시도가 있을 것으로 예상됩니다.

 
반응형

관련글 더보기

댓글 영역