본문 바로가기

IT/과학 /탐구

구글 검색 알고리즘!! 2012웹마스터컨퍼런스 (google search algorithm)







'EBS 다큐멘터리 검색엔진 마케팅과 구글의 영향력' 방영된 영상.
 



우리나라의 경우 '네이버'가 온라인 검색 광고의 70%를 찾이한다고 봐도 과언이 아니다.  미국에서는 '구글'이 시작페이지에 많이 있기때문에 검색또한 구글의 점유율이 높다. 앞으로 구글이 우리나라 내에서도 점점 점유율이 높아갈 가능에 대해서도 생각해볼 일이다.

많은 이들이 아는 사실이지만 '구글'은 전세계적으로 취업하고 싶은 직장에 손꼽히는 기업이고 대외적으로도 성공한 TI기업이다.  구글의 검색 서비스도 궁금하지 않을 수 없다.





2012년 1월30일 열린 ‘2012 웹마스터 컨퍼런스’에서 한국의 웹마스터에게 검색 최적화 비법과 중요성을 알리며, 구글의 검색 서비스 개발에 대한 뒷이야기를 공개했다.

매트 커츠 구글 검색그룹 총괄 엔지니어는 “매년 2만건을 실험하고 그 실험 내용을 반영해 매주마다 검색 어떤 아이디어를 실행할 것인지를 평가해 결정한다”라며 “매일 적어도 한 번은 변경이 이루어진다”라고 밝혔다. 그는 구글의 검색은 “하나의 아이디어에서 출발한다”라며 구글이 검색 알고리즘을 변경하는 과정을 소개했다.

2010년 자료를 토대로 매트 커츠가 소개한 구글 검색 알고리즘 변경 과정을 살펴보자. 2010년 구글은 검색 서비스를 개선하기 위해 나온 2만개 아이디어 중 그럴듯한 9735개를 추렸다. 구글은 이 아이디어를 추릴 때 외부와 격리된 환경에서 철저한 평가를 했다. 이게 1차 테스트이다.

1차 테스트를 거친 1만여개의 아이디어 중 ‘좋은 결과가 나왔다’ 싶은 8549개는 사용자에게 적용하는 실험을 거쳤다. 이 2차 테스트는 일부 사용자를 대상으로 검색 결과에 해당 아이디어를 적용하고 기존의 방법으로도 검색 결과를 교차해 보여주는 방식으로 진행된다. 이렇게 사용자의 반응이 좋은 아이디어를 골라보니 2688개가 남았다. 실제 이용자에게 적용했지만, 그렇다고 해서 이 아이디어가 검색 결과에 곧장 반영되진 않았다.

마지막 관문, ‘클릭 평가’가 남았다. 이 단계에서 구글은 사용자가 새로운 아이디어를 적용한 검색 결과에 얼마나 만족하는지를 클릭률로 판단한다. 검색 결과를 테스트할 때 이용자는 달라진 점을 못 느낄 수도 있다고 매트 커츠는 설명했다. 매트 커츠는 “새로운 검색 방법을 적용했을 때 검색 결과에 대한 클릭이 기존의 검색 결과보다 더 많이 나왔다면, 이 아이디어는 검색 품질을 개선하는 아이디어로 평가받는다”라고 최종 선정 기준에 대해 말했다.

2만개 중 이렇게 총 4개의 관문을 통과한 아이디어만이 구글 검색에 공식적으로 반영된다. 2010년에는 이 과정을 거쳐 검색 알고리즘에 최종 반영된 아이디어가 585개였다.

매트 커츠는 검색 방법에 변화를 줄 때마다 “이렇게 변경했을 때 사용자를 위해 검색 결과가 개선됐는가”라는 질문을 던진다며 “구글은 이런 과정을 절대 멈추지 않을 것”이라고 말했다.



 

 
2012년 바뀌는 Google 검색 알고리즘에 이야기한 영상이다.






===========================================================================================================


알고리즘(Algorithm)에 대한 단상.

'알고리즘'이란 단어를 주변에서 나에게 종종 물어보곤 한다.  IT쪽을 접하다보면 수없이 algorithm이란 말이 자주 등장하는데 뜻을 찾아봐도 정확하게 의미를 이해 못하기 때문에 그 의미를 나에게 알려달라는 뜻이었다. 나 또한 처음 전산학 이론을 접할무렵 '알고리즘'이란 개념을 바로 알아듣지는 못했지만 이론에 좀더 어렸을때 접했던 GW베이직 프로그램을 생각하고 쉽게 이해하고 바로 그 의미가 흡수가 되었던게 생각이난다.
알고리즘은 '문제를 해결하기 위해 컴퓨터 프로그래밍이 수행해야 할 과정' 뜻한다.
문장이 모여 문단을 이루듯 명령어가 모여 하나의 수행가능한 프로그램이 만들어진다. 그 프로그램 단위 한개가 완성일수도 있고 여러개가 모여 더 큰 프로그램을 이룬 형태가 완성이될 수 도있다. 알고리즘은 바로 어떤 건을 해결할 목표로 명령어를 조합하고 일정한 차례를나누는 일련의 과정을 결합한 형태를 말한다. 알고리즘은 시작과 종료가 명확해야한다. 그래야 문제의 발견과 문제 해결이 나오기때문이다. 알고리즘이 잘못되면, 10줄짜리 프로그램을 짜면될것을 200줄이상 짜게되는 우를 범한다거나 아예 오류가나올 경우가 있다. 그러니 알고리즘은 군더더기 없이 명확해야한다.