본문 바로가기

Iguacu ONLY

구글과 네이버의 로그 집적 방식의 차이점

검색 시장과 구글, 네이버 등에 대한 논쟁은 일반 사용자들이 곧바로 논쟁에 참가하기 어려운 기술적인 이해와 사업에 대한 이해가 필요하다. 이런 것을 무시하고 논쟁을 확대시키는 것은 바람직하지 않다. 결국 '네이버 나쁜 놈이네' 류의 책임질 수 없는 여론만 형성할 뿐이다. 엠파스의 예를 들어 보자.

엠파스는 작년 한 해 "열린 검색"이라는 마케팅 용어로 꽤 짭짤한 이득을 거뒀다. 엠파스의 기술적 노력에 대해 부정하지는 않는다. 그러나 엠파스가 지난 한 해 "열린 검색"을 내세우며 원했던 것은 무엇인가? 바로 사람들의 호응이었다. 이 호응의 기저에는 "다음과 네이버"로 대표되는 엠파스가 겨냥한 경쟁자에 대한 비난이 자리잡고 있었다. 그 결과 엠파스는 트래픽과 매출의 증가를 얻었다.

물론 국내 포탈 검색 서비스의 실질적인 문제는 있다. 내가 어떤 주장에 대해 극렬하게 비판했던 이유는 그러한 문제가 보다 실질적으로 표면화될 필요가 있기 때문이었다. 그 주장은 근거가 약했고 잘 모르는 사람들이라면 속아 넘어가기 쉬운 것이었다. 하나의 주장을 강화하기 위해 일방을 비난하는 것은 실질적인 변화를 추동하지 못한다. 물론 이런 주장의 결과로 '국내 포탈 알고보니 아주 나쁜 놈들이다'는 여론을 만들고 싶었다면 꽤 쓸모가 있었다고 본다. 그런 의도는 없었겠지만 이미 많은 블로거들이 그런 이야기를 하고 있다.

이러한 논쟁이 또 다른 마케팅 전쟁으로 발전하길 원치 않는다. 네이버와 다음 등이 몇몇 서비스에 대한 robots.txt 정책을 바꿈으로 인해, 혹은 엠파스가 지난 한 해 요구했듯 "포탈 콘텐트가 포탈의 것이냐?"라는 주장에 호응하면 무엇이 변화하는가? 그것은 누구의 이익에 복무하는가? 정체를 알 수 없는 네티즌? 금액으로 환산할 수 없는 검색 기술력의 발전? 혹은 그 무엇?

이런 주장은 표면상 기술적인 문제처럼 보이지만 실질적으로는 누군가의 이익에 복무하는 결과를 초래한다. 네이버와 다음으로 대표한 국내 포탈이 이런 주장을 받아들일 리 없다. 왜냐면 실질적인 매출의 감소와 사업 방향의 급격한 변화를 초래하기 때문이다. 그리고 또 하나의 결정적인 문제에 부딪치게 된다. 바로 "기선 제압"이다. 비지니스에서 기선 제압을 당하는 것은 끌려 다니게 된다는 소리다. 현재 국내 포탈들이 어느 정도 수준의 매출 손실은 받아들일 수 있을 지 몰라도 앞으로 상황을 계속 악화시키는 "기선 제압"의 요구를 받아들일 리 없다.

구글도 몇몇 기업의 지분을 인수하며 변화하고 있다는 또 다른 문제도 있지만 일단 그 문제는 논외로 한다. 다만 "구글 vs 네이버"를 마치 "선 vs 악"의 구도로 만드려는 시도는 "MS vs 리눅스"나 "인터넷익스플로러 vs 파이어폭스" 등과 크게 다르지 않다는 이야기를 하고 싶다. 이들은 마치 기술적 논쟁처럼 보였지만 실제로는 마케팅 전쟁이었다.

아래는 해외와 국내의 대표적 검색 서비스인 구글과 네이버의 차이점에 대한 글이다. 이러한 차이점에 근거해 두 회사의 검색 서비스를 비교한다면 보다 실질적으로 업계와 개인들에게 도움이 될 수 있는 논의를 할 수 있을 것이라 생각한다.

구글과 네이버의 로그 집적 방식의 차이점

(2005.7.14 작성)

구글과 네이버는 사용자의 로그(log)를 수집하고 집적하여 그것을 검색 서비스를 통해 새로운 가치로 창출하는 것을 주요 비지니스로 삼고 있다. 두 기업이 궁극적으로 원하는 것은 "인터넷 인프라로써 자사 검색 서비스를 확립하고 사용자의 온라인 라이프 사이클의 중심에 서는 것"이다. 그러나 두 기업은 결정적으로 로그 집적 방식에서 다음과 같은 차이점이 있다.

구글 : 정보의 집적 > 아카이브의 구축 > 생활의 지배

네이버 : 정보의 집적 > 컨텐츠의 구축 > 생활의 지배

구글은 검색엔진의 원래 기능에 집중하여 수집기를 통해 정보를 모으고 알고리즘에 의해 이 정보를 재분류하여 의미있는 데이터 집단인 아카이브(archive)를 구축하여 경쟁력을 구축했다. 반면, 네이버는 수집기를 통해 정보를 모으긴 했지만 이 정보를 다시 아카이브로 구축하는 대신 컨텐츠(content)를 재생산하는 방법으로 경쟁력을 구축했다. 그 결과 구글은 80 억 페이지에 달하는 웹 페이지의 링크와 인덱스 파일, 미러링 파일(복사된 웹 페이지)을 갖게 되었다. 반면 네이버는 '전지현'이라고 입력하면 네이버에서 만들어 둔 컨텐츠를 먼저 보게 되는 구조를 갖게 되었다.

처음에 두 사이트의 로그 집적 구조와 결과 출력 방식은 크게 다르지 않았지만 또한 추구하는 바도 크게 다를 바 없지만 2005년 7월 시점에서 두 사이트는 한쪽은 '아카이브의 축적'에 집중하며 새로운 서비스를 다시 기존의 방대한 아카이브로 수렴하고 있는 반면 (구글) 다른 한쪽은 '컨텐츠의 구축'에 집중하여 새로운 서비스 (커뮤니티)를 컨텐츠 자동 생산 도구로 만들었다. 그 결과 구글은 한국과 몇몇 국가를 제외한 지역에서 주요 검색 서비스로 자리잡고 있으며 네이버는 한국에서 독점적 지위를 차지하게 되었다.

구글이 검색 쿼리(query)를 판매하여 큰 수익을 거두고 있음에 비해 네이버는 검색 컨텐츠의 독점성을 통해 수익을 발생시킨다. 이런 구조 때문에 엠파스에 대해 "우리의 재산을 침해하고 있다"라고 주장하는 것이다. 구글은 데이터 수집 기술과 인덱싱 능력으로 승부하는데 비해 네이버는 컨텐츠의 질로 승부하고 있기 때문이다. 엠파스의 '열린 검색'은 네이버 입장에선 피땀 흘려 모은 "우리의 데이터"를 훔쳐가는 것 이상도 이하도 아닌 것이다.

양사의 이러한 로그 집적 방식의 차이점은 태생적 차이에 기인한다. 구글의 창립자들과 달리 한국의 검색 서비스 개발자들은 검색 알고리즘의 핵심에 접근하거나 프로그램 소스(source)를 다룰 수 있는 수혜를 받지 못했다. 수학적 알고리즘을 검색 결과물을 통해 유추해야 할 뿐이었다. 또한 한국은 1990년대 후반부터 벌어진 국내의 포탈간 경쟁 속에서 검색 서비스를 기술적 수준으로 평가 받기 보다는 "사용자에게 어필하는 컨텐츠의 출력"이라는 주제로 싸울 수 밖에 없었다. 많은 시간 한국의 검색엔진 기술은 컨텐츠 발견을 위한 유입경로로써 역할을 할 뿐이었다.

구글은 70조원에 달하는 기업 가치를 갖고 있고, NHN(네이버 서비스 공급회사)은 약 2 조원 가까운 기업 가치를 갖고 있다. (주가 기준) 또한 구글은 곧 한국 지사를 설립할 계획이다. NHN은 다음 달부터 NHN 아메리카를 통한 사업 확대에 집중할 계획이다. 세계의 검색엔진이 한국 시장을 노리고 있고, 한국의 검색엔진은 미국으로 접근하고 있다. 다만 구글은 검색서비스로 한국에 들어오고, NHN은 게임으로 미국에 들어간다. 정상적인 싸움은 아니다.

(원본 : http://blog.naver.com/kickthebaby/20020529301, 2006-01-08)