본문 바로가기

Memo

네이버랩의 긍정부정검색

며칠 동안 국내 주가 지표가 하락세였는데 오늘 반등세가 이어지고 있다. NHN과 다음의 주식도 상승 중인데 문득 네이버랩긍정부정검색을 이용하면 사람들이 두 회사에 대해 어떤 평가를 하고 있는 지 알 수 있지 않나 생각했다.




네이버는 긍정부정검색에 대해 이렇게 소개하고 있다,

긍정부정 검색은 블로그 검색결과 중 리뷰 및 후기 등에 해당하는 문서를 대상으로 문서 내의 텍스트를 추출, 사용자의 선호도를 판독한 검색결과를 제공하는 기능입니다

미디어다음(혹은 다음)에 대한 조선, 중앙, 동아일보의 뉴스 콘텐츠 공급 중단에 대해 사용자들의 생각이 궁금하여 질의를 해 봤다. 결과부터 이야기하자면 '장난치나'라는 생각이 들었다. 긍정부정검색이라는 검색 결과에 가치(value)를 부여하고 콘텐츠를 재생산하려는 시도는 흥미로운 것이었지만 기술적으로 쉬운 일은 아니라고 생각했다. 그래도 NHN이 늘 이야기하듯 '국내 최고의 검색 기술력'에 대한 일말의 신뢰가 있었고 유용한 결과가 나오면 이를 근거로 '지난 촛불 정국에 대한 네티즌의 여론'이라는 제목으로 기사화 할 생각도 있었다. 그런데 영 쓸모가 없었다.


처음엔 '미디어다음 조중동'으로 검색을 했는데 아래 그림처럼 긍정적 평가가 70% 이상이 나왔다. 그런데 검색 결과를 보면 '미디어다음'을 검색한 것이 아니라 '미디어'도 검색을 했다. 검색어에 대한 정확한 결과를 보여주지 못하고 있는 것이다.

사용자 삽입 이미지

'조중동'에 대한 긍정부정검색 결과는 어떨까 'Normal'이 36%, 'Good'이 54%라는 결과가 나왔다. 그런데 이상하게도 검색 결과를 몇 페이지 클릭하면서 읽어 봤지만 조중동에 대한 긍정적인 결과를 찾기 힘들었다. 갑자기 긍정부정검색이라는 것이 '부정적 단어를 적극적으로 사용하는 경우 Good으로 표시하나?'라는 엉뚱한 생각이 들었다.

사용자 삽입 이미지

다시 한 번 확인하기 위해 요즘 비난의 폭탄을 맞고 있는 '이명박'을 검색해 봤다. Normal이 15%, Good이 무려 71%, Very Good도 12%가 나왔다. 조중동에서 이 결과를 갖고 "보라, 이명박 대통령에 대한 네티즌들의 비판은 한 줌에 불과하다"라고 주장할 수 있을 것 같다는 생각이 들었다. 검색 결과에 나온 웹 문서를 몇 페이지 넘겨가며 봐도 결코 이명박에 대한 긍정적 문서는 찾기 힘들었다. 그럼에도 불구하고 결과는 71%의 웹 문서가 '이명박'이라는 단어에 대해 긍정적으로 평가하고 있다고 긍정부정검색은 이야기하고 있다.

사용자 삽입 이미지

마지막으로 '미국소수입'이라는 키워드로 검색을 해 봤다. Bad가 33%, Good이 67% 나왔다. 문제는 이 검색에 걸린 문서가 딱 3개였다는 것이다.

사용자 삽입 이미지

긍정부정검색이라는 것이 NHN에서 재미삼아 만들어 본 것일 수도 있다. 그럼 그 곳에 이렇게 써 두는 게 어떨까?

"이 검색은 재미삼아 만들어 본 것이라 결과를 신뢰할 수 없습니다"