본문 바로가기

검색

(28)
네이버 검색 시스템 초기 버전 History94 ~ 95년 정부기관 검색프로젝트로 시작95 ~ 96년 유니텔 신문기사검색시스템 구축97년 2월 웹글라이더 검색서비스 시작97년 12월 네이버 검색서비스 시작구성웹로봇 (Nabot)문서분석기 형태소분석기(한성대학교 강승식교수 HAM)Index Builder (자체 개발)저장관리기COSMOS (한국과학기술원 황규영교수) Storage Manager (자체 개발)질의어처리기랭킹알고리즘 (숭실대 이준호 교수) 질의어 처리기 (자체개발)주요기술웹로봇(Web Robot)분류(Directory Browsing)Tokenizing, Indexing, BuildingB+ Tree, Hashing, CompressionQuery Optimization, RankingHTML I/F, Web Server ..
크롤러(crawler)에 대한 이야기 우연히 검색을 하다 매우 재미있고 특히 검색 엔진 중 수집기(크롤러, spider나 robot이라고도 부른다)의 동작에 대해 궁금해 하는 사람들에게 유용한 댓글을 발견했다. 본문은 그냥 대충 넘어가도 될 것 같아 댓글만 옮겨 온다. Googleguy라는 익명의 사람이 쓴 것이다. 두 개의 댓글이 있는데 모두 옮겨 온다. 검색 엔진의 기술적인 부분에 대해서 의견이 오가는 것 같아서, 이야기하기 어려운 입장이지만 중태님의 의견에 첨가합니다. 여러분들이 익히 아시는 것과 다르게 검색 엔진에 링크가 수록되는 것은 단순 로봇 외에 몇가지가 있습니다.첫째는 말 그대로 로봇이 긁어간 경우고요. 이 부분은 아시는대로 표준인 robots.txt로 검색 엔진에게 서버 운영자의 검색 관련 입장을 표명할 수 있습니다. 구글 ..
검색 결과 상위 노출 웹 사이트의 위험성 검색 결과 페이지, 위험한 링크 '가득' 보안업체 맥아피(McAfee)가 발표한 검색 엔진의 안전성에 관한 조사 보고서에 따르면 "검색엔진이 이용자를 지켜준다고 생각해선 안된다"라며 검색엔진이 이용자의 안전을 위협할 가능성에 대해 밝혔다. 맥아피가 1월부터 4월까지 미국 주요 검색엔진 구글, 야후!, MSN, AOL, 에스크의 검색 결과에 표시되는 사이트들을 조사한 결과, 애드웨어와 스팸메일 같이 사용자의 동의 없이 광고를 배포하거나 PC의 웹 브라우저 설정을 임의로 바꿔 버리는 사이트가 키워드 광고 영역에 검색되는 것을 발견했다.원본 글은 "Groundbreaking Study From McAfee Shows Users Are at Risk When Using Internet Search Engines..
MS, 검색 연구 개발비로 62억 달러 스티브 발머 MS CEO "구글·야후 5년안에 따라잡겠다" MS는 자사가 다음달 30일 마감되는 회계연도에 연구개발에 약 62억달러를 지출할 계획이라고 밝혀 왔다. 또 릭 셔런드 골드만삭스 분석가는 MS가 오는 7월부터 연말까지 광고 지원 온라인 사업에 추가로 20억달러를 투자할 것으로 예상했다. (from : 전자신문) 62억 달러라... 역시 검색 시장은 돈이 많이 드는 영역이다. 이 금액 중 대부분이 연구 인건비로 소요될 것이다. 학위를 소유한 사람들을 긁어 모으기 시작할 것이고 구글이나 야후 현업 근무자들에 대한 치열한 스카우트가 진행될 것이다. 어떤 헤드헌팅 펌은 제법 큰 돈을 벌 지도 모른다. 문득 첫눈 장병규사장이 올해 1월 인터뷰에서 "검색은 돈이 많이 드는 사업입니다"라고 흘러가듯 이야기..
야후, MS의 러브콜 거부 머니투데이 국제부 뉴스에서 파이낸셜타임즈의 기사를 번역하여 날로 먹는 기사인 "야후, MS의 지분인수 거부"라는 기사를 올렸다. 두 업체 사이에 공식적인 파트너쉽이 있는 지 모르겠지만 이런 기사를 볼 때마다 기사 참 쉽게 쓴다는 탄식과 블로거들의 참을 수 없는 가벼움을 탓하는 기존 미디어의 지리멸렬함을 느낀다. 그러나 오늘의 주제는 이것이 아니다. 이 기사가 전하는 바는 MS가 야후의 지분을 인수하며 검색 시장 진입에 강한 드라이브를 걸려고 했으나 야후 CEO인 테리 세멜이 직접적인 거부 의사를 밝혔다는 점이다. 그는 "검색 엔진 산업은 결코 사라지지 않겠지만 지금의 모델은 머지않아 쇠퇴할 것"이라고 말했다고 하는데 변화의 근거로 NHN을 중심으로 돌아가는 한국의 지식 검색을 예로 들고 있다. 원문 기사..
Blog search engine, Sphere 블로그 검색 전문 서비스인 Sphere에 대한 리뷰 두 개, 블로그 전문 검색 서비스 'Sphere' - 링크 구조의 파악 블로그 검색엔진 Sphere
검색 서비스와 커뮤니티 서비스의 제휴 검색서비스 콘텐츠 DB의 방향 자체가 UCC로 흘러가는 것은 이전부터 대세였습니다만,최근의 움직임은 포털이 자체적으로 보유하고 있는 콘텐츠가 아닌 경쟁력있는 외부 업체의 콘텐츠를 소싱하거나 또는 트래픽 아웃을 시켜주는 형태로 흘러가고 있습니다. 이런 움직임은 메이저 검색서비스보다는 마이너(?) 검색서비스에 집중되고 있는데, 네이버의 독주가 계속되고 있는 상황속에서 자체적인 DB로는 선두를 따라 잡을 수 없다는 위기감에 기존 포털들이 추구하고 있는 트래픽독점과는 다른 형태의 제휴들이 이어지고 있는 것으로 보입니다. (from : 검색서비스들의 잇단 제휴) 최근 첫눈이 디씨인사이드에 3억원의 투자를 하며 비즈니스 제휴를 했다는 보도 자료를 받았다. 나는 이 보도자료를 블로그에 옮기지 않았고 "제휴 모델이 나..
검색 블로그 국내외 주요 검색 서비스 제공 업체의 블로그 주소 네이버 : http://blog.naver.com/naver_search 다음 : http://blog.daum.net/daumsearch 엠파스 : http://blog.empas.com/empas 야후! (영문) : http://ysearchblog.com/ MSN (영문) : http://blogs.msdn.com/msnsearch/ 구글 (영문) : http://googleblog.blogspot.com/