자유롭게 게시물을 올릴수있는 게시판입니다.
  • 유년추억
  • 학교생활
  • 입시준비
  • 대학생활
  • 군생활
  • 알바생활
  • 취업준비
  • 직장생활
  • 원룸생활
  • 연애중
  • 결혼준비
  • 집안살림
  • 자녀교육
  • 창업준비
  • 이민유학
  • 노후생활
  • 전체보기


검색엔진을 이용한 WWW검색서비스

 

검색엔진을 이용한 WWW검색서비스


WWW서버 검색 서비스는 WWW서버상에서 제공되는 서비스로서 공공목적이나 광고 수입이 서비스의 기반이기 때문에 사용자는 무료로 이용할 수 있다.


검색을 실행하기 위해서는 먼저 브라우저로 검색 서비스를 제공하는 WWW서버에 접속해야 한다. 화면상에 나타난 입력 스페이스에 키워드를 입력하면 잠시 후에 입력한 키워드와 관련된 정보가 WWW서버의 일람에 표시된다. 일람 중의 각 항목은 해당 WWW서버에 연결할 수 있는 상태이기 때문에 항목을 클릭하는 것만으로 목적하는 WWW서버에 접속할 수 있다.





검색엔진의 5가지 기능


검색 서비스는 검색 엔진이라고 불리는 서버에 의해 실현되는데 검색 엔진은 크게 5가지의 기능을 갖추고 있다(그림). ① 데이터 수집기능, ② 데이터 축적 기능, ③ WWW서버 기능, ④ 검색 엔진 기능, ⑤ 데이터HTML화 기능 등이다. ①과 ②는 검색을 받아들이기 전의 처리 기능, ③, ④, ⑤는 실제 검색을 실행하는 기능이다.



데이터 수집 기능, 데이터 축적 기능, 그리고 검색 엔진 기능에는 각각 두 가지 형태의 실행 방법이 있다. 각 검색 서비스는 <표>와 같이 어느 한쪽 또는 양자를 병용하고 있다.



먼저 데이터 수집 기능으로서 이것은 사용자로부터 검색요구를 받아들이기 전에 미리 WWW서버에 액세스하여 각 서버가 축적한 데이터를 수집하는 기능이다. 데이터를 수집하는 방법에는 「자동수집 형태」와 「수동수집 형태」의 2종류가 있다. 자동수집 형태는 로봇 프로그램이라고 하는 자동 데이터 수집 소프트웨어를 사용하는 방법이고, 수동수집 형태는 검색 서비스 관리자가 WWW액세스를 반복하여 데이터를 찾아내거나 WWW서버의 관리자에게 데이터의 제공을 의뢰하는 방법이다.


두번째의 데이터 축적 기능은 수집한 데이터를 검색 엔진이 검색시 사용하는 데이터베이스에 등록하는 기능으로서 HTML파일의 일부를 선정하여 데이터베이스에 등록한다.


추출방법에는 「타이틀문 추출형태」와 「요약문 추출형태」의 두가지가 있다. 타이틀문 추출 형태는 HTML파일의 앞머리에 기술된 타이틀문 만을 골라내는 방법이다. 한편 요약문 추출형태는 타이틀문에 부가하여 HTML파일의 내용도 몇 줄의 요약문을 추가하여 정리하는 방법이다.




키워드 검색과 전문검색


검색 엔진은 브라우저에서 간단하게 액세스할 수 있도록 WWW서버 기능(③)을 갖추고 있다.


④의 검색 기능은 바로 검색 엔진의 핵심이 되는 기능으로서 사용자가 키워드를 입력하면 그 키워드를 포함하는 데이터가 있는지 없는지를 데이터베이스에 조회한다. 검색 방법에는 키워드 검색형태와 전문 검색형태의 두가지 종류가 있다. 키워드 검색은 각 데이터에 키워드를 설정하여 그 키워드에 대하여 검색을 실행하는 방법이고 전문 검색형태는 데이터베이스에 축적된 데이터를 모두 검색하는 방법이다.


마지막이 ⑤의 데이터 HTML화 기능으로서 데이터베이스의 검색 결과를 브라우저 상에서 보기 쉬운 형식으로 정형화하여 HTML파일로 전환시킨다.







간단한 용어해설


☞ 로봇 프로그램


WWW서버를 자동으로 순회하여 서버가 축적하고 있는 데이터를 수집하는 소프트웨어. Web(거미집)의 위를 자유로이 움직인다고 하는 뜻에서 별명을 「Spider(거미)라고도 한다.


☞ 타이틀문


HTML에서 반드시 지정하는 HTML파일의 제목. 구체적으로는 <TITLE>타이틀</TITLE>이라고 기술한다. 타이틀문은 브라우저 메뉴 바에 표시된다.




2001-05-06 02:57:40
1318 번 읽음
☞ 로그인 후 의견을 남기실 수 있습니다
 캐시선물





365ch.com 128bit Valid HTML 4.01 Transitional and Valid CSS!
태그