이 장에서는 책의 나머지 부분에서 개발할 응용 프로그램인 웹 검색 엔진을 소개합니다. 검색
엔진의 요소를 설명하고, 위키피디아에서 페이지를 다운로드하고 파싱하는 웹 크롤러
web
crawler
라는 첫 번째 응용 프로그램을 소개합니다. 또한, 깊이 우선 탐색
depth
-
first
search
의 재귀적
recursive
구현과 후입선출
last
in
,
first
out
,
LIFO
스택 구현을 위해 자바
Deque
인터페이스를 사용하는 반복적
iterative
구현을 제공합니다.
6.1
검색 엔진
구글이나 빙
Bing
같은 웹 검색 엔진
web
search
engine
은 일련의 검색어를 받아 그와 관련된
relevant
웹
페이지 목록을 반환합니다
(‛관련’의 의미는 나중에 설명)
. 자세한 내용은
http
://
thinkdast
.
com
/
searcheng
을 참고하길 바라며 여기서는 이 장을 진행하는 데 필요한 내용만 설명합니다.
검색 엔진의 필수 요소는 다음과 같습니다.
●
크롤링
crawling
웹 페이지를 다운로드하고 파싱하고 텍스트와 다른 페이지로의 링크를 추출하는 프로그램
●
인덱싱
indexing
검색어를 조회하고 해당 검색어를 포함한 페이지를 찾는 데 필요한 자료구조
●
검색
retrieval
인덱스에서 결과를 수집하고 검색어와
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.