198
Глава 15. Сбор данных в «Википедии»
высокий приоритет страницам, которые не индексировались
в течение длительного времени.
Узнать больше об обходе графов можно на сайте http://think-
dast.com/graphtrav.
Упражнение 12
Теперь пришло время написать поисковый робот. В репозито-
рии для этой книги вы найдете исходные файлы для данного
упражнения:
WikiCrawler.java, который содержит начальный код для
вашего поискового робота;
WikiCrawlerTest.java, включающий код для WikiCrawler;
JedisIndex.java — мое решение для предыдущего примера.
Кроме того, понадобятся некоторые вспомогательные классы,
которые мы использовали в предыдущих упражнениях:
JedisMaker.java;
WikiFetcher.java;
TermCounter.java;
WikiNodeIterable.java.
Перед запуском JedisMaker вам ...