196
Глава 15. Сбор данных в «Википедии»
Обе они являются операциями постоянного времени, поэтому
общее время выталкивания TermCounter линейно и пропор-
ционально числу уникальных поисковых терминов.
Таким образом, создание TermCounter пропорционально количе-
ству слов на странице. Выталкивание TermCounter в Redis про-
порционально количеству уникальных поисковых терминов.
Поскольку количество слов на странице обычно превышает ко-
личество уникальных поисковых терминов, то общая сложность
пропорциональна количеству слов на странице. Теоретически
страница может содержать все поисковые термины в индексе,
поэтому наихудший показатель производительности — O(M),
но на практике такое встречается редко.
Данный анализ предлагает способ повысить производитель ...