Skip to Content
Kollektive Intelligenz analysieren, programmieren und nutzen
book

Kollektive Intelligenz analysieren, programmieren und nutzen

by Toby Segaran
February 2008
Intermediate to advanced
400 pages
10h
German
O'Reilly Verlag
Content preview from Kollektive Intelligenz analysieren, programmieren und nutzen

Ein einfacher Crawler

Ich gehe jetzt einmal davon aus, dass Sie keine große Sammlung an HTML-Dokumenten haben, die auf Ihrer Festplatte herumlungern und darauf warten, dass sie indexiert werden, daher werde ich Ihnen zeigen, wie Sie einen einfachen Crawler erstellen können. Er wird mit einer kleinen Zahl an Seiten gefüttert werden, die zu indexieren sind, und dann allen Links auf diesen Seiten folgen, um andere Seiten zu finden, deren Links er auch folgen wird. Dieser Prozess wird als Crawling oder Spidering bezeichnet.

Dazu muss Ihr Code die Seiten herunterladen, sie an den Indexer übergeben (den Sie im nächsten Abschnitt bauen) und dann parsen, um alle Links zu finden, die Sie als Nächstes ansteuern werden. Glücklicherweise gibt es eine Reihe ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Algorithmen kapieren -- Visuell lernen und verstehen mit Illustrationen, Alltagsbeispielen und Python-Code

Algorithmen kapieren -- Visuell lernen und verstehen mit Illustrationen, Alltagsbeispielen und Python-Code

Aditya Y. Bhargava

Publisher Resources

ISBN: 9783897217805