KAPITEL 6
Text verarbeiten
6.0Einführung
Unstrukturierte Textdaten, wie zum Beispiel der Inhalt eines Buchs oder eines Tweets, gehören sowohl zu den interessantesten Quellen für Merkmale als auch zu den komplexesten im Umgang. Dieses Kapitel beschreibt Strategien, um Text in informationsreiche Merkmale zu überführen. Das soll nicht heißen, dass die hier behandelten Rezepte alle Möglichkeiten umfassen. Es gibt ganze akademische Zweige, die sich auf den Umgang mit diesen und ähnlichen Datentypen konzentrieren – allein die Inhaltsverzeichnisse aller ihrer Techniken würden eine kleine Bibliothek füllen. Dennoch gibt es einige häufig eingesetzte Techniken, und wenn Sie wissen, wie Sie sie nutzen, bekommen Sie wertvolle Werkzeuge für die Vorverarbeitung. ...
Get Machine Learning Kochbuch now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.