Korpora, Token und TypenMonogramme, Bigramme, Trigramme, …, N-GrammeLemmas und StämmeSätze und Dokumente kategorisierenWörter kategorisieren: POS-TaggingSpannen kategorisieren: Phrasenerkennung und EigennamenerkennungStruktur von SätzenWortbedeutungen und SemantikZusammenfassungLiteraturhinweise