CAPÍTULO 10

Representação e Mineração de Texto

Conceitos Fundamentais: A importância de se construir representações de dados de mineração fáceis; Representação de texto para mineração de dados.

Técnicas Exemplares: Representação bag of words; Cálculo TFIDF; N-gramas; Stemização; Extração de entidade nomeada; Modelos de tópicos.

Até este ponto, ignoramos ou deixamos de lado uma etapa importante do processo de mineração de dados: a preparação dos dados. Nem sempre o mundo nos apresenta dados na representação de vetor de característica que a maioria dos métodos de mineração de dados utiliza como entrada. Os dados são representados de maneira natural para problemas a partir dos quais foram derivados. Se quisermos aplicar as muitas ferramentas de ...

Get Data Science Para Negócios now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.