
108 | Capítulo 3: Classificação
• Pode ser que você queira adicionar hiperparâmetros ao seu pipeline de prepa-
ração para controlar se deseja ou não retirar os cabeçalhos de e-mail, converter
cada e-mail em minúsculas, remover pontuação, substituir todas as URLs por
“URL”, substituir todos os números por “NUMBER” ou mesmo reduzir, ou seja,
cortar as finalizações de palavras. Existem bibliotecas Python disponíveis para
fazer isso;
• Em seguida, experimente vários e veja se consegue construir um bom classifi-
cador de spam com revocação e precisão altas.
As soluções para estes exercícios estão disponíveis online nos notebooks do Jupyter em
htt ...