Sistemas de produção de aprendizagem automática
by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Prefácio
A minha primeira grande oportunidade na área da IA e da aprendizagem automática (ML) foi há cerca de 20 anos. Foi numa altura em que a Internet ainda parecia uma tecnologia completamente nova. O mundo estava a aperceber-se de que o poder da comunicação livre tinha desvantagens e benefícios - sendo essas desvantagens mais notórias sob a forma de spam de correio eletrónico. Estas mensagens indesejadas estavam a entupir as caixas de entrada em todo o lado com ofertas duvidosas de comprimidos ou esquemas que procuravam informações de contas bancárias.
O spam de correio eletrónico era um problema grave porque os filtros de spam disponíveis (baseados em grande parte em regras e padrões criados manualmente) eram ineficazes. Os autores de spam enganavam estes filtros com todo o tipo de truques, como erros de ortografia int3nt!onal ou outros tipos de mensagens que eram difíceis de adaptar a uma regra fixa. Na altura, como estudante de pós-graduação, fiz parte da comunidade de pesquisas que acreditava que uma tecnologia engraçada chamada aprendizagem automática poderia ser a solução certa para este conjunto de problemas. Tive até a sorte de criar um modelo que ganhou uma das primeiras competições de referência para filtragem de spam de correio eletrónico.
Lembro-me desse modelo inicial por duas razões. Primeiro, era fixe que funcionasse bem utilizando uma representação simples mas muito flexível - algo a que agora chamaríamos um precursor de uma convolução unidimensional em cadeias ...