Modelos de aprendizagem automática e ciência de dados para finanças
by Hariom Tatsat, Sahil Puri, Brad Lookabaugh
Capítulo 10. Processamento de linguagem natural
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
O processamento da linguagem natural (PNL) é um subcampo da inteligência artificial utilizado para ajudar os computadores a compreender a linguagem humana natural. A maioria das técnicas de PNL baseia-se na aprendizagem automática para extrair significado das línguas humanas. Quando o texto é fornecido, o computador utiliza algoritmos para extrair o significado associado a cada frase e recolher dados essenciais. A PNL manifesta-se de diferentes formas em muitas disciplinas sob vários pseudónimos, incluindo (mas não se limitando a) análise textual, extração de texto, linguística computacional e análise de conteúdos.
No sector financeiro, uma das primeiras aplicações da PNL foi implementada pela Comissão de Títulos e Câmbios dos EUA (SEC). O grupo utilizou a extração de texto e o processamento de linguagem natural para detetar fraudes contabilísticas. A capacidade dos algoritmos de PNL para digitalizar e analisar documentos jurídicos e outros a alta velocidade proporciona aos bancos e a outras instituições financeiras enormes ganhos de eficiência para os ajudar a cumprir os regulamentos de conformidade e a combater a fraude.
No processo de investimento, a descoberta de informações sobre o investimento exige não só um conhecimento do domínio das finanças, mas também uma forte compreensão dos princípios da ciência dos ...