Capítulo 12. Introdução às bibliotecas de modelação em Python
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Neste livro, concentrei-me em fornecer uma base de programação parafazer análise de dados em Python. Uma vez que os analistas de dados e os cientistas frequentemente referem que passam uma quantidade desproporcionada de tempo a tratar e a preparar dados, a estrutura do livro reflecte a importância de dominar estas técnicas.
A biblioteca que utiliza para desenvolver modelos depende da aplicação. Muitos problemas estatísticos podem ser resolvidos com técnicas mais simples, como a regressão por mínimos quadrados, enquanto outros problemas podem exigir métodos de aprendizagem automática mais avançados. Felizmente, o Python tornou-se uma das linguagens de eleição para a implementação de métodos analíticos, pelo que existem muitas ferramentas que podes explorar depois de terminares este livro.
Neste capítulo, irei rever algumas caraterísticas do pandas que podem ser úteis quando estiveres a alternar entre a manipulação de dados com o pandas e o ajuste e pontuação de modelos. De seguida, farei uma breve introdução a dois populares kits de ferramentas de modelação, statsmodels e scikit-learn. Uma vez que cada um destes projectos é suficientemente grande para merecer o seu próprio livro dedicado, não faço qualquer esforço para ser exaustivo e, em vez disso, encaminho-te para a documentação online de ambos os projectos, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access