Capítulo 11. Aprendizaje automático
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Siempre estoy dispuesta a aprender, aunque no siempre me gusta que me enseñen.
Winston Churchill
Mucha gente se imagina que la ciencia de datos es sobre todo aprendizaje automático y que los científicos de datos se pasan el día construyendo, entrenando y ajustando modelos de aprendizaje automático. (Por otra parte, muchas de esas personas no saben realmente lo que es el aprendizaje automático). De hecho, la ciencia de los datos consiste principalmente en convertir los problemas empresariales en problemas de datos y en recopilar datos y comprender datos y limpiar datos y formatear datos, tras lo cual el aprendizaje automático es casi una ocurrencia tardía. Aun así, es una idea interesante y esencial que debes conocer para poder hacer ciencia de datos.
Modelado
Antes de que en podamos hablar de aprendizaje automático, tenemos que hablar de modelos.
¿Qué es un modelo? Es simplemente una especificación de una relación matemática (o probabilística) que existe entre distintas variables.
Por ejemplo, si intentas recaudar dinero para tu sitio de redes sociales, puedes construir un modelo de negocio (probablemente en una hoja de cálculo) que tome datos como "número de usuarios", "ingresos publicitarios por usuario" y "número de empleados" y genere tu beneficio anual para los próximos años. La receta de un libro de cocina implica un ...
Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.