Capítulo 5. Ingeniería de características

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En 2014, el documento "Practical Lessons from Predicting Clicks on Ads at Facebook" afirmaba que tener las características adecuadas es lo más importante para desarrollar sus modelos de ML. Desde entonces, muchas de las empresas con las que he trabajado han descubierto una y otra vez que, una vez que tienen un modelo viable, tener las características adecuadas tiende a darles el mayor aumento de rendimiento en comparación con las técnicas algorítmicas inteligentes, como el ajuste de hiperparámetros. Las arquitecturas de modelos de última generación pueden seguir funcionando mal si no utilizan un buen conjunto de características.

Debido a su importancia, una gran parte de muchos trabajos de ingeniería de ML y ciencia de datos consiste en idear nuevas características útiles. En este capítulo, repasaremos técnicas comunes y consideraciones importantes con respecto a la ingeniería de características. Dedicaremos una sección a entrar en detalle sobre un problema sutil pero desastroso que ha descarrilado muchos sistemas ML en producción: la fuga de datos y cómo detectarla y evitarla.

Terminaremos el capítulo hablando de cómo diseñar buenos rasgos, teniendo en cuenta tanto la importancia del rasgo como su generalización. Al hablar de ingeniería de características, algunas personas podrían pensar en almacenes de características. ...

Get Diseño de sistemas de aprendizaje automático now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.