Capítulo 60. Siete cosas que los ingenieros de datos deben tener en cuenta en los proyectos de ML
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Dr. Sandeep Uttamchandani
Según una estimación reciente, ¡el 87% de los proyectos de aprendizaje automático (AM) fracasan!1 Este capítulo trata de las siete cosas principales que he visto fallar en un proyecto de ML desde el punto de vista de la ingeniería de datos. La lista está ordenada en orden descendente según el número de veces que me he encontrado con el problema multiplicado por el impacto de la incidencia en el proyecto global:
Pensaba que este atributo del conjunto de datos significaba otra cosa. Antes de la era de los grandes datos, los datos se procesaban antes de añadirlos al almacén central de datos. Esto se conoce como esquema en escritura. Hoy en día, el enfoque de los lagos de datos consiste en agregar primero los datos y luego deducir su significado en el momento del consumo. Esto se conoce como esquema en lectura. Como ingeniero de datos, desconfía del uso de conjuntos de datos sin una documentación adecuada de los detalles de los atributos o un administrador de datos claro responsable de mantener los detalles actualizados.
Existen cinco definiciones para la misma métrica empresarial, ¿cuál debo utilizar? Los datos o métricas derivados pueden tener ...
Get 97 cosas que todo ingeniero de datos debe saber now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.