Capítulo 86. Comprender cómo resuelven problemas los distintos dominios de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Matthew Seal

Las organizaciones tecnológicas suelen desarrollar vías paralelas para múltiples asuntos relacionados con los datos que deben funcionar en tándem. A menudo se obtiene una mezcla de equipos que incluyen ingeniería de datos, aprendizaje automático e infraestructura de datos. Sin embargo, estos grupos suelen tener enfoques de diseño diferentes, y les cuesta entender las decisiones y compensaciones que toman sus homólogos adyacentes. Por esta razón, es importante que los equipos empaticen y comprendan los motivos y las presiones que se ejercen mutuamente para lograr una empresa de éxito basada en los datos.

He descubierto que unos pocos modos de pensamiento determinan muchas suposiciones iniciales en estos tres grupos en particular, y que conocer estos motivos ayuda a apoyar o refutar las decisiones que se toman. Por ejemplo, los equipos de ciencia de datos y aprendizaje automático suelen introducir complejidad en las herramientas que desarrollan para resolver sus problemas. La mayoría de las veces, obtener una respuesta más exacta, precisa o específica requiere añadir más datos o más complejidad a un proceso existente. Por lo tanto, para estos equipos, añadir complejidad suele ...

Get 97 cosas que todo ingeniero de datos debe saber now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.