Capítulo 1. Las funciones del aprendizaje automático y el proceso de entrevista

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En la primera parte de este capítulo, repasaré la estructura de este libro. A continuación, hablaré de los distintos puestos de trabajo y funciones que utilizan las habilidades de ML en la industria.1 También aclararé las responsabilidades de los distintos puestos de trabajo, como científico de datos, ingeniero de aprendizaje automático, etc., ya que éste es un punto común de confusión para los solicitantes de empleo. Esto se ilustrará con una matriz de habilidades de ML y un ciclo de vida de ML a los que se hará referencia a lo largo del libro.

La segunda parte de este capítulo recorre el proceso de la entrevista, de principio a fin. He asesorado a candidatos que apreciaron esta visión de conjunto, ya que los recursos en línea a menudo se centran en partes específicas de la entrevista, pero no en cómo se conectan todas juntas y dan lugar a una oferta. Especialmente para los recién licenciados2 y lectores procedentes de distintos sectores, este capítulo ayuda a poner a todos de acuerdo y aclara el proceso.

Las piezas interconectadas de las entrevistas son complejas, con muchos tipos de combinaciones dependiendo de la función de ML a la que aspires. Esta visión general te ayudará a preparar el terreno, para que sepas en qué centrar tu tiempo. Por ejemplo, algunos recursos en línea se centran en conocimientos específicos para "científicos de datos de producto", pero titularán el curso o el artículo "consejos para la entrevista de científico de datos" sin diferenciarlo. Para un recién llegado, es difícil saber si eso es relevante para sus propios intereses profesionales. Después de este capítulo, serás capaz de decir qué habilidades se requieren para cada puesto de trabajo, y en el Capítulo 2, serás capaz de analizar esa información tú mismo a partir de las ofertas de empleo y hacer que tu currículum sea lo más relevante posible para el puesto y la oferta de empleo.

Visión general de este libro

Este capítulo se centra en ayudarte a a diferenciar entre las distintas funciones de ML, y recorre todo el proceso de la entrevista, como se ilustra en la Figura 1-1:

Overview of this book’s chapters and how they tie into the ML interview process
Figura 1-1. Visión general de los capítulos y su relación con el proceso de la entrevista de ML.

Dependiendo de dónde te encuentres en tu viaje hacia la entrevista de ML, te animo a que te centres en los capítulos y secciones que te parezcan relevantes. También he planeado el libro para que te sirva de referencia a medida que avanzas; por ejemplo, podrías iterar sobre tu currículum varias veces y luego volver al Capítulo 2 cuando sea necesario. Lo mismo se aplica a los demás capítulos. Con esta visión general, continuemos.

Consejo

El sitio web complementario de este libro, https://susanshu.substack.com, incluye contenidos adicionales, recursos de ayuda y mucho más.

Breve historia de los puestos de aprendizaje automático y ciencia de datos

En primer lugar, repasemos en una breve historia de los títulos de los puestos de trabajo. Decidí empezar con esta sección para disipar algunos mitos sobre el título de trabajo de "científico de datos" y arrojar algo de luz sobre por qué hay tantos títulos de trabajo relacionados con el ML. Después de comprender esta historia, deberías ser más consciente de a qué títulos laborales aspirar tú mismo. Si alguna vez te has sentido confundido por la letanía de títulos como ingeniero de aprendizaje automático (MLE), científico de datos de producto, ingeniero de MLOps, etc., esta sección es para ti.

Las técnicas de ML no son algo nuevo; en 1985, David Ackley, Geoffrey E. Hinton y Terrence J. Sejnowski popularizaron el algoritmo de la Máquina de Boltzmann.3 Incluso antes de eso, las técnicas de regresión4 tuvieron sus primeros desarrollos en el siglo XIX. Desde hace mucho tiempo existen trabajos y funciones que utilizan técnicas de modelización para prever y predecir. Los econometristas, los estadísticos, los modelizadores financieros, los modelizadores físicos y los modelizadores bioquímicos existen como profesiones desde hace décadas. La principal diferencia es que los conjuntos de datos eran mucho más reducidos que en la actualidad (salvo las simulaciones).

No fue hasta los últimos años, justo antes del siglo XXI, cuando la potencia de cálculo empezó a aumentar exponencialmente. Además, los avances en computación distribuida y paralela crearon un ciclo en el que los "grandes datos" se hicieron más fácilmente accesibles. Esto permitió a los profesionales aplicar esa potencia de cálculo avanzada a millones o miles de millones de puntos de datos.

Se empezaron a acumular y distribuir conjuntos de datos más grandes para la investigación del ML, como WordNet5 y, posteriormente, ImageNet,6 un proyecto dirigido por Fei-Fei Li. Estos esfuerzos colectivos sentaron las bases para aún más avances en ML. AlexNet7 se publicó en 2012, logrando una gran precisión en el reto ImageNet,8 lo que demostró que el aprendizaje profundo puede ser experto en tareas similares a las humanas a una escala que no se había visto antes.

Muchos profesionales del ML ven esta época como un momento en el que el aprendizaje automático, el aprendizaje profundo y los temas relacionados aumentaron a pasos agigantados en términos de reconocimiento por parte de la población en general, no sólo de la comunidad de la IA. La reciente popularidad de la IA generativa (como ChatGPT) en 2022 y 2023 no surgió de la nada, como tampoco lo hicieron los deepfakes, los coches autoconducidos, los bots de ajedrez y otros que vinieron antes; estas aplicaciones fueron el resultado de muchos avances en los últimos años.

"Científico de datos" como título de trabajo comenzó como un término paraguas, cuando los campos del ML y los datos estaban menos maduros. El término "científico de datos" en Google Trends, que mide la popularidad de los términos de búsqueda, se disparó en 2012. Ese fue el año en que se publicó ese artículo en Harvard Business Review: "Científico de datos: El trabajo más sexy del siglo XXI".9 En abril de 2013, la popularidad de búsqueda de "científico de datos" ya estaba empatada con la de "estadístico" y posteriormente la superó en magnitudes, como se muestra en la Figura 1-2. Sin embargo, por aquel entonces no existía una división tan estrecha entre los trabajos de infraestructura y la formación de modelos. Por ejemplo, Kubernetes se lanzó por primera vez en 2014, pero las empresas han tardado algún tiempo en adoptarlo para orquestar trabajos de ML. Así que ahora hay puestos de trabajo más específicos para la infraestructura de ML que antes no existían.

Search popularity for the terms “data scientist,” “machine learning engineer,” and “statistician” on Google Trends (retrieved August 9, 2023)
Figura 1-2. Popularidad de búsqueda de los términos "científico de datos", "ingeniero de aprendizaje automático" y "estadístico" en Google Trends (recuperado el 9 de agosto de 2023).

A medida que aumentaron las redes sociales, los sistemas de recomendación web y otros casos de uso modernos, las empresas empezaron a recopilar datos mucho más granulares, como los datos clickstream, que son los datos recogidos cuando un usuario navega por un sitio web o una aplicación. Otro avance reciente es que una empresa media puede almacenar la enorme cantidad de telemetría procedente de máquinas y dispositivos del Internet de las Cosas (IoT). Antes, los científicos de datos podían haber trabajado con datos que se actualizaban semanal o diariamente. Ahora, como muchas aplicaciones se actualizan con más frecuencia o en tiempo real, se necesita más infraestructura para servir a la funcionalidad ML en productos web y aplicaciones, por lo que también se han creado más puestos de trabajo en torno a esas funciones.

En resumen: a medida que el ciclo de vida del aprendizaje automático se hacía más complejo, se crearon más títulos de puestos de trabajo para describir las nuevas habilidades que ahora requiere un equipo completo de ML. Más adelante, en este capítulo, hablaré con más detalle de los títulos de los puestos y del ciclo de vida del ML.

Todo esto ocurrió en la última década, y las empresas no siempre cambian los títulos de sus puestos para reflejar cómo se han ido especializando las funciones. En cualquier caso, como candidato, conocer esta historia puede ayudarte a reducir la confusión y la frustración de solicitar un trabajo y descubrir que la función es diferente de la de otra empresa con exactamente el mismo título. Consulta la Tabla 1-1 para ver las tendencias anteriores en los títulos de los puestos relacionados con el ML y la Tabla 1-2 para ver las tendencias actuales en los títulos de los puestos relacionados con el ML.

Con esta historia para explicarte por qué te encontrarás con distintos títulos de trabajo, te explicaré en detalle cada uno de estos títulos de trabajo y sus responsabilidades.

Puestos de trabajo que requieren experiencia en ML

Aquí tienes una lista no exhaustiva de títulos de puestos de trabajo para funciones de ML (o estrechamente relacionadas):

  • Científico de datos

  • Ingeniero de aprendizaje automático

  • Científico aplicado

  • Ingeniero de software, aprendizaje automático

  • Ingeniero MLOps

  • Científico de datos de producto

  • Analista de datos

  • Científico de la decisión

  • Ingeniero de datos10

  • Científico investigador

  • Ingeniero de investigación11

Como comenté en "Breve historia de los títulos de los puestos deaprendizaje automático y ciencia de datos", cada función es responsable de una parte diferente del ciclo de vida del aprendizaje automático. Un título de trabajo por sí solo no transmite lo que implica el trabajo. Como demandante de empleo, ten cuidado: ¡en distintas empresas, títulos completamente diferentes pueden acabar haciendo trabajos similares! Como se ilustra en la Figura 1-3, el título de tu puesto de ML dependerá de la empresa, del equipo y de la parte o partes del ciclo de vida del ML de las que sea responsable tu función.

Para dar ejemplos concretos de cómo los títulos de los puestos pueden depender de la empresa u organización que contrata para el puesto -basándome en personas reales con las que he hablado, descripciones de puestos y entrevistas de trabajo-, la persona de responsable de la formación de los modelos de ML, pero no de la construcción de la plataforma subyacente, podría llamarse así:

  • Ingeniero de software (ML) o científico de datos (Google)

  • Científico aplicado (Amazon)

  • Ingeniero de aprendizaje automático (Meta, Pinterest)

  • Científico de datos (Elastic, el equipo donde trabajo)

  • Científico de datos (Unity)

What’s in a machine learning job title?
Figura 1-3. ¿Qué hay en un puesto de aprendizaje automático?
Nota

Para cuando se publique este libro, es posible que alguno de los títulos de los puestos de trabajo de estas empresas y equipos haya cambiado. En cualquier caso, demuestra que los títulos de ML pueden variar entre empresas e incluso entre distintos equipos de una misma empresa.

El título del puesto también depende de la organización, el departamento, etc. Algunos departamentos de Google tienen el título de científico de datos12 y otros no. En las empresas en las que he trabajado, mis equipos tenían científicos de datos que entrenaban modelos ML mientras los MLE construían la infraestructura (trabajando todo el día en herramientas como Kubernetes, Terraform, Jenkins, etc.). En otras empresas, son los MLE quienes entrenan los modelos ML.

Como ejemplo personal, mi experiencia laboral ha consistido en gran medida en la formación de modelos de ML, por lo que solicito empleos que tengan el título de "ingeniero de aprendizaje automático" o "científico de datos". Proporcionaré más ejemplos de habilidades y funciones que podrían encajar bien con tus intereses y habilidades en las siguientes secciones.

Ciclo de vida del aprendizaje automático

En la industria, es una expectativa para que los proyectos de ML aplicado acaben mejorando la experiencia del cliente: por ejemplo, un mejor sistema de recomendación que muestre al usuario vídeos, noticias y publicaciones de medios sociales más relevantes. En la industria, "cliente" también puede significar clientes internos: personas dentro de la misma empresa u organización. Por ejemplo, tu equipo crea modelos ML que predicen la demanda, lo que ayuda al departamento de logística de tu empresa a planificar mejor sus programas de envío. Independientemente de si el usuario es externo o interno, hay muchos componentes implicados en la creación de un producto ML completo, de principio a fin. Te mostraré un ejemplo simplificado.

En primer lugar, tiene que haber datos, ya que la mayoría del ML se entrena y prueba con grandes cantidades de datos. Alguien tiene que asegurarse de que los datos en bruto se introducen (ingestan) para que sean fácilmente accesibles más adelante para el análisis de datos, el ML, la elaboración de informes y el monitoreo, etc. Esto se ilustra en el paso A (datos) de la Figura 1-4.

A continuación, con los datos en su sitio, alguien con conocimientos de algoritmos y herramientas de ML utilizará los datos para iniciar el desarrollo del ML. Esto se ilustra en el paso B (desarrollo del aprendizaje automático) de la Figura 1-4. Esto implica ingeniería de características, entrenamiento de modelos y evaluación. Si los resultados no son buenos, hay mucha iteración en el paso B, y esta persona podría mejorar su ingeniería de características o el entrenamiento del modelo, o incluso volver al paso A y solicitar que se ingieran más datos.

Una vez que los resultados sean algo satisfactorios, pasarán al paso C (implementación del aprendizaje automático), que conecta los modelos de ML con los clientes. Dependiendo del tipo de proyecto de ML, podría desplegarse en un sitio web, una aplicación, un panel de control interno, etc. Por supuesto, les gustaría asegurarse de que el ML funciona correctamente, por lo que cualquier buen equipo tendrá una forma de monitorizar los resultados. En el ML hay dos tipos principales de problemas potenciales. El primero es que algo en la capa de software no funcione, como errores en el código. El segundo es un problema de los datos o del modelo de ML: por ejemplo, en la fase de desarrollo del modelo, éste produce resultados normales, pero tras la implementación/lanzamiento, hay un desequilibrio de los datos, por lo que los resultados del modelo se vuelven indeseables. A partir del paso C, puede haber más iteraciones de vuelta al paso B para mejorar los modelos y volver a realizar más experimentos en el paso C.

Machine learning lifecycle (the graph is simplified for understanding)
Figura 1-4. Ciclo de vida del aprendizaje automático (el gráfico está simplificado para facilitar la comprensión).

En el ciclo de vida del aprendizaje automático que acabo de recorrer, se requieren muchas habilidades. Canalizaciones de datos, formación de modelos, mantenimiento de la integración continua y la implementación continua (CI/CD): como candidato a un puesto de trabajo, ¿qué deberías aprender para prepararte para la entrevista? Afortunadamente, como mencioné en "Breve historia de los puestos deaprendizaje automático y ciencia de datos", hoy en día las empresas pueden contratar a personas que tengan un subconjunto de estas habilidades. Por ejemplo, necesitan algunas personas especializadas en el paso A (ingeniería de datos), otras especializadas en el paso B (desarrollo de ML), otras en el paso C (implementación de ML), etc. Hago hincapié en el "podría", ya que sigue siendo diferente según la empresa o el equipo; voy a recorrer algunos escenarios.

Startups

Las funciones de las startups suelen llevar más sombreros, lo que significa que tendrán que realizar las tareas en varios pasos del ciclo de vida del aprendizaje automático, como se ilustra en la Figura 1-4. He aquí un ejemplo:

Éramos un equipo de entre 5 y 25 ingenieros de ML y teníamos que participar regularmente en la creación de trabajos de etiquetado de datos, pruebas de control de calidad y mejoras de rendimiento (en dispositivos móviles), además de preparar demostraciones.

Dominic Monn, Consejero Delegado de MentorCruise (seis años previos en startups de ML)

Normalmente, las empresas de nueva creación tienen el objetivo de lanzar13 un producto integral, pero como tienen menos clientes, es posible que se preocupen menos por la escala y la estabilidad (en una fase inicial). Por lo tanto, es más probable que la persona que desarrolla y entrena los modelos de ML sea la misma que realiza el análisis de datos y la presentación a las partes interesadas, o incluso la misma que construye la infraestructura de la plataforma. Un equipo de ML en una startup puede tener simplemente menos personas. Por ejemplo, la startup podría tener 30 ingenieros de software y personal de datos en total, mientras que las grandes empresas podrían tener un equipo de analistas de datos formado sólo por 30 personas para dispersar la carga de trabajo.

Equipos ML más grandes

Si la empresa y/o el equipo han crecido lo suficiente, lo más probable es que las funciones de ML se hayan especializado. Generalmente, cuanto mayor es el equipo, más especializado es el papel. Si el "ingeniero de aprendizaje automático" de una gran empresa entrena modelos, es probable que no lleve dos o tres sombreros a la vez, como podría hacer en una startup. En su lugar, la gran empresa contrata a más personas para desempeñar esas funciones. Eso no quiere decir que el trabajo sea más sencillo en una empresa más grande. De hecho, a menudo hay más datos, más escala y más desventajas si la funcionalidad ML falla, por lo que el tiempo de cada MLE podría estar completamente ocupado llevando un solo sombrero.

Nota

El mayor tamaño de una empresa suele corresponderse con equipos de ML más grandes, pero depende. Por ejemplo, una gran empresa de un sector tradicionalmente no tecnológico, podría tener su primer equipo de ML contratado en un entorno más parecido al de una startup, mientras averiguan cómo funciona mejor el ML para la empresa.

Vayamos un nivel más allá y añadamos más detalles sobre las responsabilidades del ML o de los datos. La Figura 1-5 amplía el ciclo de vida del aprendizaje automático de la Figura 1-4 para reflejar equipos o empresas con funciones más detalladas. (Merece la pena repetir que, aunque esta lista es una heurística lo suficientemente útil y común, sigue siendo un poco simplificada a efectos ilustrativos, ya que siempre habrá excepciones y valores atípicos).

Machine learning lifecycle with more fine-grained roles (extended version of Figure 1-4)
Figura 1-5. Ciclo de vida del aprendizaje automático con funciones más precisas (versión ampliada de la Figura 1-4).

He aquí un ejemplo de lo que tu función podría ser responsable dentro de estas funciones más detalladas, como se ilustra en la Figura 1-5:

  • Construyes los pipelines de datos para análisis y ML (paso A).

  • Entrenas modelos ML (paso B).

  • Construyes la infraestructura para la implementación de los modelos de ML (paso C.1).

  • Diseñas y realizas pruebas de hipótesis, a menudo pruebas A/B, para las nuevas características del producto ML (paso C.2).

  • Realizas análisis de datos, elaboras informes y cuadros de mando, y los presentas a las partes interesadas (paso D).

Consejo

A menudo se hace referencia ala Figura 1-5 en capítulos posteriores, ¡así que guárdala o márcala!

Los tres pilares de las funciones del aprendizaje automático

Para preparar el terreno para el resto del libro, repasaré lo que yo llamo los tres pilares de las funciones del ML y la ciencia de datos:

  • Algoritmos de aprendizaje automático e intuición de datos

  • Conocimientos de programación e ingeniería de software

  • Capacidad de ejecución y comunicación

Éstas son las grandes categorías de habilidades que se evaluarán en las entrevistas de trabajo de ML. Este libro se centra mucho en ayudarte a comprender estas habilidades y a salvar las distancias entre tus experiencias y habilidades actuales y las de estos tres pilares (ver Figura 1-6). Todas estas habilidades se ampliarán en los capítulos siguientes.

Three pillars of machine learning jobs
Figura 1-6. Tres pilares de los trabajos de aprendizaje automático.

Algoritmos de Aprendizaje Automático e Intuición de Datos: Capacidad de adaptación

Eres capaz de entender el funcionamiento subyacente de los algoritmos de ML y la teoría estadística y sus respectivas compensaciones, lo que es esencial cuando te enfrentas a una pregunta abierta en un proyecto de ML del mundo real en el trabajo. No te limitarás a seguir los pasos como harías para un trabajo escolar.

Tener intuición de datos significa que cuando te enfrentas a un nuevo problema, sabes cómo utilizar los datos para resolverlo; y cuando encuentras nuevos datos o fuentes de datos, sabes cómo sumergirte para evaluarlos. Te preguntas, ¿son estos datos adecuados para el ML? ¿Para qué tipos de modelos de ML podrían ser adecuados? ¿Hay algún problema con los datos antes de que puedas utilizarlos para ML? Sabes qué preguntar y cómo encontrar las respuestas.

En el proceso de entrevista de trabajo de ML, varios tipos de entrevistas y preguntas de entrevista tienen como objetivo evaluar los conocimientos y la preparación de un candidato en este pilar, que trataré en los Capítulos 3 y 4.

Programación e ingeniería de software: Capacidad de Construir

Mientras trabajas en un proyecto, tienes los conocimientos de programación necesarios para llevarlo a cabo, como manipular datos con Python o utilizar un proceso de implementación interno para que otro equipo pueda utilizar los resultados del modelo ML.

Aunque conozcas bien la teoría, sin la programación o la ingeniería de software14 no podrás materializar el ML de la nada. Necesitas utilizar código para conectar los datos con los algoritmos de ML, que también se implementan con código, es decir, debes convertir la teoría en práctica.

Otras habilidades de programación muy demandadas para los puestos de ML son la capacidad del ingeniero (de software) para pasar del prototipo a la producción, es decir, para integrar y lanzar el ML. Algunas funciones son responsables del ML de principio a fin: desde la investigación y la formación de modelos hasta la implementación y la producción. Algunas funciones de ML, como los ingenieros de MLOps, son responsables de crear una infraestructura de software que pueda hacer frente a las exigencias de procesar grandes cantidades de datos para enviar respuestas de ML a los usuarios en segundos o incluso milisegundos.

En el proceso de entrevista de trabajo de ML, varios tipos de entrevistas y preguntas de entrevista evalúan las habilidades de un candidato en este pilar, que trataré en los Capítulos 5 y6.

Ejecución y Comunicación: Capacidad para hacer las cosas en equipo

Puedes trabajar con personas que no desempeñan el mismo papel que tú. En ML, trabajamos con ingenieros de software, ingenieros de datos, gestores de productos y muchos otros colegas. La capacidad de hacer las cosas en equipo engloba algunas habilidades blandas, como la comunicación y algunas habilidades de gestión de proyectos.

Por ejemplo, no poder comunicarte con los miembros del equipo es un verdadero bloqueo15 para los proyectos y puede hacer que tus proyectos de ML languidezcan o incluso pierdan prioridad. Incluso en los casos en que trabajas con una sola persona (digamos, tu jefe), sigues necesitando poder informar sobre tus proyectos, lo que requiere habilidades de comunicación. En consecuencia, en el campo del ML, una habilidad muy demandada es ser capaz de comunicar conceptos técnicos con partes interesadas no técnicas.

También necesitarás algunas habilidades de gestión de proyectos para mantener el rumbo de tus tareas. Todos aprendemos a gestionar nuestras listas de tareas y calendarios durante el proceso de formación o autoaprendizaje, pero es más caótico, ya que ahora tu calendario de proyectos depende de los calendarios y prioridades de los demás. Aunque tengas un gestor de proyectos y/o de productos para mantener al equipo en el buen camino, sigues teniendo que gestionarte a ti mismo hasta cierto punto.

Sin habilidades blandas, las cosas no se hacen, y punto. No seas ese candidato que se centra sólo en las habilidades técnicas pero descuida la construcción y demostración de sus habilidades blandas en las entrevistas. Profundizaré en los detalles de cómo las entrevistas de ML evalúan a los candidatos en este pilar en el Capítulo 7.

Requisitos mínimos de compensación en los tres pilares del LD

Desarrollar tus habilidades en los tres pilares del ML es una tarea difícil, y para los puestos de nivel inicial normalmente sólo se espera que tengas un mínimo (como un 3/10) en cada pilar, como se ilustra en la Figura 1-7. Por ejemplo, a un candidato a un puesto de trabajo que tenga cierta exposición a la programación, aunque no sea hábil ni tenga experiencia, se le puede enseñar a mejorar. Lo ideal sería que fuera más fuerte en al menos un pilar (como 5/10 para programación) que esté más relacionado con la función de ML concreta, para destacar entre los demás candidatos a un puesto de trabajo.

Minimum required skill levels for ML jobs (example)
Figura 1-7. Niveles mínimos de cualificación requeridos para los trabajos de ML (ejemplo).

Para los puestos superiores, los requisitos mínimos de son mayores, pero se aplica una regla general similar: supera los requisitos mínimos de aptitud. A partir de ahí, te compararán con otros candidatos en función de las habilidades en las que destaques, dependiendo del puesto. Los científicos de datos que sólo entrenan modelos de ML pero no los implementan puede que no necesiten desarrollar sus habilidades de programación tanto como sus habilidades de teoría y comunicación de ML.

Para puestos de nivel inicial, yo diría que el pilar de la comunicación tiene un requisito menor (pero no 0/10, ¡por favor!) porque se necesita la experiencia duramente adquirida de trabajar con un grupo más amplio de personas, incluidos compañeros de equipo no técnicos, para elevarlo. Esto también da ventaja a algunos candidatos en este pilar: para los que tienen una formación no tradicional, como los candidatos autodidactas o los que pasan de desempeñar funciones de ingeniería de software o de otro campo, la capacidad de contar hábilmente una historia y mostrar un portafolio puede diferenciarlos de otros candidatos.

Ahora que ya tienes una visión general de los tres pilares, puedes utilizar este modelo mental para destacar.

Matriz de habilidades de aprendizaje automático

¡Enhorabuena! ¡Has llegado al final de una sección bastante densa! Ahora que has repasado la visión general del ciclo de vida del aprendizaje automático y los tres pilares de las habilidades de ML, es hora de que asignes tus intereses y habilidades a los puestos de trabajo.

La Tabla 1-3 te dará una idea aproximada de las habilidades que necesitarás aprender para tener éxito en funciones específicas. En una escala de una a tres estrellas, una estrella representa una habilidad de menor importancia, y tres estrellas representa una habilidad de gran importancia.

Tabla 1-3. Matriz de competencias en aprendizaje automático y datos


Habilidades
Cargos
Datos
científico de datos (DS)
Ingeniero ML
(MLE)
MLOps
ingeniero
Datos
ingeniero
Datos
analista
Visualización de datos, comunicación ★★★ ★★ ★★★
Exploración de datos, limpieza, intuición ★★★ ★★★ ★★★ ★★★
Teoría ML, estadística ★★★ ★★★ ★★
Herramientas de programación (Python, SQL) ★★★ ★★★ ★★★ ★★★
Infraestructura de software (Docker, Kubernetes, CI/CD) ★ a ★★★ ★★★
Consejo

A menudo se hace referencia ala Tabla 1-3 en capítulos posteriores, ¡así que guárdala o márcala!

Si echas un vistazo a estas habilidades, puedes asignarlas aproximadamente a los tres pilares de las habilidades de ML de la sección anterior, como se muestra en la Tabla 1-4.

Tabla 1-4. Habilidades de aprendizaje automático y datos asignadas a los tres pilares de los trabajos de ML
Pilar Conocimientos de ML y datos
Pilar 1 Algoritmos de aprendizaje automático e intuición de datos: capacidad de adaptación Exploración de datos, limpieza, intuición
Teoría del aprendizaje automático, estadística
Visualización de datos
Pilar 2 Conocimientos de programación e ingeniería de software: capacidad para construir Herramientas de programación (Python, SQL)
Infraestructura de software
Pilar 3 Habilidades de ejecución y comunicación: capacidad para hacer las cosas en equipo Comunicación, etc.

No pasa nada si todavía no estás completamente seguro de lo que puede implicar cada tipo de habilidad. En el Capítulo 2, volveremos sobre esta matriz, y habrá detalles y una lista de comprobación para la autoevaluación.

Ahora, unamos todo esto. Hemos visto el ciclo de vida del aprendizaje automático(Figura 1-5) y la matriz de competencias del aprendizaje automático(Tabla 1-3). Lo que queda es ver a qué puestos de trabajo te conviene presentarte ahora o adquirir las habilidades necesarias. Para ello, conectemos todo con la tendencia actual de los títulos de los puestos de trabajo de ML y datos(Tabla 1-2). Esto se ilustra en la Figura 1-8.

Common ML job titles and how they correspond to the machine learning lifecycle
Figura 1-8. Títulos de trabajo habituales en ML y su correspondencia con el ciclo de vida del ML.

Las anotaciones alfabéticas de la Figura 1-8 pueden corresponderse con las de la Figura 1-5, enumeradas aquí por comodidad:

  • (A) Datos

  • (B) Desarrollo del aprendizaje automático

  • (C.1) Infraestructura ML/software

  • (C.2) Comprobación/monitoreo de hipótesis de LD

  • (D) Informes y cuadros de mando

Consejo

A menudo se hace referencia ala Figura 1-8 en capítulos posteriores, ¡así que guárdala o márcala!

Cuando veas el título de un puesto y compruebes los detalles de la oferta de empleo, podrás establecer una correspondencia con lo que ese puesto probablemente sea responsable en el día a día. Además, basándote en qué parte del ciclo de vida del ML te interesa, puedes preparar y orientar mejor tus solicitudes de empleo, para no ladrar accidentalmente al árbol equivocado.

Introducción a las Entrevistas de Trabajo ML

Ahora que he presentado muchos puestos de trabajo que podrían interesarte, ¡es hora de repasar todos los pasos y tipos de entrevistas que te encontrarás durante el proceso! Este libro se titula Entrevistas de Aprendizaje Automático, pero las entrevistas son mucho más que preguntas de entrevista. Están las solicitudes de empleo y tu currículum, que son cómo consigues las entrevistas en primer lugar. Si no aumentas tus posibilidades de conseguir más entrevistas, ¡ni siquiera tendrás la oportunidad de responder a las preguntas de la entrevista! Cubriré el proceso de principio a fin, incluido cómo hacer un seguimiento después de la entrevista(Capítulo 9).

Proceso de entrevista de trabajo en Aprendizaje Automático

Ahora vamos a entrar en todo el proceso de entrevista de trabajo. Empezarás solicitando puestos de trabajo, luego te entrevistarás y, tras algunas rondas de entrevistas, finalmente recibirás ofertas. Este proceso se detalla en la Figura 1-9.

Consejo

A menudo se hace referencia ala Figura 1-9 en capítulos posteriores, ¡así que guárdala o márcala!

ML interview process
Figura 1-9. Proceso de la entrevista ML.

Solicitar empleo a través de sitios web o bolsas de trabajo

Imaginemos que acabas de empezar y solicitas un puesto de ML en una empresa con un proceso de RRHH y contratación establecido.17 y de contratación. Puedes empezar tu solicitud de varias maneras: presentándote en frío a través del sitio web de la empresa o de la bolsa de trabajo (de lo que hablamos en el Capítulo 2) o a través de una recomendación de alguien del equipo o de la empresa. También puedes conseguir entrevistas a través de mensajes en frío en LinkedIn o enviando correos electrónicos a los reclutadores. Normalmente, en las empresas que tienen un sistema de software de seguimiento de RRHH, aunque alguien te recomiende, tendrás que cargar una solicitud estándar en el portal online, lo que significa que tendrás que preparar un currículum actualizado y rellenar tus datos.

Nota

También puedes optar por complementar tus esfuerzos de búsqueda de empleo trabajando con un reclutador externo, que es diferente de un reclutador interno que trabaja o contrata específicamente para la empresa contratante. Los reclutadores externos suelen trabajar con varias empresas a la vez. Los compañeros profesionales que conozco recomiendan trabajar sólo con determinados reclutadores externos de confianza, pero me advirtieron de que tuviera cuidado con los que hacen demasiadas promesas poco realistas o no tienen buena reputación. Puedes leer más sobre los reclutadores externos en este artículo deForbes.

Revisión del currículum vitae de las solicitudes a través del sitio web o de la bolsa de trabajo

Con el primer método -la solicitud en frío a través de sitios web de empresas o bolsas de trabajo de terceros- has estado navegando por bolsas de trabajo como Indeed18 así como accediendo directamente a las páginas de empleo de las empresas en las que te interesa trabajar. En este caso, no tienes a nadie que te haya remitido al equipo o a la empresa (hablaré de ello en "Solicitud a través de una remisión"). Has visto algunos empleos relacionados con el ML que parecen relevantes para ti, y has hecho clic en los enlaces para presentar tu candidatura. Después de enviar tu solicitud y de que la empresa tenga tu información y currículum, un miembro de RRHH, un reclutador o quienquiera que esté a cargo de la selección de currículum, procederá con el siguiente paso.

La realidad es que los puestos de trabajo tienen muchos solicitantes, y debes suponer que la primera tanda de solicitantes se filtrará antes de que el director de contratación los vea. El director de contratación es el director con el que trabajarás y al que informarás si te unes al equipo. Así que normalmente puedes suponer que un socio de RRHH generalizado o los reclutadores internos o externos leerán primero tu currículum. Estos reclutadores pueden estar algo familiarizados con las funciones para las que están seleccionando currículos, pero siguen siendo predominantemente generalistas, no tan especializados como los ingenieros y profesionales de ML con los que trabajarás realmente. Esta parte del proceso de selección conduce a varios criterios ocultos para tu currículum, por lo que puede resultar desconcertante que tu currículum no supere este paso aunque tengas una formación relevante.

Es importante recordar que estos generalistas probablemente pasarán tu currículum al director de recursos humanos si es que lo hacen:

  • Ver las tecnologías o experiencias clave en tu currículum según la oferta de empleo

  • Ver años de experiencia en tecnologías o experiencias clave o, en el caso de puestos de nivel inicial o de nuevo graduado, pruebas suficientes de que puedes formarte fácilmente

  • Comprender que tus habilidades y logros son relevantes, en un lenguaje sencillo

Para determinar si tu currículum cumple los criterios, es probable que el reclutador busque palabras clave y compare tu currículum con la oferta de empleo. No "traducirán" automáticamente por ti las habilidades de tu currículum. Por ejemplo, si la descripción del puesto dice "Python" y tu currículum dice "C++", en este paso probablemente no tendrán en cuenta que, dado que ambos lenguajes de programación están orientados a objetos, probablemente podrías aprender Python rápidamente si te esforzaras.

Si eres capaz de describir tus experiencias a un nivel que los reclutadores de RRHH puedan entender que es relevante para la oferta de empleo, aumentarás tus posibilidades en el paso de selección del currículum. Los reclutadores y RRHH, por la naturaleza de su función, conocen las tecnologías de alto nivel y lo que es popular en los puestos para los que contratan, pero no los detalles, por lo que es importante que tu currículum esté bien optimizado. (Lee más sobre cómo optimizar tu currículum en el Capítulo 2.)

Solicitar a través de una recomendación

Ahora que he recorrido solicitudes en frío directamente a través de bolsas de trabajo o sitios web sin ninguna recomendación, voy a dar algunos ejemplos de cómo las recomendaciones pueden ayudarte a acelerar el proceso.

Supongamos que te interesa un trabajo de ML en ARI Corporation.19 Conoces a un antiguo alumno de tu universidad que trabaja en el equipo de ML. Te pones al día con él y le expresas tu interés por el puesto. Durante la charla, le enseñas al antiguo alumno algunos de tus proyectos personales de ML, que son relevantes para el puesto de ML que te interesa. El antiguo alumno acepta recomendarte y te da instrucciones sobre cómo hacerlo, algo que depende de cómo esté configurado el sistema de RRHH de la empresa.

Dado que este antiguo alumno te conoce y está dispuesto a avalar tus aptitudes tras ver tus proyectos personales, conseguirás que tu currículum llegue a la "cima del montón". Dependiendo de la fuerza de la recomendación, puedes saltarte la selección del currículum y obtener una llamada de un reclutador con todas las garantías, o incluso pasar directamente por encima del reclutador y llegar al resto de las rondas de entrevistas. Esto se ilustra en la Figura 1-11. Ten en cuenta que aquí digo "altamente" garantizado, ya que sigue dependiendo de varios factores, como el calendario. Por ejemplo: puede que te hayan recomendado, pero casualmente el puesto de trabajo acaba de cubrirse. Por tanto, no llegaste al resto de la entrevista.

En el Capítulo 2 hablaré más sobre las referencias y cómo conseguirlas a través de redes profesionales.

The interview process can be shortcut with a strong referral
Figura 1-11. El proceso de la entrevista puede acortarse con una referencia sólida.

Lista de control previa a la entrevista

¡Te han invitado a una entrevista! ¿Cómo puedes dar lo mejor de ti? Puede que el tiempo sea limitado; ¿qué haces para asegurarte de que puedes maximizar tus resultados?

Revisa tus notas y las preguntas que hayas hecho a tientas

Mi táctica personal es, en primer lugar, acotar los tipos de preguntas que podrían formularse. Por ejemplo, en la primera ronda de una entrevista en Amazon, el reclutador ha esbozado el formato y se centrará en preguntas de teoría estadística. Leeré recursos en Internet, ojearé mis notas y veré en qué temas soy más débil. Me centraré menos en las preguntas que sé que puedo responder con seguridad y más en las que parece más probable que me hagan pero que no conozco bien. En cuanto a cómo "adivino" lo que es probable que me pregunten, me baso sobre todo en las conversaciones con el reclutador y en mis preguntas de seguimiento al reclutador o al director de contratación. No soy muy preciso adivinando, y esto es parecido a intentar adivinar lo que saldrá en un examen universitario: ¡puede salir bien o puede ser contraproducente!

En cualquier caso, existe la disyuntiva entre conocer bien un subconjunto de preguntas o conocer aproximadamente todas las preguntas pero no tan bien (profundidad frente a amplitud). Al revisar mis notas de preparación, yo personalmente opto por la amplitud, pero tus resultados pueden variar en función de lo bien que conozcas ya el material.

Programar la entrevista

Dependiendo de tu ubicación y de la de tus entrevistadores, puede haber diferencias horarias. Yo intento encontrar la hora en la que tengo más energía posible. A veces las franjas horarias disponibles para las entrevistas no son las ideales, así que elijo el menor de los males (por ejemplo, entrevistar desde GMT+8 y hablar con alguien en GMT-4 mientras viajo al extranjero).

Consejo

Para facilitar el cálculo de las zonas horarias de para los candidatos invitados a una entrevista, es habitual que el software de programación de RRHH tenga una función de calendario en la que puedes introducir tus horas preferidas y tendrá en cuenta tus zonas horarias locales. Sin embargo, a veces la hora se fijará mediante correos electrónicos de ida y vuelta, y herramientas como Calendly o Cal.com pueden ayudar.

Tanto como entrevistador como entrevistado, soy cauteloso a la hora de programar una entrevista justo al principio de la jornada laboral. Así tengo más tiempo para prepararme después de levantarme. Pero, por supuesto, si no hay otras franjas horarias disponibles, elegiré la hora más temprana.

Preparación técnica previa a la entrevista

Como entrevistador, he visto cómo las entrevistas de innumerables candidatos a empezaban con retraso por problemas de conexión o por utilizar un nuevo software de conferencia web; por ejemplo, por no poder configurar Zoom a tiempo porque no lo habían utilizado antes. Como candidata, he tenido tropiezos y pérdidas de tiempo al necesitar utilizar Microsoft Teams porque en mis ordenadores personales sólo tenía Zoom y Google Meet. Al final, utilicé la versión para navegador, pero hubo un problema con mi inicio de sesión, ya que mi cuenta de estudiante de Microsoft había caducado. Al final lo solucionamos, unos minutos más tarde. Esto se podría haber evitado si hubiera intentado iniciar sesión un poco antes o el día anterior a la entrevista.

Aquí tienes algunos consejos para que tu entrevista sea más fluida:

Procura estar en un entorno tranquilo.
Algunos programas, como Zoom, incorporan un sistema de cancelación de ruido bastante bueno, al igual que algunos auriculares inalámbricos.
Comprueba previamente el audio y el vídeo.
En cuanto al vídeo, asegúrate de que la iluminación es buena y de que el objetivo de la cámara está limpio. En cuanto al sonido, asegúrate de que el micrófono suena nítido. En Windows y Mac, hay aplicaciones integradas de cámara y grabación de voz que yo utilizo. También puedes iniciar una nueva sesión de Zoom, Google Meet o Teams y hacer una prueba.
Mantén una lista mental de opciones de copia de seguridad.
¿Se cayó de repente Internet en tu casa antes de la entrevista? ¿Hay algún café cercano con Internet (preferiblemente seguro) al que puedas ir? ¿Puedes utilizar los datos de tu teléfono? ¿Hay opciones de conexión telefónica en la invitación del calendario? Saber estas cosas de antemano puede ayudarte mucho. Yo he tenido que marcar una vez para ir a una entrevista y, por suerte, sabía que tenía la opción de hacerlo.

Selección de personal

¡Enhorabuena, tu currículum ha pasado la criba de currículum ! Ahora veamos un ejemplo para ilustrar lo que puede ocurrir a continuación.

Imaginemos que había 200 candidatos para el puesto. El reclutador los ha revisado y ha eliminado a 170 que carecían de experiencia relevante o que, por algún motivo, no parecían encajar en el puesto. Recuerda que esto se basa en la impresión que tu currículum dio al reclutador; es posible que con el mismo puesto y el mismo equipo de reclutadores, un currículum mejorado hubiera pasado. Si tuvieras una buena recomendación, es posible que tu currículum ya hubiera avanzado. Ahora que hay 30 candidatos, el reclutador llamará a cada uno de ellos; suele ser una entrevista más breve, de 15 a 30 minutos de duración. Nos referimos a esto como "selección del reclutador" o "llamada del reclutador".

En general, el reclutador quiere ver cómo eres como persona y si es fácil trabajar contigo. Si alguien afirma descaradamente tener una experiencia que no tiene, la llamada podría revelar experiencias laborales o escolares inventadas. Hay otras cuestiones logísticas que deben examinarse, como la ubicación, las expectativas salariales y la situación legal.

Consejo

El examen del reclutador es más una "prueba olfativa" que una prueba en profundidad de tus aptitudes técnicas y tu experiencia.

Mi consejo para tener éxito es optimizar para una cosa: que el reclutador entienda que eres un buen candidato, que tu experiencia es relevante (o que puedes aprender rápido), y que puedes encajar bien en el equipo y en el puesto para el que te están contratando. Esto es diferente de convencer a un director de contratación de las mismas cosas, o a un panel de entrevista de MLEs senior. En cambio, tendrás éxito aquí si haces el esfuerzo adicional de conectar tu currículum con la descripción del puesto en esta convocatoria.

Aquí tienes un ejemplo de viñetas en la descripción de un puesto:

  • "El candidato tiene experiencia con sistemas de recomendación".

  • "Experiencia con procesamiento de datos como Spark, Snowflake o Hadoop".

  • "El candidato tiene experiencia con Python".

Un mal ejemplo de cómo explicar tu experiencia en la llamada del reclutador para este trabajo es: "Para ese proyecto anterior, utilicé el algoritmo ALS, que se implementó con PySpark".

Un ejemplo mejor de cómo explicar tu experiencia en la llamada del reclutador para este trabajo es: "Para ese proyecto anterior, utilicé el algoritmo de mínimos cuadrados alternantes (ALS), que es un algoritmo de sistemas de recomendación basado en la factorización de matrices, y utilicé PySpark, que es Spark envuelto con una API de Python ". Observa que las frases en cursiva también aparecen en la descripción del puesto.

El mejor ejemplo permite al reclutador relacionar más de tus habilidades con la descripción del puesto, mientras que el mal ejemplo no se corresponde con las habilidades publicadas de forma obvia. Cuando escribes tu currículum, tienes un espacio limitado; la conversación en tiempo real de una entrevista es una oportunidad para que rellenes lagunas que el reclutador puede no haber advertido.

También es importante ampliar los acrónimos. Esto también se aplica a las entrevistas realizadas a personas técnicas. Yo estoy relativamente especializado en sistemas de recomendación y aprendizaje por refuerzo, pero no trabajo con tareas de visión por ordenador en mi día a día. Agradecí cuando un candidato al que entrevisté hablaba de proyectos de visión por ordenador y explicaba en general las técnicas más especializadas. Puedes (y debes) hacerlo de un modo que no sea condescendiente con tu entrevistador, tanto si es un reclutador como si forma parte de tu futuro equipo.

La llamada del reclutador es un buen momento para que tú, como candidato, también evalúes el trabajo. Puedes hacer preguntas que te interesen, para ver si debes continuar con la entrevista. Por ejemplo, podría preguntar por el tamaño del equipo y si este trabajo se centra más en responsabilidades de ML o de analista de datos. También puedes preparar algunas preguntas sobre la empresa y sus productos. Por ejemplo, ¿el proyecto actual del equipo se centra en mejorar la tasa de clics o el compromiso a largo plazo? Si eres usuario del producto, puede que tengas muchas ideas y preguntas que discutir. También es una oportunidad para mostrar tu entusiasmo y tus conocimientos sobre la empresa.

Visión general del bucle principal de la entrevista

Al siguiente paso. Buenas noticias: ¡el reclutador de te ha dado el visto bueno! Explicaste bien tu experiencia previa, y el reclutador pudo entender tu trabajo anterior y cómo se relaciona con la descripción del puesto que tienen a mano.

Pero aún no ha terminado. Estás entre otros 15 candidatos que han superado con éxito la primera criba del reclutador. El reclutador te informa de las próximas entrevistas técnicas, que incluyen teoría del ML, programación y una entrevista sobre un caso práctico. También hay entrevistas de comportamiento. Si las superas, llegarás a la entrevista presencial, que suele ser la ronda final. Hoy en día, también hay entrevistas presenciales virtuales y rondas finales. Si superas la ronda final, te harán una oferta.

Entrevistas técnicas

Vamos a desglosar los distintos tipos de entrevistas de que tienen lugar después de la selección del reclutador, siendo las primeras las entrevistas técnicas. Las entrevistas técnicas suelen realizarse con colaboradores técnicos individuales (CI), como un MLE o un científico de datos.

Puede haber varias rondas de entrevistas técnicas; puede haber una que sea una ronda de codificación centrada en los datos o una en la que el entrevistador presente algunos datos ficticios de ejemplo y te pida que utilices SQL o Python pandas/NumPy (a veces hay varias preguntas, y utilizas varias herramientas de programación a lo largo de la entrevista). Me extenderé más sobre este tipo de estructura y preguntas de la entrevista en el Capítulo 5.

Aparte de las entrevistas de programación centradas en el ML y los datos, es posible que te hagan preguntas del tipo "rompecabezas". Para este tipo de entrevista, podrías utilizar una plataforma de entrevistas como CoderPad o HackerRank, donde el entrevistador te presenta una pregunta y tú codificas en el entorno de desarrollo integrado (IDE) en línea que tanto tú como tu entrevistador podéis ver en tiempo real. A veces tendrás otros formatos, como inmersiones técnicas en profundidad, diseño de sistemas, ejercicios para llevar a casa en un repo privado o en Google Colab, etc. En los capítulos 5 y 6 explicaré con más detalle cómo prepararte para este tipo de entrevistas.

Estas rondas de entrevistas posteriores podrían reducir aún más el número de candidatos antes de la ronda final. En nuestro ejemplo, quince candidatos pasaron la criba del reclutador, y ocho pasaron la primera ronda de entrevistas técnicas. Tras la segunda ronda de entrevistas técnicas, nos quedamos con tres candidatos que pasarán a la entrevista in situ.

Entrevistas de comportamiento

Intercaladas durante el proceso de entrevista hay preguntas destinadas a evaluar cómo reaccionas en determinadas situaciones. La intención suele ser utilizar la experiencia pasada para predecir el rendimiento futuro y comprender cómo reaccionas ante situaciones de gran tensión o difíciles. Además, estas preguntas evalúan tus habilidades interpersonales, como la comunicación y el trabajo en equipo. Deberás preparar algunas experiencias pasadas y relatarlas a modo de cuento.

Por ejemplo, durante tu primera llamada de reclutamiento, el reclutador podría preguntarte sobre una ocasión en la que te enfrentaste a un plazo difícil en un proyecto. Una vez que hayas respondido, aún no estarás fuera de peligro. Durante la entrevista presencial, a menudo se dedica una hora a preguntas de comportamiento. Y en algunas entrevistas técnicas, es posible que te hagan un par de preguntas que son una mezcla entre una pregunta puramente técnica y una pregunta de comportamiento. Te ayudaré a tener éxito con las entrevistas conductuales en el capítulo 7, que también contiene consejos sobre la preparación específica para cada empresa, como los Principios de Liderazgo de Amazon.

La ronda final presencial

Para muchas empresas existe una ronda final "in situ" o su equivalente virtual. Suelen ser entrevistas consecutivas. Por ejemplo, empezando por la mañana, puede que te reúnas con un director técnico para una entrevista sobre un caso práctico y, a continuación, con un científico de datos senior para una entrevista sobre programación. Después de una pausa para comer, puede que te reúnas con dos científicos de datos que te preguntarán sobre teoría del ML, y luego el director de contratación te hará más preguntas de comportamiento e indagará sobre tus experiencias pasadas. Además de los entrevistadores técnicos, es posible que hables con una parte interesada (por ejemplo, un jefe de producto de un equipo adyacente con el que trabaje estrechamente el equipo para el que te entrevistas). En varias entrevistas de la ronda final por las que he pasado, había un entrevistador jefe de producto o alguien de otro departamento con el que el equipo de ML trabajaba estrechamente, como marketing o publicidad.

Algunas empresas tendrán una mini ronda adicional después de esto, como una charla rápida con un nivel superior (el jefe de tu jefe).

Resumen

En este capítulo, has aprendido sobre los distintos roles de ML, el ciclo de vida de ML y las distintas responsabilidades que se asignan al ciclo de vida de ML. También has visto cómo te abres camino desde el principio del proceso hasta la ronda final de entrevistas. Hay mucho que preparar y sobre lo que aprender, pero ahora tienes una visión general y, con suerte, algunas ideas sobre cómo puedes orientar tus preparativos.

Ahora que este capítulo ha sentado las bases, te explicaré una guía detallada de solicitud de empleo, que incluye una guía de currículum, para ayudarte a aumentar enormemente tus posibilidades de conseguir entrevistas.

1 Este libro se centra en las aplicaciones industriales del ML, en contraposición a los trabajos centrados principalmente en la investigación de los propios algoritmos de ML, la publicación en congresos, etc., que en su mayoría requieren un doctorado.

2 También denominados "freshers" en algunas regiones. En este libro, utilizaré el término "recién licenciados" o "recién graduados".

3 David H. Ackley, Geoffrey E. Hinton y Terrence J. Sejnowski, "Un algoritmo de aprendizaje para las máquinas de Boltzmann", Cognitive Science 9 (1985): 147-169, https://oreil.ly/5bY2p.

4 Jeffrey M. Stanton, "Galton, Pearson y los guisantes: Una breve historia de la regresión lineal para instructores de estadística", Journal of Statistics Education 9, no. 3 (2001), doi:10.1080/10691898.2001.11910537.

5 El sitio web oficial de WordNet ofrece más información.

6 Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li y Li Fei-Fei, "ImageNet: A Large-Scale Hierarchical Image Database", 2009 IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, EE.UU. (2009): 248–255, doi:10.1109/cvpr.2009.5206848.

7 Alex Krizhevsky, Ilya Sutskever y Geoffrey E. Hinton, "ImageNet Classification with Deep Convolutional Neural Networks", Advances in Neural Information Processing Systems 25 (NIPS 2012), https://oreil.ly/iFMkq.

8 Krizhevsky, Alex, Ilya Sutskever y Geoffrey E. Hinton, "Clasificación de ImageNet con redes neuronales convolucionales profundas", Communications of the ACM 60, nº 6 (2017): 84-90, doi:10.1145/3065386.

9 Thomas H. Davenport y DJ Patil, "Científico de datos: El trabajo más sexy del siglo XXI", Harvard Business Review, 19 de octubre de 2022, https://oreil.ly/fvroA.

10 El ML y la ciencia de datos utilizan datos; es poco probable que los ingenieros de datos utilicen ellos mismos técnicas de ML, pero su trabajo y colaboración forman parte integral de los flujos de trabajo de ML.

11 Serena McDonnell (científica de datos principal y ex de Shopify) señaló que en el ámbito de los fondos de cobertura, "científico de investigación" e "ingeniero de investigación" se utilizan para referirse a las funciones de ML.

12 También he visto ofertas de trabajo de científico investigador en Google, pero estos puestos son específicamente para investigar el ML, son responsables de publicar en grandes conferencias y requieren un título de doctorado.

13 Embarcar es un término común en software y, por extensión, en LD, que se refiere a lanzar algo, como un producto de software o una actualización de código.

14 En las funciones más especializadas en las que tratas con ML en el dispositivo o en el perímetro, unos conocimientos básicos de hardware también pueden marcar la diferencia.

15 En el lenguaje empresarial, se refiere a algo que impide que ocurra otra cosa, normalmente un proyecto o un calendario.

16 Wayne Duggan, "¿Qué ha pasado con las acciones FAANG? They Became MAMAA Stocks", Forbes, 29 de septiembre de 2023, https://oreil.ly/JzMys.

17 Departamento de recursos humanos o equivalente en la empresa.

18 En el capítulo 2 ofrezco una lista mucho más larga y una visión de conjunto.

19 Nombre ficticio, pero quería probar a usar algo que no fuera ABC Corp. o Acme Corp.

Get Entrevistas sobre aprendizaje automático now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.