Capítulo 17. Árboles de decisión

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Un árbol es un misterio incomprensible.

Jim Woodring

El vicepresidente de Talento de DataSciencester ha entrevistado a varios candidatos de la web, con distintos grados de éxito. Ha recopilado un conjunto de datos consistente en varios atributos (cualitativos) de cada candidato, así como si ese candidato hizo una buena o mala entrevista. ¿Te pregunta si podrías utilizar estos datos para construir un modelo que identifique qué candidatos harán una buena entrevista, de modo que no tenga que perder el tiempo realizando entrevistas?

Esto parece un buen ajuste para un árbol de decisión, otra herramienta de modelado predictivo en el kit del científico de datos.

¿Qué es un árbol de decisión?

Un árbol de decisión utiliza una estructura de árbol para representar una serie de posibles caminos de decisión y un resultado para cada camino.

Si alguna vez has jugado al juego Veinte Preguntas, entonces estás familiarizado con los árboles de decisión. Por ejemplo:

  • "Estoy pensando en un animal".

  • "¿Tiene más de cinco patas?"

  • "No".

  • "¿Está delicioso?"

  • "No".

  • "¿Aparece en el reverso de la moneda australiana de cinco céntimos?"

  • "Sí".

  • "¿Es un equidna?"

  • "¡Sí, lo es!"

Esto corresponde al camino:

"No más de 5 patas" → "No es delicioso" → "En la moneda de 5 céntimos" → "¡Equidna!"

en un árbol de decisión idiosincrásico (y no muy completo) ...

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.