Prefacio
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La inteligencia artificial (IA) puede definirse como el amplio campo de estudio en el que los ordenadores muestran inteligencia. La frase "mostrar inteligencia" es vaga; podría interpretarse como que un ordenador toma una decisión que esperaríamos de un ser vivo. El concepto de IA existe desde la antigüedad, al menos en la mitología. Un ejemplo famoso es el mito griego protagonizado por Talos, un autómata de bronce fabricado para proteger a Europa de los invasores que deseaban raptarla. Con el paso de los siglos, las formas básicas de IA pasaron del reino del mito a la vida real.
En los tiempos modernos, la IA ha encontrado su lugar en el aumento de las capacidades humanas y en la automatización de la toma de decisiones y otros procesos que consumen mucho tiempo a las personas. Los sistemas expertos, desarrollados por primera vez en los años 70, son un ejemplo de IA moderna. Un sistema experto aprovecha una base de conocimientos, una colección de hechos y reglas, y un sistema de inferencia para sintetizar nuevos conocimientos. El principal inconveniente de un sistema experto es que necesita el tiempo y el esfuerzo de un experto en la materia para crear los hechos y las reglas de la base de conocimientos.
En las últimas décadas, otra forma de IA se ha hecho más omnipresente. El aprendizaje automático (AM) es la disciplina que hace que los ordenadores aprendan algoritmos a partir de los datos proporcionados, en lugar de que el programador tenga que proporcionar los algoritmos. Otra forma de expresarlo en contraste con los sistemas expertos es que el ML consiste en utilizar los datos para descubrir las reglas, en lugar de que los expertos las escriban por ti.
Hoy en día, el ML afecta a casi todos los sectores. En el comercio minorista, el ML se utiliza para prever la demanda, prediciendo las ventas previstas de productos o servicios con meses de antelación. El sector de los viajes utiliza el ML para recomendar puntos de interés y destinos a los clientes basándose en su historial de viajes y otros datos. En la atención sanitaria, el ML puede utilizarse no sólo para determinar si una imagen de rayos X contiene un pulmón sano o enfermo, sino que también puede señalar la región de la imagen de rayos X que condujo a la determinación para que los expertos médicos la exploren con más detalle. La lista de usos activos del ML podría llenar por sí sola un libro entero. En este libro nos centramos en unos cuantos casos de uso específicos de ML para iniciarte, como la venta de canales de medios publicitarios, la producción de energía y la rotación de clientes, por nombrar sólo algunos.
Con tantas aplicaciones del ML en la industria, es apasionante explorar las distintas posibilidades. Una suposición que muchos hacen es que el ML es un campo de estudio exclusivo para los expertos. Es decir, a menos que tengas una gran cantidad de conocimientos previos en muchos campos diferentes (informática, matemáticas, estadística, etc.), no tienes ninguna esperanza de utilizar el ML en la práctica. Sencillamente, no es así.
En los últimos años, el concepto de científico de datos ciudadano se ha hecho mucho más común. Un científico de datos ciudadano es alguien que no tiene necesariamente una educación formal y/o un papel en la ciencia de datos o campos relacionados, pero que puede realizar algún trabajo de ciencia de datos junto con otros conocimientos específicos del dominio que aportan. Se han desarrollado muchas herramientas fáciles de usar para el ML que están a disposición de este grupo de personas, y el objetivo de este libro es permitir y animar a más personas a convertirse en científicos ciudadanos de datos.
¿Quién debería leer este libro?
El objetivo de este libro es enseñar a los lectores a enmarcar problemas de ML para datos estructurados (tabulares), preparar sus datos para flujos de trabajo de ML, y construir y utilizar modelos de ML utilizando diferentes soluciones sin código, de bajo código y algunas de código personalizado básico. Pasarás por procesos paso a paso para comprender estos objetivos en el marco de un problema empresarial concreto. El público principal de este libro son los analistas empresariales, los analistas de datos, los estudiantes y los aspirantes a científicos de datos ciudadanos que buscan aprender a aplicar el ML a su trabajo muy rápidamente utilizando el aprendizaje automático de máquinas (AutoML), BigQuery ML (utilizando SQL) y la formación personalizada en Python. Se presupone cierta familiaridad básica con el análisis de datos, pero no necesitas ser un experto para beneficiarte de la lectura de este libro.
Cualquiera que esté considerando un cambio de carrera hacia la ciencia de datos y/o la ingeniería de ML también puede encontrar en este libro un gran primer paso hacia su objetivo. Los profesionales del ML probablemente encontrarán este libro demasiado básico para sus necesidades, pero pueden encontrar útiles las discusiones sobre algunas de las herramientas utilizadas si no están familiarizados.
No se requieren conocimientos previos de ML ni de un lenguaje de programación específico, pero a los lectores les resultará más fácil leer el libro con algunos conocimientos básicos de conceptos de programación, Python y SQL. Incluimos referencias a material fundacional adicional dentro del contexto a lo largo del libro. Además de los conceptos de ML y los ejemplos basados en casos de uso, también explorarás diferentes herramientas como los Cuadernos Jupyter y el uso básico del terminal de Linux.
Qué hay y qué no hay en este libro
Este libro se creó como un primer paso para quienes desean convertirse en profesionales del ML, no como un libro para convertirte en un experto en ML. No cubrimos en detalle la teoría del ML, ni todos los temas de estadística y matemáticas necesarios para ser un científico de datos de éxito. Cubrimos la teoría necesaria para los proyectos que se tratan en este libro como una forma de facilitarte el trabajo en proyectos de ML, pero ir más allá de eso estaría fuera del alcance de este libro. No obstante, ofrecemos muchas referencias a recursos en los que puedes profundizar si estás interesado en hacerlo.
En los capítulos 2 y 3 se analizan muchos tipos diferentes de datos que pueden utilizarse en problemas de ML y diferentes herramientas que pueden emplearse en la práctica. Sin embargo, ningún libro puede abarcar todas las circunstancias con todas las herramientas disponibles. Nos centramos en casos de uso con datos estructurados y sólo realizamos un ligero debate sobre el ML para datos no estructurados en los Capítulos 2 y 9. Algunas de las aplicaciones más interesantes (chatbots impulsados por IA y generación de imágenes, por ejemplo) utilizan datos no estructurados, pero en la práctica la mayoría de las aplicaciones del ML en la empresa y la industria se centran en problemas que implican datos estructurados.
En cuanto a las herramientas, nos centramos en un reducido abanico de ellas para que puedas centrarte en los casos de uso empresarial. Los paquetes de Python como NumPy, Seaborn, Pandas, scikit-learn y TensorFlow son populares en todos los sectores, y los cubrimos junto con muchos de los casos de uso en este libro. Los Cuadernos Jupyter también son un estándar industrial utilizado para ejecutar interactivamente código Python en un entorno de cuaderno.
Utilizamos Google Colab, un servicio gratuito de Jupyter Notebook, para ejecutar nuestros cuadernos. Además, utilizaremos otras herramientas de Google Cloud, como Vertex AI AutoML para el entrenamiento de modelos ML sin código y BigQuery para el análisis de datos SQL y el entrenamiento de modelos ML mediante SQL. Otros grandes proveedores de la nube, como Microsoft Azure y Amazon Web Services (AWS), ofrecen servicios similares para ejecutar cuadernos Jupyter, AutoML, analizar datos con SQL y entrenar modelos ML utilizando SQL. Te animamos y recomendamos encarecidamente que explores las otras herramientas que mencionamos pero que no utilizamos aquí. A lo largo de todo el libro se incluyen enlaces para obtener más información y documentación.
Convenciones utilizadas en este libro
En este libro se utilizan las siguientes convenciones tipográficas:
- Cursiva
Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.
Constant width
Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.
Constant width bold
Muestra comandos u otros textos que deben ser tecleados literalmente por el usuario.
Constant width italic
Muestra el texto que debe sustituirse por valores proporcionados por el usuario o por valores determinados por el contexto.
Consejo
Este elemento significa un consejo o sugerencia.
Nota
Este elemento significa una nota general.
Advertencia
Este icono indica una advertencia o precaución.
Utilizar ejemplos de código
El material complementario (ejemplos de código, ejercicios, etc.) se puede descargar en https://oreil.ly/supp-lcai.
Este libro está aquí para ayudarte a hacer tu trabajo. En general, si se ofrece código de ejemplo con este libro, puedes utilizarlo en tus programas y documentación. No es necesario que te pongas en contacto con nosotros para pedirnos permiso, a menos que estés reproduciendo una parte importante del código. Por ejemplo, escribir un programa que utilice varios trozos de código de este libro no requiere permiso. Vender o distribuir un CD-ROM de ejemplos de los libros de O'Reilly sí requiere permiso. Responder a una pregunta citando este libro y el código de ejemplo no requiere permiso. Incorporar una cantidad significativa de código de ejemplo de este libro en la documentación de tu producto sí requiere permiso.
Agradecemos, pero no exigimos, la atribución. Una atribución suele incluir el título, el autor, la editorial y el ISBN. Por ejemplo "Low-Code AI " de Gwendolyn Stripling y Michael Abel (O'Reilly). Copyright 2023 Gwendolyn Stripling y Michael Abel, 978-1-098-14682-5".
Si crees que el uso que haces de los ejemplos de código no se ajusta al uso legítimo o al permiso concedido anteriormente, no dudes en ponerte en contacto con nosotros en permissions@oreilly.com.
Aprendizaje en línea O'Reilly
Nota
Durante más de 40 años, O'Reilly Media ha proporcionado formación, conocimientos y perspectivas sobre tecnología y negocios para ayudar a las empresas a alcanzar el éxito.
Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita https://oreilly.com.
Cómo contactar con nosotros
Dirige tus comentarios y preguntas sobre este libro a la editorial:
- O'Reilly Media, Inc.
- 1005 Gravenstein Highway Norte
- Sebastopol, CA 95472
- 800-889-8969 (en Estados Unidos o Canadá)
- 707-829-7019 (internacional o local)
- 707-829-0104 (fax)
- support@oreilly.com
- https://www.oreilly.com/about/contact.html
Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/LowCodeAI.
Para obtener noticias e información sobre nuestros libros y cursos, visita https://oreilly.com.
Encuéntranos en LinkedIn: https://linkedin.com/company/oreilly-media.
Síguenos en Twitter: https://twitter.com/oreillymedia.
Míranos en YouTube: https://youtube.com/oreillymedia.
Agradecimientos
Este libro sólo existe gracias al generoso apoyo y al tiempo de muchas personas. Queremos dar las gracias a nuestros compañeros Googlers -Enrica Filippi, Mona Mona, Benoit Dherin y Michael Munn- por su detallada revisión de este libro. La calidad de la exposición y los detalles técnicos se han beneficiado enormemente de su experiencia. También queremos dar las gracias a nuestros compañeros de trabajo -Rich Rose, Patrick Bentley, Yoanna Long, Esra Duygun y Concepción Díaz- por su apoyo y sus comentarios. Por último, pero no por ello menos importante, queremos dar las gracias a nuestros directores -Kelly Thompson, Eric Pilotte y Sree Upadhyayula- por su inquebrantable apoyo en este empeño.
Un gran agradecimiento al equipo de O'Reilly por toda su colaboración para hacer realidad este sueño y por su paciencia con dos escritores que navegaban emocionados por este proceso por primera vez. Queremos dar las gracias a Nicole Butterfield por creer en nuestro proyecto y visión desde el principio y a Clare Laylock por su trabajo para que este libro estuviera listo para imprimirse. Queremos dar las gracias a Corbin Collins por su duro trabajo y su experiencia editorial a lo largo de todo el proceso.
Michael quiere dar las gracias a su esposa Jackie por su increíble apoyo y paciencia durante todo el proceso de escritura de este libro, a su hija Mia por su habilidad para encontrar siempre el momento adecuado para interrumpir el trabajo para jugar con el teclado y sacarle una sonrisa, y a sus padres, Ben y Rita, por fomentar su amor por las matemáticas y los ordenadores desde que tiene uso de razón.
A Gwendolyn le gustaría dar las gracias a su compañera de vida, Nada Velimirović, por su apoyo inquebrantable durante este increíble viaje, y a su hija, Saskia, y a sus mascotas, Ginger y Wonton, por su increíble capacidad para saber cuándo dar un abrazo, pedir un regazo y lloriquear para dar un pequeño paseo. También le gustaría dar las gracias a su familia: a su padre y a su madre (gracias por el ADN); a su hermana Belinda (gracias por recibirme); a su hermana, Gloria Taylor Williams, y a su marido, Charles Williams; a sus hermanos, Maurice Cobb y Carlos S. Armstrong; y a su tío, Tony Hall. Está muy agradecida a su sobrina, Katrina Marie Burage, y a su sobrino, Carlos S. Armstrong Jr., por todo su increíble apoyo durante este viaje. También le gustaría dar las gracias a su querida amiga Christina Ramírez, que siempre ha creído y apoyado sus ideas innovadoras.
Get IA de bajo código now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.