Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

La IA generativa, y en particular el Chat GPT-4, está de moda últimamente. El aprendizaje automático probabilístico (ML) es un tipo de IA generativa ideal para las finanzas y la inversión. A diferencia de las redes neuronales profundas, en las que se basa ChatGPT, los modelos de ML probabilístico no son cajas negras. Estos modelos también te permiten inferir las causas de los efectos de forma bastante transparente. Esto es importante en sectores muy regulados, como las finanzas y la sanidad, donde tienes que explicar la base de tus decisiones a muchas partes interesadas.

El ML probabilístico también te permite codificar explícita y sistemáticamente el conocimiento personal, empírico e institucional en modelos de ML para mantener las ventajas competitivas de tu organización. Lo que realmente distingue al ML probabilístico de sus homólogos convencionales es su capacidad de simular sin fisuras nuevos datos y conocimientos contrafactuales condicionados por los datos observados y los supuestos del modelo sobre el que se entrenó y probó, independientemente del tamaño del conjunto de datos o del orden de los mismos. Los modelos probabilísticos son modelos generativos que conocen sus limitaciones y expresan honestamente su ignorancia ampliando los rangos de sus inferencias y predicciones. No obtendrás tales dudas cuantificadas de las alucinaciones confiadas de ChatGPT, más conocidas como mentiras y mentiras falsas.

Todos los modelos de ML se basan en la suposición de que los patrones descubiertos en los datos de entrenamiento o dentro de la muestra persistirán en los datos de prueba o fuera de la muestra. Sin embargo, cuando los modelos ML no probabilísticos encuentran patrones en datos en los que nunca han sido entrenados o probados, hacen inferencias y predicciones atroces debido a los fallos fundacionales inherentes a sus modelos estadísticos. Además, estos modelos ML lo hacen con total confianza y sin advertir a los responsables de la toma de decisiones de sus incertidumbres.

La creciente adopción de modelos ML no probabilísticos para la toma de decisiones en finanzas e inversiones puede tener consecuencias catastróficas para las personas y la sociedad en general, como quiebras y recesiones económicas. Es imperativo que todos los modelos de ML cuantifiquen la incertidumbre de sus inferencias y predicciones sobre datos no vistos para apoyar una toma de decisiones sólida en un mundo complejo con incertidumbres tridimensionales. Las empresas líderes comprenden claramente las limitaciones de las tecnologías de IA estándar y están desarrollando sus versiones probabilísticas para ampliar su aplicabilidad a problemas más complejos. Google introdujo recientemente TensorFlow Probability para ampliar su consolidada plataforma TensorFlow. Del mismo modo, Facebook y Uber han introducido Pyro para ampliar sus plataformas PyTorch. Actualmente, las tecnologías de ML probabilístico de código abierto más populares son PyMC y Stan. PyMC está escrita en Python, y Stan está escrita en C++. Este libro utiliza el amplio ecosistema de bibliotecas Python de fácil uso.

¿Quién debería leer este libro?

El público principal de este libro es el profesional pensante de la disciplina de las finanzas y la inversión. Un profesional pensante es alguien que no se limita a seguir las instrucciones de un manual o libro de cocina. Quiere comprender los conceptos subyacentes de por qué debe adoptar un proceso, modelo o tecnología. Por lo general, son intelectualmente curiosos y disfrutan aprendiendo por sí mismos. Al mismo tiempo, no buscan onerosas pruebas matemáticas ni tediosos tomos académicos. He incluido muchas referencias académicas en cada capítulo para los lectores que busquen los detalles matemáticos y técnicos que subyacen a los conceptos y razonamientos presentados en este libro.

Un profesional pensante puede ser un inversor individual, un analista, un desarrollador, un directivo, un gestor de proyectos, un científico de datos, un investigador, un gestor de carteras o un operador cuantitativo. Estos profesionales del pensamiento entienden que necesitan aprender continuamente nuevos conceptos y tecnologías para avanzar en sus carreras y negocios. Un conocimiento práctico profundo les da la confianza necesaria para aplicar lo que aprenden a fin de desarrollar soluciones creativas para sus retos particulares. También les proporciona un marco para explorar y aprender más fácilmente tecnologías y conceptos relacionados.

En este libro, doy por sentado que los lectores tienen una familiaridad básica con las finanzas, la estadística, el aprendizaje automático y Python. No presupongo que hayan leído ningún libro en particular ni que dominen ninguna habilidad concreta. Sólo asumo que tienen ganas de aprender, especialmente cuando ChatGPT, Bard y Bing AI pueden explicar fácilmente cualquier código o fórmula de este libro.

Por qué escribí este libro

Hay escasez de libros generales de ML probabilístico, y ninguno dedicado por completo a problemas de finanzas e inversión. Debido a las complejidades idiosincrásicas de estos dominios, cualquier aplicación ingenua del ML en general y del ML probabilístico en particular está condenada al fracaso. Un conocimiento profundo de los fundamentos de estos dominios es fundamental para tener alguna posibilidad de éxito. Este libro es un manual que pretende proporcionar al profesional pensante una base sólida en los conceptos fundamentales del ML probabilístico y cómo aplicarlo a los problemas financieros y de inversión, utilizando matemáticas sencillas y código Python.

Hay otra razón por la que escribí este libro. A día de hoy, los libros siguen siendo un medio para el discurso serio. Quería recordar a los lectores los graves defectos que siguen teniendo la teoría financiera moderna y la metodología de inferencia estadística convencional. Es indignante que estos métodos pseudocientíficos se sigan enseñando en el mundo académico y practicando en la industria a pesar de sus profundos defectos y su patético rendimiento. Siguen derrochando miles de millones de dólares de investigación produciendo estudios basura, empañando la reputación de la empresa científica y contribuyendo significativamente a los desastres económicos y a la miseria humana.

Nos encontramos en una encrucijada en la evolución de las tecnologías de IA, y la mayoría de los expertos predicen un crecimiento exponencial de su uso, que transformará fundamentalmente la forma en que vivimos, trabajamos e interactuamos entre nosotros. El peligro de que los sistemas de IA se apoderen de la humanidad de forma inminente es ciencia ficción tonta, porque incluso el sistema de IA más avanzado carece del sentido común de un niño pequeño. El peligro real, claro y presente, es que los necios acaben desarrollando y gestionando a estos poderosos sabios basándose en los modelos espurios de las finanzas y la estadística convencionales. Lo más probable es que esto provoque catástrofes más rápidas y grandes de las que hayamos vivido nunca.

Mis críticas se apoyan en matemáticas sencillas, sentido común, datos y trabajos académicos publicados a lo largo del siglo pasado. Quizá uno de los valores añadidos de este libro consista en recuperar muchas de esas publicaciones académicas olvidadas de los polvorientos archivos de la historia y dar a conocer a los lectores sus puntos de vista en un lenguaje llano e inequívoco, utilizando la lógica, las matemáticas sencillas o un código que cualquier persona con un título de secundaria pueda entender. Está claro que el modo convencional de expresar estas críticas no ha funcionado en absoluto. Lo que está en juego para los individuos, la sociedad y la empresa científica es demasiado importante como para que nos importe si las verdades matemáticas y científicas expresadas sin rodeos pueden ofender a alguien o empañar una reputación construida sobre la autoría o el apoyo a teorías falsas.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Constant width

Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.

Constant width bold

Muestra comandos u otros textos que deben ser tecleados literalmente por el usuario.

Constant width italic

Muestra el texto que debe sustituirse por valores proporcionados por el usuario o por valores determinados por el contexto.

Consejo

Este elemento significa un consejo o sugerencia.

Nota

Este elemento significa una nota general.

Advertencia

Este elemento indica una advertencia o precaución.

Utilizar ejemplos de código

Puedes descargar material complementario (ejemplos de código) en https://oreil.ly/supp-probabilistic-ML.

Si tienes una pregunta técnica o un problema al utilizar los ejemplos de código, envía un correo electrónico a

Este libro está aquí para ayudarte a hacer tu trabajo. En general, si se ofrece código de ejemplo con este libro, puedes utilizarlo en tus programas y documentación. No es necesario que te pongas en contacto con nosotros para pedirnos permiso, a menos que estés reproduciendo una parte importante del código. Por ejemplo, escribir un programa que utilice varios trozos de código de este libro no requiere permiso. Vender o distribuir ejemplos de los libros de O'Reilly sí requiere permiso. Responder a una pregunta citando este libro y el código de ejemplo no requiere permiso. Incorporar una cantidad significativa de código de ejemplo de este libro en la documentación de tu producto sí requiere permiso.

Agradecemos la atribución, pero en general no la exigimos. Una atribución suele incluir el título, el autor, la editorial y el ISBN. Por ejemplo "Probabilistic Machine Learning for Finance and Investing ", de Deepak K. Kanungo (O'Reilly). Copyright 2023 Hedged Capital L.L.C., 978-1-492-09767-9".

Si crees que el uso que haces de los ejemplos de código no se ajusta al uso legítimo o al permiso concedido anteriormente, no dudes en ponerte en contacto con nosotros en

Aprendizaje en línea O'Reilly

Nota

Durante más de 40 años, O'Reilly Media ha proporcionado formación tecnológica y empresarial, conocimientos y perspectivas para ayudar a las empresas a alcanzar el éxito.

Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita https://oreilly.com.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

Tenemos una página web para este libro, donde enumeramos erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/Probabilistic_ML.

Para obtener noticias e información sobre nuestros libros y cursos, visita https://oreilly.com.

Encuéntranos en LinkedIn: https://linkedin.com/company/oreilly-media

Síguenos en Twitter: https://twitter.com/oreillymedia

Míranos en YouTube: https://youtube.com/oreillymedia

Agradecimientos

Me gustaría dar las gracias a Michelle Smith, Jeff Bleiel y a todo el equipo de O'Reilly Media por hacer posible este libro. Ha sido un placer trabajar con todos, especialmente con Jeff, cuyos comentarios sinceros y perspicaces me han ayudado a mejorar el contenido de este libro.

También me gustaría dar las gracias a los expertos revisores de mi libro, Abdullah Karasan, Juan Manuel Contreras e Isaac Rhea, por sus valiosos comentarios.

Además, me gustaría dar las gracias a los siguientes lectores de las primeras versiones del libro por sus comentarios igualmente valiosos: Ian Angell, Bruno Rignel, Jonathan Hugenschmidt, Autumn Peters y Mike Shwe.

Get Aprendizaje Automático Probabilístico para Finanzas e Inversión now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.