Vorwort

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Generative KI, insbesondere Chat GPT-4, ist heutzutage in aller Munde. Probabilistisches maschinelles Lernen (ML) ist eine Art der generativen KI, die sich ideal für Finanzen und Investitionen eignet. Im Gegensatz zu tiefen neuronalen Netzen, auf denen ChatGPT basiert, sind probabilistische ML-Modelle keine Blackboxen. Diese Modelle ermöglichen es dir auch, auf ziemlich transparente Weise von Ursachen auf Wirkungen zu schließen. Das ist wichtig in stark regulierten Branchen wie dem Finanz- und Gesundheitswesen, wo du die Grundlage deiner Entscheidungen vielen Interessengruppen erklären musst.

Probabilistisches ML ermöglicht es dir außerdem, persönliches, empirisches und institutionelles Wissen explizit und systematisch in ML-Modelle zu integrieren, um die Wettbewerbsvorteile deines Unternehmens zu erhalten. Was probabilistisches ML von seinen konventionellen Pendants unterscheidet, ist die Fähigkeit, nahtlos neue Daten und kontrafaktisches Wissen zu simulieren, das von den beobachteten Daten und den Modellannahmen abhängt, auf denen es trainiert und getestet wurde, unabhängig von der Größe des Datensatzes oder der Reihenfolge der Daten. Probabilistische Modelle sind generative Modelle, die ihre Grenzen kennen und ihre Unwissenheit ehrlich zum Ausdruck bringen, indem sie die Bandbreite ihrer Schlussfolgerungen und Vorhersagen erweitern. Die selbstbewussten Halluzinationen von ChatGPT, besser bekannt als Flunkereien und Lügen, werden dir solche quantifizierten Zweifel nicht vermitteln.

Alle ML-Modelle basieren auf der Annahme, dass Muster, die in Trainings- oder In-Sample-Daten entdeckt werden, auch in Test- oder Out-of-Sample-Daten bestehen bleiben. Wenn nicht-probabilistische ML-Modelle jedoch auf Muster in Daten stoßen, für die sie nie trainiert oder getestet wurden, treffen sie aufgrund der inhärenten Grundfehler ihrer statistischen Modelle ungeheuerliche Schlussfolgerungen und Vorhersagen. Außerdem tun diese ML-Modelle dies mit voller Überzeugung und ohne die Entscheidungsträger vor ihren Unsicherheiten zu warnen .

Der zunehmende Einsatz von nicht-probabilistischen ML-Modellen für die Entscheidungsfindung im Finanz- und Investitionsbereich kann katastrophale Folgen für den Einzelnen und die Gesellschaft insgesamt haben, z. B. Insolvenzen und wirtschaftliche Rezessionen. Es ist zwingend erforderlich, dass alle ML-Modelle die Unsicherheit ihrer Schlussfolgerungen und Vorhersagen auf Basis ungesehener Daten quantifizieren, um eine solide Entscheidungsfindung in einer komplexen Welt mit dreidimensionalen Unsicherheiten zu unterstützen. Führende Unternehmen haben die Grenzen der Standard-KI-Technologien erkannt und entwickeln ihre probabilistischen Versionen, um ihre Anwendbarkeit auf komplexere Probleme auszuweiten. Google hat kürzlich TensorFlow Probability eingeführt, um seine etablierte TensorFlow-Plattform zu erweitern. Ähnlich haben Facebook und Uber Pyro eingeführt, um ihre PyTorch-Plattformen zu erweitern. Die derzeit beliebtesten Open-Source-Technologien für probabilistisches ML sind PyMC und Stan. PyMC ist in Python geschrieben, Stan in C++. Dieses Buch nutzt das umfangreiche Ökosystem der benutzerfreundlichen Python-Bibliotheken.

Wer sollte dieses Buch lesen?

Dieses Buch richtet sich in erster Linie an den denkenden Praktiker in der Finanz- und Investitionsdisziplin. Ein denkender Praktiker ist jemand, der nicht einfach nur Anweisungen aus einem Handbuch oder Kochbuch befolgen will. Sie wollen die zugrunde liegenden Konzepte verstehen, warum sie einen Prozess, ein Modell oder eine Technologie anwenden müssen. Im Allgemeinen sind sie intellektuell neugierig und lernen gerne um ihrer selbst willen. Gleichzeitig sind sie nicht auf der Suche nach umständlichen mathematischen Beweisen oder langweiligen akademischen Wälzern. Ich habe in jedem Kapitel viele wissenschaftliche Verweise für Leser/innen angegeben, die nach den mathematischen und technischen Details suchen, die den in diesem Buch vorgestellten Konzepten und Überlegungen zugrunde liegen.

Ein denkender Praktiker kann ein einzelner Investor, Analyst, Entwickler, Manager, Projektmanager, Datenwissenschaftler, Forscher, Portfoliomanager oder quantitativer Händler sein. Diese denkenden Praktiker/innen wissen, dass sie ständig neue Konzepte und Technologien lernen müssen, um ihre Karriere und ihr Unternehmen voranzubringen. Ein tiefes praktisches Verständnis gibt ihnen das Selbstvertrauen, das Gelernte anzuwenden, um kreative Lösungen für ihre individuellen Herausforderungen zu entwickeln. Es gibt ihnen auch einen Rahmen, in dem sie verwandte Technologien und Konzepte leichter erforschen und erlernen können.

In diesem Buch gehe ich davon aus, dass die Leser mit Finanzen, Statistik, maschinellem Lernen und Python vertraut sind. Ich gehe nicht davon aus, dass sie ein bestimmtes Buch gelesen haben oder eine bestimmte Fähigkeit beherrschen. Ich gehe nur davon aus, dass sie bereit sind zu lernen, besonders wenn ChatGPT, Bard und Bing AI jeden Code oder jede Formel in diesem Buch leicht erklären können.

Warum ich dieses Buch geschrieben habe

Es gibt nur wenige allgemeine probabilistische ML-Bücher und keines, das sich ausschließlich mit Finanz- und Investitionsproblemen befasst. Aufgrund der besonderen Komplexität dieser Bereiche ist jede naive Anwendung von ML im Allgemeinen und probabilistischer ML im Besonderen zum Scheitern verurteilt. Ein tiefes Verständnis der Grundlagen dieser Bereiche ist der Schlüssel zum Erfolg. Dieses Buch ist eine Fibel, die dem denkenden Praktiker eine solide Grundlage für die grundlegenden Konzepte der probabilistischen ML und ihre Anwendung auf Finanz- und Investitionsprobleme mit Hilfe einfacher Mathematik und Python-Code vermitteln soll.

Es gibt einen weiteren Grund, warum ich dieses Buch geschrieben habe. Auch heute noch sind Bücher ein Medium für einen ernsthaften Diskurs. Ich wollte die Leserinnen und Leser daran erinnern, dass die moderne Finanztheorie und die herkömmliche statistische Schlussfolgerungsmethodik nach wie vor gravierende Mängel aufweisen. Es ist empörend, dass diese pseudowissenschaftlichen Methoden immer noch an den Hochschulen gelehrt und in der Industrie angewandt werden, obwohl sie gravierende Mängel aufweisen und erbärmlich schlecht sind. Sie verschwenden weiterhin Milliarden von Forschungsgeldern für die Erstellung von Schrottstudien, beschädigen den Ruf des wissenschaftlichen Unternehmens und tragen maßgeblich zu wirtschaftlichen Katastrophen und menschlichem Elend bei.

Wir stehen an einem Scheideweg in der Entwicklung von KI-Technologien. Die meisten Experten sagen ein exponentielles Wachstum ihrer Nutzung voraus, das die Art und Weise, wie wir leben, arbeiten und miteinander interagieren, grundlegend verändern wird. Die Gefahr, dass KI-Systeme die Menschheit in Kürze übernehmen werden, ist alberne Science-Fiction, denn selbst das fortschrittlichste KI-System hat nicht den gesunden Menschenverstand eines Kleinkindes. Die wirkliche Gefahr besteht darin, dass Dummköpfe diese mächtigen Intelligenzler auf der Grundlage der falschen Modelle der konventionellen Finanzwirtschaft und Statistik entwickeln und steuern. Das wird höchstwahrscheinlich zu Katastrophen führen, die schneller und größer sind als alles, was wir bisher erlebt haben.

Meine Kritik stützt sich auf einfache Mathematik, gesunden Menschenverstand, Daten und wissenschaftliche Arbeiten, die im letzten Jahrhundert veröffentlicht wurden. Der Mehrwert dieses Buches besteht vielleicht darin, dass es viele dieser vergessenen akademischen Veröffentlichungen aus den verstaubten Archiven der Geschichte hervorholt und den Leserinnen und Lesern ihre Erkenntnisse in einer einfachen, unmissverständlichen Sprache nahebringt, indem es Logik, einfache Mathematik oder einen Code verwendet, den jeder mit einem Highschool-Abschluss verstehen kann. Es ist klar, dass die herkömmliche Art, diese Kritik zu äußern, überhaupt nicht funktioniert. Für den Einzelnen, die Gesellschaft und den Wissenschaftsbetrieb steht zu viel auf dem Spiel, als dass es uns egal sein könnte, ob klar ausgesprochene mathematische und wissenschaftliche Wahrheiten jemanden beleidigen oder den Ruf schädigen könnten, der auf dem Verfassen oder Unterstützen falscher Theorien beruht.

In diesem Buch verwendete Konventionen

In diesem Buch werden die folgenden typografischen Konventionen verwendet:

Kursiv

Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.

Constant width

Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Datentypen, Umgebungsvariablen, Anweisungen und Schlüsselwörter hinzuweisen.

Constant width bold

Zeigt Befehle oder anderen Text an, der vom Benutzer wortwörtlich eingetippt werden sollte.

Constant width italic

Zeigt Text an, der durch vom Benutzer eingegebene Werte oder durch kontextabhängige Werte ersetzt werden soll.

Tipp

Dieses Element steht für einen Tipp oder eine Anregung.

Hinweis

Dieses Element steht für einen allgemeinen Hinweis.

Warnung

Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.

Code-Beispiele verwenden

Ergänzendes Material (Code-Beispiele) steht unter https://oreil.ly/supp-probabilistic-ML zum Download bereit .

Wenn du eine technische Frage oder ein Problem mit den Codebeispielen hast, sende bitte eine E-Mail an

Dieses Buch soll dir helfen, deine Arbeit zu erledigen. Wenn in diesem Buch Beispielcode angeboten wird, darfst du ihn in deinen Programmen und deiner Dokumentation verwenden. Du musst uns nicht um Erlaubnis fragen, es sei denn, du reproduzierst einen großen Teil des Codes. Wenn du zum Beispiel ein Programm schreibst, das mehrere Teile des Codes aus diesem Buch verwendet, brauchst du keine Erlaubnis. Der Verkauf oder die Verbreitung von Beispielen aus O'Reilly-Büchern erfordert jedoch eine Genehmigung. Die Beantwortung einer Frage mit einem Zitat aus diesem Buch und einem Beispielcode erfordert keine Genehmigung. Wenn du einen großen Teil des Beispielcodes aus diesem Buch in die Dokumentation deines Produkts aufnimmst, ist eine Genehmigung erforderlich.

Wir freuen uns über eine Namensnennung, verlangen sie aber in der Regel nicht. Eine Quellenangabe umfasst normalerweise den Titel, den Autor, den Verlag und die ISBN. Ein Beispiel:"Probabilistic Machine Learning for Finance and Investing " von Deepak K. Kanungo (O'Reilly). Copyright 2023 Hedged Capital L.L.C., 978-1-492-09767-9."

Wenn du der Meinung bist, dass die Verwendung von Code-Beispielen nicht unter die Fair-Use-Regelung oder die oben genannte Erlaubnis fällt, kannst du uns gerne unter kontaktieren

O'Reilly Online Learning

Hinweis

Seit mehr als 40 Jahren bietet O'Reilly Media Schulungen, Wissen und Einblicke in Technologie und Wirtschaft, um Unternehmen zum Erfolg zu verhelfen.

Unser einzigartiges Netzwerk von Experten und Innovatoren teilt sein Wissen und seine Erfahrung durch Bücher, Artikel und unsere Online-Lernplattform. Die Online-Lernplattform von O'Reilly bietet dir On-Demand-Zugang zu Live-Trainingskursen, ausführlichen Lernpfaden, interaktiven Programmierumgebungen und einer umfangreichen Text- und Videosammlung von O'Reilly und über 200 anderen Verlagen. Weitere Informationen erhältst du unter https://oreilly.com.

Wie du uns kontaktierst

Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:

Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter https://oreil.ly/Probabilistic_ML aufrufen .

Neuigkeiten und Informationen über unsere Bücher und Kurse findest du unter https://oreilly.com.

Finde uns auf LinkedIn: https://linkedin.com/company/oreilly-media

Folge uns auf Twitter: https://twitter.com/oreillymedia

Schau uns auf YouTube: https://youtube.com/oreillymedia

Danksagungen

Ich möchte Michelle Smith, Jeff Bleiel und dem gesamten Team von O'Reilly Media dafür danken, dass sie dieses Buch möglich gemacht haben. Es war ein Vergnügen, mit allen zusammenzuarbeiten, besonders mit Jeff, dessen ehrliches und aufschlussreiches Feedback mir geholfen hat, den Inhalt dieses Buches zu verbessern.

Ich möchte mich auch bei den Gutachtern meines Buches, Abdullah Karasan, Juan Manuel Contreras und Isaac Rhea, für ihre wertvollen Kommentare bedanken.

Außerdem möchte ich mich bei den folgenden Lesern der ersten Versionen des Buches für ihr ebenso wertvolles Feedback bedanken: Ian Angell, Bruno Rignel, Jonathan Hugenschmidt, Autumn Peters und Mike Shwe.

Get Probabilistisches maschinelles Lernen für Finanzen und Investieren now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.