Kapitel 1. Einführung in Data Science und Handel

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Der beste Weg, sich in ein komplexes Thema einzuarbeiten, ist, es in kleinere Teile zu zerlegen und diese Teile zuerst zu verstehen. Um Deep Learning für den Finanzbereich zu verstehen, braucht man Wissen über Datenwissenschaft und Finanzmärkte.

In diesem Kapitel werden die Grundlagen gelegt, die du brauchst, um die Datenwissenschaft und ihre Anwendungsmöglichkeiten zu verstehen, aber auch um die Finanzmärkte zu verstehen und herauszufinden, wie Handel und Prognosen von der Datenwissenschaft profitieren können.

Am Ende des Kapitels solltest du wissen, was Data Science ist, welche Anwendungen es gibt und wie du sie im Finanzwesen zur Wertschöpfung einsetzen kannst.

Daten verstehen

Es ist unmöglich, den Bereich der Datenwissenschaft zu verstehen, ohne zuerst die Arten und Strukturen von Daten zu kennen. Schließlich ist das erste Wort für den Namen dieses riesigen Bereichs Daten. Also, was sind Daten? Und noch wichtiger: Was kann man damit machen?

Daten in ihrer einfachsten und reinsten Form sind eine Sammlung von Rohdaten, die von jedem Typ sein können (Zahlen, Text, Boolesche Werte usw.).

Das letzte Ziel der Datenerhebung ist die Entscheidungsfindung. Dies geschieht durch einen komplexen Prozess, der von der Datenerfassung und -verarbeitung bis hin zur Interpretation der Daten und der Nutzung der Ergebnisse für eine Entscheidung reicht.

Nehmen wir ein Beispiel für die Verwendung von Daten, um eine Entscheidung zu treffen. Angenommen, du hast ein Portfolio, das aus fünf verschiedenen, gleich gewichteten Dividendenaktien besteht, wie in Tabelle 1-1 dargestellt .

Tabelle 1-1. Aktien und ihre Dividendenrenditen
Lager Dividendenrendite
A 5.20%
B 3.99%
C 4.12%
D 6.94%
E 5.55%
Hinweis

Eine Dividende ist die Ausschüttung an die Aktionäre aus den Gewinnen eines Unternehmens. Die Dividendenrendite ist der Betrag, der in Geldeinheiten über den aktuellen Aktienkurs des Unternehmens ausgeschüttet wird.

Die Analyse dieser Daten kann dir helfen, die durchschnittliche Dividendenrendite zu verstehen, die du aus deinem Portfolio erhältst. Der Durchschnitt ist im Grunde die Summe geteilt durch die Menge und gibt dir einen schnellen Überblick über die Gesamtdividendenrendite deines Portfolios:

Durchschnitt Dividende Ertrag = 5.20%+3.99%+4.12%+6.94%+5.55% 5 = 5 . 16 %

Die durchschnittliche Dividendenrendite deines Portfolios beträgt also 5,16 %. Diese Information kann dir helfen, deine durchschnittliche Dividendenrendite mit anderen Portfolios zu vergleichen, damit du weißt, ob du Anpassungen vornehmen musst.

Eine weitere Kennzahl, die du berechnen kannst, ist die Anzahl der im Portfolio gehaltenen Aktien. Dies kann der erste Informationsbaustein für den Aufbau einer Diversifizierungsmauer sein. Auch wenn diese beiden Informationen (durchschnittliche Dividendenrendite und Anzahl der Aktien im Portfolio) sehr einfach sind, beginnt die Analyse komplexer Daten mit einfachen Kennzahlen und erfordert manchmal keine ausgefeilten Modelle, um die Situation richtig zu interpretieren.

Die beiden Metriken, die du im vorherigen Beispiel berechnet hast, heißen Durchschnitt (oder Mittelwert) und Anzahl (oder Anzahl der Elemente). Sie gehören zum Bereich der deskriptiven Statistik, die in Kapitel 3 besprochen wird und ebenfalls Teil der Datenwissenschaft ist.

Nehmen wir ein weiteres Beispiel für eine Datenanalyse zu Schlussfolgerungszwecken. Angenommen, du hast ein jährliches Korrelationsmaß zwischen zwei Rohstoffen berechnet und möchtest vorhersagen, ob die nächste jährliche Korrelation positiv oder negativ sein wird. Tabelle 1-2 enthält die Details der Berechnungen.

Tabelle 1-2. Jährliche Korrelationsmaße
Jahr Korrelation
2015 Positiv
2016 Positiv
2017 Positiv
2018 Negativ
2019 Positiv
2020 Positiv
2021 Positiv
2022 Positiv
2023 Positiv
Hinweis

DieKorrelation ist ein Maß für die lineare Beziehung zwischen zwei Zeitreihen. Eine positive Korrelation bedeutet im Allgemeinen, dass sich die beiden Zeitreihen im Durchschnitt in dieselbe Richtung bewegen, während eine negative Korrelation im Allgemeinen bedeutet, dass sich die beiden Zeitreihen im Durchschnitt in entgegengesetzte Richtungen bewegen. Die Korrelation wird in Kapitel 3 behandelt.

Aus Tabelle 1-2 geht hervor, dass die historische Korrelation zwischen den beiden Rohstoffen überwiegend (d. h. zu 88 %) positiv war. Unter Berücksichtigung der historischen Beobachtungen kann man sagen, dass die Wahrscheinlichkeit, dass der nächste Korrelationswert positiv sein wird, bei 88 % liegt. Das bedeutet auch, dass die Wahrscheinlichkeit, dass der nächste Korrelationswert negativ sein wird, bei 12 % liegt :

E ( Positiv Korrelation ) = 8 9 = 88 . 88 %

Dies ist ein weiteres grundlegendes Beispiel dafür, wie man Daten nutzt, um aus Beobachtungen Schlüsse zu ziehen und Entscheidungen zu treffen. Natürlich wird hier davon ausgegangen, dass die Ergebnisse der Vergangenheit genau die zukünftigen Ergebnisse widerspiegeln, was im wirklichen Leben unwahrscheinlich ist, aber manchmal hat man nur die Vergangenheit, um die Zukunft vorherzusagen.

Bevor wir uns mit Data Science beschäftigen, sollten wir uns ansehen, welche Arten von Daten verwendet werden können und sie in verschiedene Gruppen einteilen:

Numerische Daten

Diese Art von Daten besteht aus Zahlen, die eine bestimmte Art von Informationen widerspiegeln, die in regelmäßigen oder unregelmäßigen Abständen erhoben werden. Beispiele hierfür sind Marktdaten (OHLC,1 Volumen, Spreads usw.) und Jahresabschlussdaten (Vermögenswerte, Einnahmen, Kosten usw.).

Kategoriale Daten

Kategoriale Daten sind Daten, die mithilfe von Namen oder Etiketten in Gruppen oder Kategorien eingeteilt werden können. Sie sind eher qualitativ als quantitativ. Zum Beispiel ist die Blutgruppe von Patienten eine Art von kategorischen Daten. Ein anderes Beispiel ist die Augenfarbe verschiedener Stichproben aus einer Bevölkerung.

Textdaten

Textdaten sind in den letzten Jahren mit der Entwicklung der natürlichen Sprachverarbeitung (NLP) auf dem Vormarsch. Modelle für maschinelles Lernen nutzen Textdaten, um die Stimmung des Textes zu übersetzen, zu interpretieren und zu analysieren.

Visuelle Daten

Auch Bilder und Videos werden als Daten betrachtet, und du kannst sie verarbeiten und in wertvolle Informationen umwandeln. Ein Faltungsneuronales Netzwerk (CNN) zum Beispiel ist ein Algorithmus (siehe Kapitel 8), der Fotos anhand von Etiketten erkennen und kategorisieren kann (z. B. Katzenfotos als Katzen kennzeichnen).

Audio Daten

Audiodaten sind sehr wertvoll und können helfen, Zeit bei der Transkription zu sparen. Du kannst zum Beispiel Algorithmen auf Audiodaten anwenden, um Untertitel zu erstellen und automatisch zu erstellen. Du kannst auch Modelle erstellen, die anhand des Tons und der Lautstärke der Audiodaten die Stimmung des Sprechers/der Sprecherin interpretieren.

Data Science ist ein transdisziplinäres Fachgebiet, das versucht, mithilfe verschiedener Techniken und Modelle, seien sie einfach oder komplex, Erkenntnisse und Schlussfolgerungen aus Daten zu ziehen. Der Prozess der Datenwissenschaft besteht aus vielen Schritten neben der reinen Datenanalyse. Im Folgenden werden diese Schritte zusammengefasst:

  1. Datenerfassung: Dieser Prozess beinhaltet die Beschaffung von Daten aus zuverlässigen und genauen Quellen. Eine bekannte Redewendung in der Informatik, die George Fuechsel zugeschrieben wird, lautet "Garbage in, garbage out" und bezieht sich auf die Notwendigkeit, über qualitativ hochwertige Daten zu verfügen, auf die du dich für eine korrekte Analyse verlassen kannst. Grundsätzlich gilt: Wenn du ungenaue oder fehlerhafte Daten hast, sind alle deine Prozesse ungültig.
  2. Vorverarbeitung der Daten: Gelegentlich liegen die von dir erworbenen Daten in Rohform vor und müssen vorverarbeitet und bereinigt werden, damit die Data Science-Modelle sie nutzen können. Zur Vorverarbeitung gehören zum Beispiel das Löschen unnötiger Daten, das Hinzufügen fehlender Werte oder das Entfernen ungültiger und doppelter Daten. Andere, komplexere Beispiele sind die Normalisierung und Entrauschung von Daten. Das Ziel dieses Schrittes ist es, die Daten für die Analyse vorzubereiten.
  3. Datenexploration: In diesem Schritt werden grundlegende statistische Untersuchungen durchgeführt, um Trends und andere Merkmale in den Daten zu finden. Ein Beispiel für eine Datenuntersuchung ist die Berechnung des Mittelwerts der Daten.
  4. Datenvisualisierung: Dies ist ein wichtiger Schritt, der auf den vorherigen Schritt aufbaut. Er umfasst die Erstellung von Visualisierungen wie Histogrammen und Heatmaps, um Muster und Trends zu erkennen und die Interpretation zu erleichtern.
  5. Datenanalyse: Das ist der Hauptteil des Data Science-Prozesses. Hier passt du die Daten mit verschiedenen Lernmodellen an (trainierst) , damit sie die zukünftigen Ergebnisse auf der Grundlage der vorgegebenen Parameter interpretieren und vorhersagen.
  6. Dateninterpretation: In diesem Schritt geht es darum, die Rückmeldungen und Schlussfolgerungen der Data-Science-Modelle zu verstehen. In diesen Fällen kehren wir zu Schritt 5 zurück und lassen die Modelle erneut mit den aktualisierten Parametern laufen, bevor wir sie neu interpretieren und die Leistung bewerten.

Nehmen wir ein einfaches Beispiel in Python, das die Schritte des Data Science-Prozesses anwendet. Angenommen, du möchtest den VIX(Volatilitätsindex) analysieren und vorhersagen. Der VIX ist ein Volatilitätszeitreihenindikator, der die implizite Volatilität des S&P 500 Aktienmarktindex darstellt. Der VIX ist seit 1993 verfügbar und wird von der Chicago Board Options Exchange (CBOE) herausgegeben.

Hinweis

Es gibt auch einen versteckten Schritt im Data-Science-Prozess, den ich als Schritt Null bezeichne, und zwar dann, wenn du dir eine Vorstellung davon machst, welcher Prozess eingeleitet werden soll. Schließlich würdest du den Prozess nicht anwenden, wenn du nicht zuerst ein Motiv hättest. Wenn du zum Beispiel glaubst, dass die Inflationszahlen die Renditen bestimmter Rohstoffe beeinflussen, ist das eine Idee und ein Motiv, die Daten auf der Suche nach realen Zahlen, die diese Hypothese belegen, zu untersuchen.

Da er den Grad der Angst oder Unsicherheit am Aktienmarkt messen soll, wird der VIX häufig auch als Angstindex bezeichnet. Er ist ein Prozentsatz, der anhand der Preise von Optionen auf den S&P 500 berechnet wird. Ein höherer VIX-Wert korreliert mit größeren Marktturbulenzen und Unsicherheiten, während ein niedrigerer Wert im Durchschnitt mit größerer Stabilität korreliert.

Der erste Schritt ist die Datenerfassung, die in diesem Fall mit Python automatisiert werden kann. Der folgende Codeblock verbindet sich mit der Website der Federal Reserve of Saint Louis und lädt die historischen Daten des VIX zwischen dem 1. Januar 1990 und dem 23. Januar 2023 herunter(Kapitel 6 ist der Einführung in Python und dem Schreiben von Code gewidmet; im Moment musst du den Code noch nicht verstehen, denn das ist noch nicht das Ziel):

# Importing the required library
import pandas_datareader as pdr
# Setting the beginning and end of the historical data
start_date = '1990-01-01'
end_date   = '2023-01-23'
# Creating a dataframe and downloading the VIX data
vix = pdr.DataReader('VIXCLS', 'fred', start_date, end_date)
# Printing the latest five observations of the dataframe
print(vix.tail())

Der Code verwendet die Pandas-Bibliothek, um die Funktion DataReader zu importieren, die die historischen Daten online aus einer Vielzahl von Quellen abruft. Die Funktion DataReader nimmt den Namen der Daten als erstes Argument entgegen, gefolgt von der Quelle und den Daten. Die Ausgabe von print(vix.tail()) ist in Tabelle 1-3 dargestellt.

Tabelle 1-3. Ausgabe von print(vix.tail())
DATUM VIXCLS
2023-01-17 19.36
2023-01-01 20.34
2023-01-19 20.52
2023-01-20 19.85
2023-01-23 19.81

Kommen wir nun zum zweiten Schritt: der Datenvorverarbeitung. Ich unterteile diesen Teil in die Überprüfung auf ungültige Daten und die Umwandlung der Daten, damit sie für die Verwendung bereit sind. Beim Umgang mit Zeitreihen, insbesondere mit heruntergeladenen Zeitreihen, stößt du manchmal auf nan Werte. NaN steht für "Not a Number" (keine Zahl), und nan Werte entstehen durch fehlende, ungültige oder beschädigte Daten.

Du kannst mit den Werten von nan auf viele Arten umgehen. Für dieses Beispiel nehmen wir die einfachste Art, mit diesen ungültigen Werten umzugehen, nämlich sie zu löschen. Aber zuerst schreiben wir einen einfachen Code, der die Anzahl der nan Werte im Datenrahmen ausgibt, damit du eine Vorstellung davon bekommst, wie viele Werte du löschen wirst:

# Calculating the number of nan values
count_nan = vix['VIXCLS'].isnull().sum()
# Printing the result
print('Number of nan values in the VIX dataframe: ' + str(count_nan))

Der Code verwendet die Funktion isnull() und summiert die erhaltene Zahl, was die Anzahl der nan Werte ergibt. Die Ausgabe des vorherigen Codeschnipsels sieht folgendermaßen aus:

Number of nan values in the VIX dataframe: 292

Jetzt, da du eine Vorstellung davon hast, wie viele Zeilen du löschen wirst, kannst du den folgenden Code verwenden, um die ungültigen Zeilen zu löschen:

# Dropping the nan values from the rows
vix = vix.dropna()

Der zweite Teil des zweiten Schritts besteht darin, die Daten zu transformieren. Data-Science-Modelle erfordern in der Regel stationäre Daten, d. h. Daten mit stabilen statistischen Eigenschaften wie dem Mittelwert.

Hinweis

Das Konzept der Stationarität und die erforderlichen statistischen Metriken werden in Kapitel 3 ausführlich behandelt. Für den Moment musst du nur wissen, dass du deine Rohdaten wahrscheinlich in stationäre Daten umwandeln musst, wenn du datenwissenschaftliche Modelle verwendest.

Um die VIX-Daten in stationäre Daten umzuwandeln, kannst du einfach die Differenzen zwischen einem Wert und dem vorherigen Wert nehmen. Der folgende Codeschnipsel wandelt den VIX-Datenrahmen in theoretisch stationäre Daten um:2

# Taking the differences in an attempt to make the data stationary
vix = vix.diff(periods = 1, axis = 0)
# Dropping the first value of the dataframe
vix = vix.iloc[1: , :]

Der dritte Schritt ist die Datenexploration, bei der es darum geht, die Daten, die du vor dir hast, statistisch gesehen zu verstehen. Da du dich in Kapitel 3 ausführlich mit statistischen Metriken beschäftigen wirst, beschränke ich mich hier auf die Berechnung des Mittelwerts des Datensatzes.

Der Mittelwert ist einfach der Wert, der die anderen Werte im Datensatz repräsentieren kann, wenn sie einen Anführer wählen würden. Er ist die Summe der Werte geteilt durch ihre Anzahl. Der Mittelwert ist die einfachste Statistik in der Welt der deskriptiven Statistik und wird definitiv am häufigsten verwendet. Die folgende Formel zeigt die mathematische Darstellung des Mittelwerts einer Gruppe von Werten:

x ¯ = 1 n i=1 i x i

Du kannst den Mittelwert des Datensatzes ganz einfach wie folgt berechnen:

# Calculating the mean of the dataset
mean = vix["VIXCLS"].mean()
# Printing the result
print('The mean of the dataset = ' + str(mean))

Die Ausgabe des vorherigen Codeschnipsels sieht folgendermaßen aus:

The mean of the dataset = 0.0003

Der nächste Schritt ist die Datenvisualisierung, die meistens als der lustige Schritt angesehen wird. Wir wollen die differenzierten Werte des VIX im Zeitverlauf darstellen. Das folgende Codeschnipsel stellt die in Abbildung 1-1 gezeigten VIX-Daten dar:

# Importing the required library
import matplotlib.pyplot as plt
# Plotting the latest 250 observations in black with a label
plt.plot(vix[250:], color = 'black', linewidth = 1.5, 
         label = 'Change in VIX')
# Plotting a red dashed horizontal line that is equal to mean
plt.axhline(y = mean, color = 'red', linestyle = 'dashed')
# Calling a grid to facilitate the visual component
plt.grid()
# Calling the legend function so it appears with the chart
plt.legend()
# Calling the plot
plt.show()
Abbildung 1-1. Veränderung des VIX seit Anfang 2022

Die Schritte 5 und 6, Datenanalyse und Dateninterpretation, wirst du in diesem Buch gründlich lernen.

Bevor wir weitermachen, wollen wir noch einmal auf das Problem der ungültigen oder fehlenden Daten zurückkommen. Manchmal sind die Daten unvollständig und es fehlen Zellen. Auch wenn dies die Vorhersagekraft des Algorithmus beeinträchtigen kann, sollte es dich nicht davon abhalten, mit der Analyse fortzufahren, denn es gibt schnelle Lösungen, um die negativen Auswirkungen der leeren Zellen zu verringern. Betrachte zum Beispiel Tabelle 1-4.

Tabelle 1-4. Vierteljährliches BIP
Quartal BIP
Q1 2020 0.9%
Q2 2020 1.2%
Q3 2020 0.5%
Q4 2020 0.4%
Q1 2021 #N/A
Q2 2021 1.0%
Q3 2021 1.1%
Q4 2021 0.6%

Die Tabelle enthält das vierteljährliche Bruttoinlandsprodukt (BIP)3 eines hypothetischen Landes. Beachte, dass in der Tabelle der Wert für Q1 2021 fehlt. Es gibt drei grundlegende Möglichkeiten, dieses Problem zu lösen:

Lösche die Zelle, die den fehlenden Wert enthält.

Das ist die Technik, die im VIX-Beispiel verwendet wurde. Sie geht einfach davon aus, dass der Zeitstempel nicht existiert. Das ist die einfachste Lösung.

Nimm an, dass die fehlende Zelle gleich der vorherigen Zelle ist.

Auch dies ist eine einfache Lösung, die darauf abzielt, die Daten zu glätten, anstatt das Problem komplett zu ignorieren.

Berechne den Mittelwert oder den Median der Zellen um den leeren Wert.

Bei dieser Technik geht die Glättung noch einen Schritt weiter und nimmt an, dass der fehlende Wert dem Mittelwert zwischen dem vorherigen und dem nächsten Wert entspricht. Außerdem kann es sich um den Mittelwert einiger vergangener Beobachtungen handeln.

Data Science umfasst eine Reihe von mathematischen und statistischen Konzepten und erfordert ein tiefes Verständnis der Algorithmen des maschinellen Lernens. In diesem Buch werden diese Konzepte detailliert, aber auch auf leicht verständliche Weise diskutiert, sodass sowohl technische als auch nicht-technische Leser davon profitieren. Viele Modelle werden als "Mystery Boxes" angesehen, und daran ist auch etwas Wahres dran, aber die Aufgabe eines Datenwissenschaftlers ist es, die Modelle zu verstehen, bevor er ihre Ergebnisse interpretiert. Das hilft dabei, die Grenzen der Modelle zu verstehen.

In diesem Buch wird Python als Programmiersprache verwendet, um die Algorithmen zu erstellen. Wie bereits erwähnt, führt Kapitel 6 in Python ein und vermittelt die Kenntnisse, die für die Bearbeitung und Analyse der Daten erforderlich sind, aber es liefert auch die Grundlagen für die Erstellung der verschiedenen Modelle, die, wie du sehen wirst, einfacher sind, als du vielleicht erwartest.

Bevor wir zum nächsten Abschnitt kommen, werfen wir einen Blick auf das Konzept der Datenspeicherung. Schließlich sind Daten wertvoll, aber du musst sie an einem Ort speichern, an dem sie leicht abgerufen und analysiert werden können.

DieSpeicherung von Daten bezieht sich auf die Techniken und Bereiche, die verwendet werden, um Daten für zukünftige Analysen zu speichern und zu organisieren. Daten werden in vielen Formaten gespeichert, z. B. in CSV und XLSX. Andere Formate sind z.B. XML, JSON und sogar JPEG für Bilder. Die Wahl des Formats richtet sich nach der Struktur und Organisation der Daten.

Je nach Speicherkapazität und Kosten können die Daten auch in der Cloud oder vor Ort gespeichert werden. Du könntest zum Beispiel deine historischen, einminütigen Apple-Aktiendaten in der Cloud statt in einer CSV-Datei speichern, um Platz auf deinem lokalen Computer zu sparen.

Wenn du dich mit Zeitreihen in Python beschäftigst, wirst du hauptsächlich mit zwei Arten von Datenspeicherung zu tun haben: Arrays und Datenrahmen. Schauen wir uns einmal an, was das ist:

Array

Ein Array wird verwendet, um gleichartige Elemente zu speichern. Ein homogener Datensatz (z. B. Zahlen) lässt sich am besten in einem Array speichern.

Datenrahmen

Ein Datenrahmen ist eine zweidimensionale Struktur, in der Daten verschiedener Art gespeichert werden können. Er kann mit einer Tabelle mit Spalten und Zeilen verglichen werden.

Im Allgemeinen sollten Arrays immer dann verwendet werden, wenn eine homogene Datensammlung effizient gespeichert werden muss. Wenn du mit heterogenen Daten arbeitest oder wenn du Daten in Tabellenform bearbeiten und analysieren musst, solltest du Datenrahmen verwenden.

Hinweis

Die Datenwissenschaft entwickelt sich ständig weiter. Es werden ständig neue Methoden zur Speicherung entwickelt, um sie effizienter zu machen und ihre Kapazität und Geschwindigkeit zu erhöhen.

Datenwissenschaft verstehen

Data Science spielt eine wichtige Rolle für Technologie und Fortschritt. Algorithmen stützen sich auf Informationen, die von Data Science Tools bereitgestellt werden, um ihre Aufgaben zu erfüllen. Aber was sind Algorithmen?

Ein Algorithmus ist eine Reihe von geordneten Verfahren, die dazu dienen, eine bestimmte Tätigkeit auszuführen oder ein bestimmtes Problem zu lösen. Ein Algorithmus kann so einfach sein wie ein Münzwurf oder so kompliziert wie der Risch-Algorithmus.4

Nehmen wir einen sehr einfachen Algorithmus, der eine Charting-Plattform mit den notwendigen Finanzdaten aktualisiert. Dieser Algorithmus würde die folgenden Schritte durchlaufen:

  1. Verbinde den Server und den Online-Datenanbieter.
  2. Kopiere die Finanzdaten mit dem aktuellsten Zeitstempel.
  3. Füge die Daten in die Charting-Plattform ein.
  4. Gehe zurück zu Schritt 1 und wiederhole den gesamten Vorgang.

Das ist das Wesen von Algorithmen: Sie führen eine bestimmte Menge von Anweisungen mit einem endlichen oder unendlichen Ziel aus.

Hinweis

Die sechs Data Science-Schritte, die im vorherigen Abschnitt besprochen wurden, können auch als Algorithmus betrachtet werden.

Handelsstrategien sind auch Algorithmen, da sie klare Regeln für das Eingehen und Auflösen von Positionen haben. Ein Beispiel für eine Handelsstrategie ist die Marktarbitrage.

Arbitrage ist eine Handelsstrategie, die darauf abzielt, von Preisunterschieden desselben Vermögenswerts zu profitieren, der an verschiedenen Börsen notiert ist. Diese Preisunterschiede sind Anomalien, die von Arbitrageuren durch ihre Kauf- und Verkaufsaktivitäten beseitigt werden. Nehmen wir eine Aktie, die an der Börse A und der Börse B in verschiedenen Ländern gehandelt wird (der Einfachheit halber verwenden die beiden Länder dieselbe Währung). Natürlich muss die Aktie an beiden Börsen zum gleichen Preis gehandelt werden. Wenn diese Bedingung nicht erfüllt ist, kommen die Arbitrageure aus ihren Verstecken und gehen auf die Jagd.

Sie kaufen die Aktie an der billigeren Börse und verkaufen sie sofort an der teureren Börse und sichern sich so einen praktisch risikolosen Gewinn. Diese Operationen werden blitzschnell durchgeführt, da die Preisunterschiede aufgrund der schieren Kraft und Geschwindigkeit der Arbitrageure nicht lange anhalten. Um das zu verdeutlichen, hier ein Beispiel:

  • Der Kurs der Aktie an Börse A = 10,00 $.
  • Der Kurs der Aktie an der Börse B = 10,50 $.

Der Algorithmus des Arbitrageurs wird in diesem Fall Folgendes tun:

  1. Kaufe die Aktie an Börse A für 10,00 $.
  2. Verkaufe die Aktie sofort an Börse B für 10,50 $.
  3. Stecke die Differenz (0,50 $) ein und wiederhole den Vorgang, bis die Lücke geschlossen ist.
Hinweis

Handels- und Ausführungsalgorithmen können sehr komplex sein und erfordern Spezialwissen und einen gewissen Marktvorsprung.

An dieser Stelle solltest du die beiden Hauptanwendungen der Datenwissenschaft kennen: Dateninterpretation und Datenvorhersage:

Datenauswertung

Häufig auch als Business Intelligence oder einfach als Data Intelligence bezeichnet. Das Ziel des Einsatzes der Algorithmen ist es, das Was und Wie der Daten zu verstehen.

Datenvorhersage

Sie wird auch als prädiktive Analytik oder einfach als Prognose bezeichnet. Ziel des Einsatzes der Algorithmen ist es, zu verstehen, was als Nächstes mit den Daten geschieht.

Das Hauptziel des Einsatzes von Lernalgorithmen an den Finanzmärkten besteht darin, zukünftige Preise von Vermögenswerten vorherzusagen, damit du eine fundierte Handelsentscheidung treffen kannst, die zu einem Kapitalzuwachs mit einer höheren Erfolgsquote als dem Zufall führt. Ich bespreche in diesem Buch viele einfache und komplexe Lernalgorithmen. Diese Lernalgorithmen oder Modelle können wie folgt kategorisiert werden:

Überwachtes Lernen

Algorithmen des überwachten Lernens sind Modelle, die beschriftete Daten benötigen, um zu funktionieren. Das bedeutet, dass du Daten zur Verfügung stellen musst, damit das Modell sich selbst auf diese vergangenen Werte trainiert und die versteckten Muster versteht, damit es zukünftige Ergebnisse liefern kann, wenn es auf neue Daten trifft. Beispiele für überwachtes Lernen sind lineare Regressionsalgorithmen und Random-Forest-Modelle.

Unüberwachtes Lernen

Unüberwachte Lernalgorithmen sind Modelle, die keine beschrifteten Daten benötigen, um zu funktionieren. Das bedeutet, dass sie auch mit unmarkierten Daten arbeiten können, da sie so konstruiert sind, dass sie versteckte Muster selbständig finden. Beispiele hierfür sind Clustering-Algorithmen und die Hauptkomponentenanalyse (PCA).

Verstärkungslernen

Reinforcement-Learning-Algorithmen sind Modelle, die überhaupt keine Daten benötigen, da sie ihre Umgebung entdecken und selbständig daraus lernen. Im Gegensatz zu überwachten und unüberwachten Lernmodellen gewinnen Reinforcement-Learning-Modelle ihr Wissen durch Rückmeldungen aus der Umwelt über ein Belohnungssystem. Da dies in der Regel in Situationen angewandt wird, in denen ein Agent mit der Umwelt interagiert und lernt, sich so zu verhalten, dass die Belohnung im Laufe der Zeit maximiert wird, ist dieser Algorithmus nicht unbedingt die erste Wahl für die Regression von Zeitreihen. Andererseits kann er verwendet werden, um eine Strategie zu entwickeln, die auf Zeitreihendaten angewendet werden kann, um Vorhersagen zu erstellen.

Wie du vielleicht schon bemerkt hast, lautet der Titel des Buches "Deep Learning for Finance". Das bedeutet, dass ich neben anderen Lernmodellen einen großen Teil des Buches auf Deep-Learning-Modelle für Zeitreihenvorhersagen verwenden werde. Beim Deep Learning geht es vor allem um den Einsatz von neuronalen Netzen, ein Algorithmus, der in Kapitel 8 ausführlich behandelt wird.

Deep-Supervised-Learning-Modelle (z. B. tiefe neuronale Netze) können hierarchische Darstellungen der Daten lernen, weil sie viele Schichten umfassen, wobei jede Schicht Merkmale auf einer anderen Abstraktionsebene extrahiert. Dadurch lernen tiefe Modelle versteckte und komplexe Muster, die für flache (nicht tiefe) Modelle schwer zu lernen sind.

Auf der anderen Seite sind flache überwachte Lernmodelle (wie die lineare Regression) nur begrenzt in der Lage, komplexe, nichtlineare Beziehungen zu lernen. Aber sie benötigen weniger Rechenaufwand und sind daher schneller.

Data-Science-Algorithmen werden heutzutage fast überall eingesetzt, nicht nur im Finanzwesen. Einige Anwendungen sind die folgenden:

  • Geschäftsanalytik: Optimierung der Preisgestaltung, Vorhersage des Kundenumsatzes oder Verbesserung von Marketinginitiativen mithilfe von Datenanalysen
  • Gesundheitswesen: Verbesserung von Patientenergebnissen, Entwicklung innovativer Therapien oder Senkung der Gesundheitskosten durch eingehende Analyse von Patientendaten
  • Sport: Analyse von Sportdaten zur Verbesserung der Teamleistung, Spielerscouting oder Wetten
  • Forschung: Analysieren von Daten, um wissenschaftliche Untersuchungen zu unterstützen, Theorien zu beweisen oder neue Erkenntnisse zu gewinnen

Wenn jemand über Data Science-Anwendungen spricht, ist es hilfreich zu wissen, was ein Datenwissenschaftler tut. Ein Datenwissenschaftler muss komplexe Daten auswerten und verstehen, um Erkenntnisse zu gewinnen und Entscheidungshilfen zu geben. Zu den üblichen Aufgaben gehören die Entwicklung statistischer Modelle, die Anwendung von Techniken des maschinellen Lernens und die Visualisierung von Daten. Sie unterstützen die Umsetzung datengestützter Lösungen und informieren die Beteiligten über ihre Ergebnisse.

Hinweis

Data Scientists unterscheiden sich von Data Engineers. Während sich ein Datenwissenschaftler mit der Interpretation und Analyse von Daten beschäftigt, kümmert sich ein Dateningenieur um die Werkzeuge und die Infrastruktur, die zum Sammeln, Speichern und Analysieren von Daten benötigt werden.

Jetzt solltest du alles verstehen, was du für den Einstieg in die Datenwissenschaft brauchst. Kommen wir nun zum zweiten Hauptthema des Buches: Finanzmärkte.

Einführung in die Finanzmärkte und den Handel

Ziel dieses Buches ist es, einen praktischen Ansatz für die Anwendung verschiedener Lernmodelle zur Vorhersage von finanziellen Zeitreihendaten zu präsentieren. Daher ist es unerlässlich, sich ein solides Wissen darüber anzueignen, wie Handel und Finanzmärkte funktionieren.

Finanzmärkte sind Orte, an denen Menschen mit Finanzinstrumenten wie Aktien, Anleihen und Währungen handeln können. Der Akt des Kaufens und Verkaufens wird als Handel bezeichnet. Das wichtigste, aber nicht das einzige Ziel beim Kauf eines Finanzinstruments ist der Kapitalzuwachs. Der Käufer glaubt, dass der Wert des Instruments höher ist als sein Preis; deshalb kauft er die Aktie(geht long) und verkauft, wenn er glaubt, dass der aktuelle Preis dem aktuellen Wert entspricht. Im Gegensatz dazu können Händler/innen auch Geld verdienen, wenn der Preis des Instruments sinkt. Dieser Vorgang wird als Leerverkauf bezeichnet und ist auf bestimmten Märkten wie Futures und Devisen (FX) üblich.

Bei einem Leerverkauf leihst du dir das Finanzinstrument von einem Dritten, verkaufst es auf dem Markt und kaufst es zurück, bevor du es dem Dritten zurückgibst. Wenn du davon ausgehst, dass der Preis des Finanzinstruments fallen wird, kaufst du es im Idealfall zu einem niedrigeren Preis (nach dem Preisrückgang) zurück und gibst es dem Dritten zum Marktpreis zurück, sodass du die Differenz einsteckst. In den folgenden Beispielen werden diese Konzepte näher erläutert:

Beispiel für eine Long-Position (Kauf)

Ein Händler geht davon aus, dass der Kurs der Microsoft-Aktien in den nächsten Jahren aufgrund verbesserter technologischer Vorschriften steigen wird, was die Erträge erhöhen würde. Er kauft eine Anzahl von Aktien zu 250 $ und will sie bei 500 $ verkaufen. Der Händler hat also eine Long-Position auf Microsoft-Aktien (auch als " bullish" bezeichnet ).

Beispiel einer Short-Position (Verkauf)

Ein Händler erwartet, dass der Kurs der Lockheed Martin-Aktien in den nächsten Tagen aufgrund von Signalen aus einer technischen Strategie fallen wird. Er verkauft eine Anzahl von Aktien leerverkauft bei 450 $ und will sie bei 410 $ zurückkaufen. Der Händler hat also eine Short-Position auf Lockheed Martin-Aktien (auch " bearish" genannt).

Hinweis

Märkte, die sich im Aufwärtstrend befinden, werden als bullische Märkte bezeichnet. Abgeleitet von dem Wort " Bulle" und der aggressiven Natur des Bullen, hat "bullish" etwas mit Optimismus, Euphorie und Gier zu tun.

Märkte, die sich im Abwärtstrend befinden, werden als Baisse-Märkte bezeichnet. Abgeleitet von dem Wort " Bär" und seiner defensiven Natur, ist "bearish" mit Pessimismus, Panik und Angst verbunden.

Finanzinstrumente können in ihrer reinen Form (Spot) oder in Form von Derivaten vorliegen. Derivate sind Produkte, die Händler nutzen, um auf bestimmte Weise mit den Märkten zu handeln. Ein Forward- oder Futures-Kontrakt ist zum Beispiel ein Derivat, bei dem ein Käufer einen Preis für einen Vermögenswert festlegt, um ihn zu einem späteren Zeitpunkt zu kaufen.

Eine andere Art von Derivat ist eine Option. Eine Option ist das Recht, aber nicht die Verpflichtung, einen bestimmten Vermögenswert zu einem bestimmten Preis in der Zukunft zu kaufen, wenn man jetzt eine Prämie (den Optionspreis) zahlt. Wenn ein Käufer die zugrunde liegende Aktie kaufen möchte, übt er seine Option aus; andernfalls kann er die Option verfallen lassen.

Handelsaktivitäten können auch zu Absicherungszwecken erfolgen, da sie nicht nur auf Spekulationen beschränkt sind. Ein Beispiel dafür ist Air France (die wichtigste französische Fluggesellschaft), die ihre Geschäftstätigkeit durch den Kauf von Öl-Futures absichert. Durch den Kauf von Öltermingeschäften schützt sich Air France vor steigenden Ölpreisen, die ihr Hauptgeschäft (den Luftverkehr) beeinträchtigen könnten. Die steigenden Kosten für den Treibstoffverbrauch der Flugzeuge werden durch die Gewinne aus den Termingeschäften ausgeglichen. So kann sich die Fluggesellschaft auf ihr Hauptgeschäft konzentrieren. Dieser ganze Prozess wird als Hedging bezeichnet.

Ein weiteres Beispiel: Eine Fluggesellschaft erwartet, dass sie in den nächsten sechs Monaten eine bestimmte Menge Treibstoff verbrauchen wird, macht sich aber Sorgen über den möglichen Anstieg der Ölpreise in diesem Zeitraum. Um sich gegen dieses Preisrisiko abzusichern, kann die Fluggesellschaft einen Terminkontrakt abschließen, um Öl zu einem festen Preis zu einem zukünftigen Zeitpunkt zu kaufen.

Wenn der Ölpreis in dieser Zeit steigt, kann die Fluggesellschaft das Öl immer noch zu dem niedrigeren, im Terminkontrakt vereinbarten Festpreis kaufen. Sinkt der Ölpreis, wäre die Fluggesellschaft verpflichtet, den höheren Festpreis zu zahlen, aber der niedrigere Marktpreis für das Öl würde diese Kosten ausgleichen.

Auf diese Weise kann die Fluggesellschaft das Risiko von Preisschwankungen auf dem Ölmarkt mindern und ihre Treibstoffkosten stabilisieren. Dies kann der Fluggesellschaft helfen, ihr Budget besser zu verwalten und ihre zukünftigen Einnahmen zu prognostizieren. Wie du siehst, geht es nicht darum, finanzielle Gewinne aus den Handelsgeschäften zu erzielen, sondern einfach darum, die Kosten zu stabilisieren, indem ein bekannter Ölpreis festgeschrieben wird .

In der Regel werden Finanzinstrumente nach ihrer Art in Anlageklassen eingeteilt:

Aktienmärkte

Eine Börse ist ein (elektronischer oder physischer) Börsenplatz, an dem Unternehmen Aktien ausgeben, um Geld für ihre Geschäfte zu beschaffen. Wenn Menschen Aktien eines Unternehmens kaufen, werden sie zu Miteigentümern des Unternehmens und können je nach Unternehmensrichtlinien Anspruch auf Dividenden haben. Je nach Art der Aktie können sie auch das Recht erhalten, bei Vorstandssitzungen abzustimmen.

Festverzinsliche Wertpapiere

Regierungen und Unternehmen können sich auf dem Markt für festverzinsliche Wertpapiere Geld leihen. Wenn eine Person eine Anleihe kauft, leiht sie dem Kreditnehmer Geld, der sich verpflichtet hat, den Kredit mit Zinsen zurückzuzahlen. Abhängig von der Kreditwürdigkeit des Schuldners und den aktuellen Zinssätzen kann der Wert der Anleihe steigen oder fallen.

Währungen

Der Devisenmarkt, der auch als Markt für Währungen bezeichnet wird, ist ein Ort, an dem Menschen verschiedene Währungen kaufen und verkaufen können. Der Wert der Währung eines Landes kann aufgrund einer Vielzahl von Variablen steigen oder sinken, darunter die Wirtschaft, die Zinssätze und die politische Stabilität des Landes.

Rohstoffe

Landwirtschaftliche Produkte, Gold, Öl und andere Sachwerte mit industriellem oder anderem Nutzen werden als Rohstoffe bezeichnet. Sie bieten in der Regel die Möglichkeit, von globalen Wirtschaftstrends zu profitieren und sich gegen Inflation abzusichern.

Alternative Investitionen

In der Finanzwelt werden nicht-traditionelle Anlagen wie Immobilien, Private-Equity-Fonds und Hedge-Fonds als alternative Anlageklassen bezeichnet. Diese Anlageklassen haben das Potenzial, bessere Renditen als traditionelle Anlagen zu erzielen und bieten den Vorteil der Diversität, sind aber auch weniger liquide und schwieriger zu bewerten.

Es ist wichtig, sich daran zu erinnern, dass jede dieser Anlageklassen einzigartige Qualitäten und verschiedene Risikoniveaus hat. Daher sollten Anleger ihre Hausaufgaben machen, bevor sie in eine dieser Anlagen investieren.

Die Finanzmärkte ermöglichen es Unternehmen und Regierungen, das Geld zu beschaffen, das sie für ihren Betrieb benötigen. Außerdem ermöglichen sie es Investoren, Geld zu verdienen, indem sie spekulieren und in interessante Gelegenheiten investieren. Handelsaktivitäten sorgen für Liquidität auf den Märkten. Und je liquider ein Markt ist, desto einfacher und weniger kostspielig ist der Handel auf ihm. Aber wie funktionieren die Märkte wirklich? Wodurch steigen und fallen die Preise?

Marktmikrostruktur ist die Forschung, die sich mit dem Handel von Wertpapieren auf den Finanzmärkten beschäftigt. Sie untersucht, wie der Handel funktioniert und wie sich Händler, Investoren und Market Maker verhalten. Ziel der Marktmikrostrukturforschung ist es, die Preisbildung und die Variablen, die die Handelskosten beeinflussen, zu verstehen.

Auftragsfluss, Liquidität, Markteffizienz und Preisfindung sind nur einige der vielen Themen, die von der Marktmikrostrukturforschung abgedeckt werden. Außerdem wird untersucht, wie sich verschiedene Handelstechniken wie Limitaufträge, Marktaufträge und der algorithmische Handel auf die Marktdynamik auswirken. Liquidität ist wahrscheinlich das wichtigste Konzept der Marktmikrostruktur. Sie beschreibt, wie leicht ein Vermögenswert gekauft oder verkauft werden kann, ohne dass sich sein Preis wesentlich ändert. Die Liquidität kann je nach Finanzinstrument und im Laufe der Zeit variieren. Sie kann von einer Reihe von Variablen beeinflusst werden, darunter das Handelsvolumen und die Volatilität.

Zum Schluss möchte ich einen weiteren wichtigen Bereich der Marktmikrostruktur ansprechen: die Preisfindung. Damit ist die Methode gemeint, mit der die Preise auf einem Markt festgelegt werden. Die Preise können durch Elemente wie den Auftragsfluss, die Aktivität der Market Maker und das Vorhandensein verschiedener Handelsmethoden beeinflusst werden .

Stell dir vor, du möchtest eine große Anzahl von Aktien zweier Aktien kaufen: Aktie A und Aktie B. Aktie A ist sehr liquide, während Aktie B sehr illiquide ist. Wenn du den Kaufauftrag für Aktie A ausführen willst, wirst du wahrscheinlich zum gewünschten Marktpreis mit minimalen bis gar keinen Auswirkungen ausgeführt. Bei Aktie B hingegen wirst du wahrscheinlich einen schlechteren Preis erzielen, da es nicht genügend Verkäufer gibt, die bereit sind, zu deinem gewünschten Kaufpreis zu verkaufen. Wenn du also mit deinen Aufträgen mehr Nachfrage erzeugst, steigt der Preis, um den Preisen der Verkäufer zu entsprechen, und du wirst zu einem höheren (schlechteren) Preis kaufen. Das ist der Einfluss, den die Liquidität auf deinen Handel haben kann.

Anwendungen der Datenwissenschaft im Finanzwesen

Beginnen wir damit, einen Blick auf die wichtigsten Bereiche der Datenwissenschaft für das Finanzwesen zu werfen. Jeder Bereich hat seine Herausforderungen und Probleme, die einfache und komplexe Lösungen erfordern. Das Finanzwesen ist da nicht anders. In den letzten Jahren hat der Einsatz von Data Science zur Verbesserung der Finanzwelt, von der Unternehmenswelt bis hin zu den Märkten, enorm zugenommen. Lasst uns einige dieser Bereiche besprechen:

Die Richtung des Marktes vorhersagen

Das Ziel der Anwendung von Data Science auf finanzielle Zeitreihen ist es, Muster, Trends und Beziehungen in historischen Marktdaten aufzudecken, die dazu genutzt werden können, Vorhersagen über zukünftige Marktbewegungen zu treffen.

Aufdeckung von Finanzbetrug

Finanztransaktionen können mit datenwissenschaftlichen Modellen auf Muster und Anomalien untersucht werden, um möglichen Betrug zu erkennen. Eine Möglichkeit, Data Science zur Verhinderung von Finanzbetrug einzusetzen, besteht darin, die Daten von Kreditkartentransaktionen auf ungewöhnliche oder verdächtige Ausgabenmuster zu untersuchen, z. B. zahlreiche kleinere Einkäufe in kurzer Folge oder größere oder häufige Einkäufe im selben Geschäft.

Risikomanagement

Mit Hilfe von Data Science lassen sich Finanzdaten untersuchen und potenzielle Risiken für Portfolios erkennen. Dabei werden große Mengen historischer Daten mit Methoden wie statistischer Modellierung, maschinellem Lernen und künstlicher Intelligenz analysiert, um Muster und Trends zu erkennen, die zur Vorhersage von Risikofaktoren genutzt werden können.

Kreditwürdigkeitsprüfung

Mit Hilfe von Data Science können Finanzdaten und Kreditverläufe untersucht, die Kreditwürdigkeit einer Person oder eines Unternehmens prognostiziert und Kreditentscheidungen getroffen werden. Die Nutzung von Finanzdaten wie Einkommen und Kreditgeschichte zur Prognose der Kreditwürdigkeit einer Person ist ein Beispiel für die Anwendung von Data Science für die Kreditwürdigkeitsforschung. Dabei können Techniken wie statistische Modellierung und maschinelles Lernen eingesetzt werden, um ein Prognosemodell zu entwickeln, das eine Reihe von Indikatoren wie frühere Kreditwürdigkeit, Einkommen und Berufserfahrung nutzt, um die Wahrscheinlichkeit der Rückzahlung eines Kredits zu bewerten.

Natürliche Sprachverarbeitung

Um bessere Einschätzungen treffen zu können, analysiert NLP unstrukturierte Finanzdaten wie Nachrichtenartikel, Berichte und Beiträge in sozialen Medien und extrahiert daraus Erkenntnisse. NLP nutzt die Stimmung des Textes, um aus den Absichten und Gefühlen von Marktteilnehmern und Experten mögliche Handelsmöglichkeiten zu extrahieren. NLP fällt in den Bereich der Stimmungsanalyse (mit Hilfe von maschinellem Lernen).

Zusammenfassung

Der Bereich der Datenwissenschaft wächst jeden Tag mit der Einführung neuer Techniken und Modelle zur Verbesserung der Datenauswertung. Dieses Kapitel bietet eine einfache Einführung in das, was du über Data Science wissen musst und wie du es im Finanzwesen einsetzen kannst.

In den nächsten drei Kapiteln werden die Kenntnisse in Statistik, Wahrscheinlichkeitsrechnung und Mathematik vermittelt, die du brauchst, wenn du versuchst, Data Science-Modelle zu verstehen. Auch wenn das Ziel des Buches darin besteht, einen praktischen Ansatz für die Erstellung und Anwendung der verschiedenen Modelle mit Python zu präsentieren, ist es hilfreich, wenn du verstehst, womit du es zu tun hast, anstatt sie blindlings auf Daten anzuwenden.

Wenn du eine Auffrischung in Python brauchst, schau dir Kapitel 6 an, das eine grundlegende Einführung ist. Es legt den Grundstein für das, was in diesem Buch noch kommt. Du musst kein Python-Meister werden, aber du musst den Code verstehen und wissen, worauf er sich bezieht, und vor allem, wie du Fehler im Code finden und beheben kannst.

1 OHLC bezieht sich auf die vier wichtigsten Marktdaten: Eröffnungskurs, Höchstkurs, Tiefstkurs und Schlusskurs.

2 Der Grund dafür, dass ich "implizit" sage, ist, dass die Stationarität durch statistische Prüfungen überprüft werden muss, die du in Kapitel 3 kennenlernen wirst. Im Moment geht man davon aus, dass die Differenzierung der Daten zu stationären Zeitreihen führt.

3 Das BIP-Maß wird in Kapitel 12 ausführlicher behandelt.

4 Der Risch-Algorithmus ist eine unbestimmte Integrationstechnik, die verwendet wird, um Antiderivate zu finden, ein Konzept, das du in Kapitel 4 kennenlernen wirst.

Get Deep Learning für Finanzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.