Chapitre 4. Données simulées
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
On dit souvent que les données sont le nouveau pétrole, mais cette analogie n'est pas tout à fait juste. Le pétrole est une ressource limitée qui doit être extraite et raffinée, alors que les données sont une ressource infinie qui est constamment générée et raffinée.
Halevy et al. (2009)
A inconvénient majeur de l'environnement financier tel qu'il a été présenté dans le chapitre précédent est qu'il s'appuie par défaut sur une seule série chronologique financière historique. Il s'agit là d'un ensemble de données trop limité avec lequel on peut former un agent de Deep Learning (DQL). C'est comme entraîner une IA sur une seule partie d'échecs et s'attendre à ce qu'elle ait de bonnes performances globales aux échecs.
Ce chapitre présente des approches basées sur la simulation pour augmenter les données disponibles pour la formation d'un agent DQL. La première approche, présentée dans "Données de séries temporelles bruitées", consiste à ajouter du bruit aléatoire à une série temporelle financière statique. Bien qu'il soit communément admis que les données de séries temporelles financières contiennent généralement déjà du bruit - par rapport aux mouvements de prix ou aux rendements qui sont induits par l'information - l'idée est de former l'agent sur un grand nombre de séries temporelles similaires dans l'espoir qu'il apprenne ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access