Capitolo 4. Dati simulati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Spesso si dice che i dati sono il nuovo petrolio, ma questa analogia non è del tutto corretta. Il petrolio è una risorsa finita che deve essere estratta e raffinata, mentre i dati sono una risorsa infinita che viene costantemente generata e raffinata.
Halevy et al. (2009)
A principale inconveniente dell'ambiente finanziario introdotto nel capitolo precedente è che si basa di default su un'unica serie storica di dati finanziari. Si tratta di un insieme di dati troppo limitato con cui addestrare un agente di deep Q-learning (DQL). È come addestrare un'intelligenza artificiale su una singola partita di scacchi di e aspettarsi che abbia buone prestazioni complessive negli scacchi.
Questo capitolo introduce approcci basati sulla simulazione per aumentare i dati disponibili per l'addestramento di un agente DQL. Il primo approccio, introdotto in "Dati di serie temporali rumorosi", consiste nell'aggiungere un rumore casuale a una serie temporale finanziaria statica. Sebbene sia opinione comune che i dati delle serie temporali finanziarie contengano già del rumore - rispetto ai movimenti di prezzo o ai rendimenti indotti dalle informazioni - l'idea è quella di addestrare l'agente su un gran numero di serie temporali simili, nella speranza che impari a distinguere le informazioni dal rumore.
Il secondo approccio, discusso ...