Discrete-Time Mean-Variance Strategy Based on Reinforcement Learning

Xiangyu Cui; Xun Li; Yun Shi; Si Zhao

doi:10.48550/arxiv.2312.15385

Back

Preprint

Discrete-Time Mean-Variance Strategy Based on Reinforcement Learning

Xiangyu Cui, Xun Li, Yun Shi and Si Zhao

12/23/2023

DOI: https://doi.org/10.48550/arxiv.2312.15385

Abstract

Computer Science - Learning

Quantitative Finance - Mathematical Finance

Quantitative Finance - Portfolio Management

This paper studies a discrete-time mean-variance model based on reinforcement learning. Compared with its continuous-time counterpart in \cite{zhou2020mv}, the discrete-time model makes more general assumptions about the asset's return distribution. Using entropy to measure the cost of exploration, we derive the optimal investment strategy, whose density function is also Gaussian type. Additionally, we design the corresponding reinforcement learning algorithm. Both simulation experiments and empirical analysis indicate that our discrete-time model exhibits better applicability when analyzing real-world data than the continuous-time model.

Metrics

36 Record Views

Details

Title: Discrete-Time Mean-Variance Strategy Based on Reinforcement Learning
Creators: Xiangyu Cui
Xun Li
Yun Shi
Si Zhao
Identifiers: 9924317287401921
Academic Unit: Department of Mathematics
Language: English
Resource Type: Preprint

Discrete-Time Mean-Variance Strategy Based on Reinforcement Learning

Abstract

Metrics

Details

Brandeis University Social media