类型a
主要作者与机构及发表信息
本文的主要作者包括Wentao Zhang、Yilei Zhao、Shuo Sun、Jie Ying、Yonggang Xie、Zitao Song、Xinrun Wang和Bo An,他们均来自新加坡南洋理工大学(Nanyang Technological University),其中Bo An还隶属于Skywork AI。该研究于2024年5月13日至17日在新加坡举行的ACM Web Conference 2024(WWW ‘24)上发表。
学术背景
本研究属于金融工程与强化学习(Reinforcement Learning, RL)交叉领域,旨在解决投资组合管理(Portfolio Management, PM)中的一个关键问题:如何在可定制股票池(Customizable Stock Pools, CSPs)中实现高效的资本分配。传统方法通常基于固定股票池进行投资决策,但实际投资者的需求往往因市场状态和个人偏好而异,例如临时调整交易的股票或添加热门股票。这种需求导致了CSPs的出现,而现有RL方法在面对CSPs时需要重新训练模型,计算成本高昂且性能不稳定。因此,本研究提出了一种名为EarnMore的强化学习框架,通过一次性训练即可适应不同投资者的个性化需求,从而提高投资回报并降低计算成本。
详细研究流程
本研究的工作流程分为三个主要部分:可屏蔽股票表示(Maskable Stock Representation)、强化学习优化(RL Optimization)和重加权机制(Re-weighting Mechanism)。
可屏蔽股票表示
强化学习优化
重加权机制
主要结果
1. 全球股票池(GSP)表现
- 在标准普尔500指数(S&P 500)和道琼斯工业平均指数(DJIA)的GSP测试中,EarnMore在多个金融指标上显著优于14种基线方法。例如,在S&P 500中,EarnMore的年化收益率(ARR)达到97.17%,夏普比率(SR)为2.032,分别比次优方法高出61.17%和2.626%。
- 在新冠疫情期间(2020年2月至3月),EarnMore的表现远优于其他方法,并在市场反弹后继续获得收益。
可定制股票池(CSPs)表现
消融实验
结论与意义
EarnMore框架通过一次性训练即可适应不同投资者的个性化需求,显著提高了投资组合管理的效率和收益。其科学价值在于提出了统一的股票池表示方法和高效的重加权机制,解决了现有RL方法在CSPs中的局限性。其应用价值在于为投资者提供了灵活且高效的工具,能够实时调整股票池并最大化长期收益。
研究亮点
1. 提出了可屏蔽股票表示方法,通过自监督掩码和重建过程捕捉股票间的关系。
2. 引入重加权机制,通过稀疏化投资比例提高投资组合的集中度。
3. EarnMore在多个数据集上的表现显著优于现有方法,特别是在高收益和风险调整收益方面。
其他有价值内容
研究还探讨了未来的研究方向,包括通过风险惩罚优化增强风险控制,以及开发更加灵活的开放式CSP平台,以便投资者轻松添加或移除股票。