更新时间:2023-10-27 22:49点击:
(原标题:中国股市可以准确预测吗?来自机器学习的视角)
股票收益率的可预测性一直以来都是金融学界研究的焦点。尤金·法玛的有效市场理论认为股票市场不能被公开市场信息预测。然而,越来越多的研究表明,利率、通货膨胀、投资者情绪、方差风险溢价等很多变量都能显著地预测未来的股票市场收益率。
有了诸多可预测变量后,个股收益率到底能在多大程度上被预测?到底哪些股票特征真正为样本外收益率预测提供了有效信息?这些预测结果能够用于股票资产配置并赚取超额收益吗?
中国股票市场发展迅速,2020年10月,中国股市规模达到了新的历史记录,总市值达到79.72万亿元。然而,中国股票市场仍然存在一些不成熟的特征,散户比例高、交易频繁、股票市场波动大等。
因此,探索以上问题在中国资本市场的答案对于提升中国股票市场资金的有效配置至关重要。
由于影响股票收益率的因素非常多,提取有效信息较为困难。机器学习在解决该问题时有一定的优越性,其能够将高维度数据压缩成低维,同时还能保留较多的信息。
机器学习(Machine Learning),是由亚瑟·塞缪尔(Arthur Samuel)在1959年用机器解决跳棋游戏的背景下提出的, 其是指一种计算机程序,它可以学习产生一种行为,而这种行为不是由程序的作者明确编程实现的。相反,它能够显示出作者可能完全没有意识到的行为。这种行为的学习基于以下三个因素:
1. 程序消耗的数据;
2. 量化当前行为和理想行为之间的误差或某种形式的距离的度量;
3. 使用量化误差指导程序在后续事件中产生更好行为的反馈机制。
可以看出,第二个和第三个因素使这个概念变得抽象,并强调其深层的数学根源。因此,机器学习在模拟人的行为感知和决策的同时,能够基于算法进行分析和推理,实现对股市的预测。
来自苏黎世大学的Markus Leippold,Qian Wang以及来自浙江大学的Wenyu Zhou在国际金融学顶级期刊《Journal of Financial Economics》发表文章“Machine learning in the Chinese stock market”,文章利用机器学习技术,从资本市场特征入手对我国股票收益的可预测性、无做空的投资组合收益等进行研究,扩充了我国资本市场领域的相关文献。
该论文于2021年4月投稿,2021年6月被接收,2021年8月正式刊出。
本文从中国股市特征入手,尝试展开对比性研究,具体主要从三个方面切入:
第一,相比被机构投资者主导的成熟市场,中国股市由所谓“散户”主导。根据2019年上海交易所的年报,散户数占所有账户的比例为99.8%。如此高的散户比例,导致整个市场的交易额会因为散户频繁的短期交易行为而增加。因此整个市场的高波动性有可能会造成股价在经济基础上的偏移。
所以基于这一特征,作者提出:是否某些由投资者交易行为形成的新兴技术性指标比公司基础特征更具有定价能力(预测能力)。
第二,很多研究中国股市的学者提出,中国股市的关键特征是集中调控、银行主导与单一关系驱动。比如上市国企的股价在低于基础价值时是被保护的。鉴于国企在中国资本市场中的重要性和唯一性,所以对于国企的研究需要更加细致和特殊的对待。
基于此,作者提出:是否上市国企的股价会因为政府调控因素而变得难以预测?
第三,中国资本市场缺少做空机制,而金融领域经典的因子分析主要依赖于多空组合构造。
基于此,本文从无做空操作出发,使结果更易被中国股市投资者理解与应用。
另外,目前对于中国股市来说,还没有一个广泛的可用因子数据库,本文另一个贡献就是建立了一个可理解的因子集与其配套数据。
文章在解释股票收益时,采用了经典的模型设置,即: