回测是量化投资基本步骤中的关键环节,可以帮助投资者观察策略在历史数据中的表现,确认和检查交易策略在过去是否有效,并评估其优势和劣势。明汯投资认识到,尽管回测结果有其价值,但过去有效的规律在未来并不一定成立,因此回测结果也不能完全代表未来的市场情况。明汯投资在回测过程中,始终注重策略的稳健性和适应性。
回测的存在有助于提高实盘交易的胜率和收益率,在节约试错成本、验证策略有效性和可行性、优化和调整策略参数、制定更合理的风险控制措施以及提供决策依据等方面都发挥着重要作用。
然而,与回测相伴而行的还有“过拟合” (overfitting)这一模型训练中的常见陷阱,这一现象的出现会导致量化模型的实际表现不及预期。为了应对这一问题,明汯投资深入思考如何降低模型出现过拟合现象的可能性,进而提高模型的泛化能力。
从基础定义出发,过拟合这一概念在统计学和机器学习领域被广泛使用,可分为训练过拟合和回测过拟合两个层次。明汯投资曾就此解释道,训练过拟合主要发生在机器学习语境下,具有更狭义的内涵。它是指“机器学习模型在训练集上表现良好,但在测试集或新数据上表现较差”。
这种情况的出现往往是由于模型过度复杂,超参数选择不当,或者模型训练过度导致的。为了解决这一问题,明汯投资采取交叉验证等合理的方法来选择模型的超参数,以及避免模型训练过度。
回测过拟合则是量化研究语境下更广义的概念。它描述的是“量化模型在回测阶段表现好,在实盘阶段表现差”。明汯投资指出,这种情况的产生,可能是由于市场规律发生了变化,或者模型过度学习了回测阶段数据的噪音。回测过拟合难以根除,相对合理的解决方案是借助量化指标检验回测过拟合程度。
自2014年创立以来,上海明汯投资作为国内资产管理规模超过500亿的量化机构之一,综合研究能力长期位居市场领先水平。明汯投资目前已拥有多策略对冲系列、CTA系列、均衡系列、量化多头系列(300指增、500指增、1000指增、全市场选股等)等多条产品线,体现了其在量化投资领域的深厚实力和创新能力。