本发明涉及金融技术相关领域,具体为一种基于大模型的智能多因子投研方法。
背景技术:
1、在证券投资分析的传统实践中,多因子模型已成为一种核心的量化工具,通过整合不同的投资因子来对证券进行评分和排名,以此来指导投资决策。这些因子通常包括但不限于价值、动量、规模、盈利能力等多个维度的指标,各因子在模型中的权重反映了它们对证券评分的影响程度。通过这种方式,多因子模型旨在捕捉证券市场的复杂性和规律性,为投资者提供一个相对科学的投资决策工具。
2、然而,传统的多因子模型构建和优化过程存在诸多挑战。首先,因子的选择和组合往往需要基于投资经理的经验和市场洞察,这不仅依赖于个人的主观判断,而且在操作上也十分复杂和繁琐。此外,一旦选定因子,就需要进行大量的数据处理和统计分析来优化这些因子的权重分配,这个过程通常是时间消耗巨大且效率低下的,在快速变化的市场环境中很难做到实时响应。
3、随着人工智能技术,特别是大语言模型(large language models,llms)的快速发展,人工智能技术在理解自然语言、处理大数据等方面的能力显著提高,为金融投资分析带来了新的机遇。这些高级ai模型能够自动从大量金融文献、新闻报道和数据记录中提取信息,并根据这些信息生成投资相关的洞察和建议,从而在某种程度上实现自动化的投资研究和分析。
4、特别是,在多因子模型的构建和优化过程中,利用大语言模型的语义理解能力和数据处理能力,有望自动化地完成因子的挖掘、筛选和组合,同时基于实时数据动态优化因子权重,大幅提高多因子投资策略的构建效率和响应速度。这不仅减少了人工操作的复杂性,也使得因子的选择和优化过程更加科学、合理和透明,提高了投资决策的质量和投资策略的执行效率,为量化投资和策略研究开辟了新的路径。
5、此外,通过利用大模型技术的智能化特点,可以进一步拓展多因子模型在证券投资分析中的应用,比如引入更加多样化和前沿的因子,如基于文本分析的情绪因子、基于网络分析的关联因子等,这些都是传统方法难以涉及或处理的新领域。因此,大模型技术不仅解决了多因子投研过程中的现实挑战,还为证券投资分析领域带来了创新的视角和方法。
技术实现思路
1、本发明的目的在于提供一种基于大模型的智能多因子投研方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于大模型的智能多因子投研方法,包括以下步骤:
3、步骤s1、输入想法:研究员根据自己的研究思路,将因子生成想法输入系统的想法输入框;
4、步骤s2、生成种子:调用openai大语言模型llm接口,对输入的想法进行解析,根据训练知识库,搜集投资领域的内容,返回一组种子alpha的表达式及对应的python代码;
5、步骤s3、生成符号库:利用llm每次随机生成一组符号库,在后续遗传算法中作为基金;
6、步骤s4、优化训练:采用遗传算法,将步骤s3中的符号和步骤s2中的alpha种子表达式作为基因,用因子ic值作为评估函数,进行迭代优化,根据每次生成的个体表达式,自动生成python计算代码,同时基于langchain框架,自动连接数据库提取相应的数据,自动执行因子计算代码,对于不能执行的代码块进行反馈,直至可运行,训练完成后输出按照因子ic值排序的因子表达式;
7、步骤s5、因子回测:根据步骤s4中ic值排序的因子表达式,选取ic值排名前3的因子作为输出,并同步计算因子回测收益率、因子年化收益率、夏普指标,用以评估因子表现;
8、步骤s6、因子组合策略构建:将步骤s5中生成的因子应用于ai因子合成,ai因子与其他非ai生成的因子一同利用机器学习和深度学习的算法进行优化,构建自适应投资策略;
9、步骤s7、根据步骤s6中的投资策略,选择表现较优的模型构建投资组合,同时系统支持深度学习算法模拟组合回测,支持投资决策。
10、优选的,所述步骤s1中研究员输入自己的想法语句,在算法中会对该语句进行限制和补充,以确保该想法是在金融投资领域而不是其他领域,具体的在输入语句前加上“你是金融领域的量化投资助手,帮助研究员测试投资想法”,在语句进行限制和补充使llm输出更精确。
11、优选的,所述步骤s3中符号库包括常用的时间序列处理函数以及数学符号。
12、优选的,所述步骤s6中机器学习和深度学习的算法具体包括如下:机器学习算法选用xgboost算法,深度学习算法选用bp全连接神经网络,具体的,首先对因子进行特征工程处理,然后把因子放到对应的学习模型框架里根据设定的一个最优标准进行反复训练,训练目标是未来一个周期的股票收益率,经过反复的超参数及激活函数的调整和网络结构的优化最终找到能在样本内能拟合收益的最优结构以及相应的因子权重组合,进行收益预测。
13、与现有技术相比,本发明的有益效果是:本发明通过可批量生成因子,因子挖掘效率较高;因子有效性强,每次输出的因子都经过机器学习算法优化;因子多样性强,即使输入的是同一种想法,每次输出的因子也有差异,基于大模型强大的知识库,保证因子的多样性;系统集成的深度学习算法丰富,供用户自由选择对比;使用简单,界面友好。只需描述想法即可生成因子,且因子组合页面只需输入预测目标,选择深度学习算法即可实现。对于没有量化背景的研究员也可轻松使用。
1.一种基于大模型的智能多因子投研方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大模型的智能多因子投研方法,其特征在于:所述步骤s1中研究员输入自己的想法语句,在算法中会对该语句进行限制和补充,以确保该想法是在金融投资领域而不是其他领域,具体的在输入语句前加上“你是金融领域的量化投资助手,帮助研究员测试投资想法”,在语句进行限制和补充使llm输出更精确。
3.根据权利要求1所述的一种基于大模型的智能多因子投研方法,其特征在于:所述步骤s3中符号库包括常用的时间序列处理函数以及数学符号。
4.根据权利要求1所述的一种基于大模型的智能多因子投研方法,其特征在于:所述步骤s6中机器学习和深度学习的算法具体包括如下:机器学习算法选用xgboost算法,深度学习算法选用bp全连接神经网络,具体的,首先对因子进行特征工程处理,然后把因子放到对应的学习模型框架里根据设定的一个最优标准进行反复训练,训练目标是未来一个周期的股票收益率,经过反复的超参数及激活函数的调整和网络结构的优化最终找到能在样本内能拟合收益的最优结构以及相应的因子权重组合,进行收益预测。