聚宽因子库 Alpha191 Alpha101
所属分类 quant
浏览量 10
核心概念
阿尔法因子:
一个可以被计算的具体指标或信号,理论上与股票未来的超额收益存在稳定的相关性。
例如:“过去一个月跌幅最大的股票,接下来可能会反弹”就是一个简单的因子逻辑。
聚宽因子库:
聚宽(JoinQuant)量化平台将其实现的大量因子整理成库,方便用户直接调用、研究和构建策略。
Alpha 101 和 Alpha 191 是其中最经典的两组。
Alpha 101
起源:
源于世界量化巨头 WorldQuant 在2015年发布的《101 Formulaic Alphas》学术论文。
该论文用简洁的公式定义了101个阿尔法因子,并提供了详细的数学表达式和预处理说明。
特点:
公式化: 每个因子都有明确的数学计算公式,可复现性强。
多样化: 涵盖了动量、反转、价量、相关性、非线性变换等多个维度。
复杂性:
很多因子公式比较复杂,直接阅读不易理解其经济含义。
它们是数据挖掘和金融经验结合的产物。
示例(Alpha #001):
公式:
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5)
通俗理解:
这是一个结合了波动率和价格的复杂因子。
大致逻辑:
在下跌时考虑波动率,上涨时考虑价格,寻找某种极端情况的股票,预期其未来会发生反转。
Alpha 191
起源:
由中国量化机构(据信是华泰证券金工团队)在2017年发布的《基于AI的选股因子挖掘框架》中提出。
他们利用机器学习方法,从价量数据中自动挖掘出了191个有效的因子。
特点:
AI挖掘:
并非由人类专家直接设计,而是通过遗传规划等算法从基础运算符中自动生成和筛选出来的。
本土化:
基于中国A股市场数据挖掘,理论上可能对A股市场有更好的适应性。
可解释性弱:
很多因子的公式看起来像“乱码”,其金融逻辑不如传统因子清晰,更像是一种“数据模式”。
示例(Alpha #001):
公式:
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5)
注意:这只是示意,实际Alpha191的因子公式非常长且复杂
通俗理解:
很难用一句话解释,它可能是机器找到的某种能预测未来收益的价量“模式”或“形状”。
对比总结
特性 Alpha 101 Alpha 191
提出方 WorldQuant(国际) 华泰证券(中国)
产生方式 专家经验与公式化 AI自动挖掘
逻辑可解释性 相对较强,有金融逻辑可循 相对较弱,更像数据模式
市场背景 基于全球市场(尤其美股)设计 基于中国A股市场数据挖掘
复杂度 高 极高
主要维度 价量、动量、反转、相关性等 价量模式为主
在聚宽平台上的使用
聚宽因子库已经原生实现了这两组因子,可以像使用内置指标一样方便地调用。
调用方法:
# 在聚宽研究环境或策略中
from jqdata import *
# 获取股票列表
stocks = ['000001.XSHE', '600519.XSHG']
# 获取日期
date = '2023-01-04'
# 获取 Alpha 101 中的第1号因子值
alpha_001 = get_alpha_factor(stocks, date, 'alpha_001')
# 假设函数名如此,具体请查聚宽API文档
# 获取 Alpha 191 中的第1号因子值
alpha191_001 = get_alpha_factor(stocks, date, 'alpha191_001')
请注意:
实际函数名请务必查阅最新的聚宽官方API文档,通常可能是 get_alpha101 或 get_alpha191 等。
使用流程:
因子获取: 调用API获得历史因子值。
数据处理: 处理缺失值、异常值。
因子检验: 进行IC分析、分层回测、收益归因等,检验因子的预测能力、稳定性、换手率。
组合构建: 将有效的因子与其他因子结合,构建综合评分模型,选择股票。
策略回测: 形成完整的交易策略进行回测。
注意事项(警告)
不是圣杯:
这些因子是公开的,其有效性会随着市场变化和使用者的增多而衰减或失效。
直接使用而不加改进,很难获得持续稳定的收益。
过拟合风险:
尤其是Alpha 191,由AI在历史数据中挖掘,过拟合风险极高。
它们在样本内可能表现惊人,但在样本外(未来)可能完全失效。
计算成本:
这些因子计算量很大,实时计算对系统有要求。聚宽平台提供了优化后的函数。
学习的意义大于直接使用:
学习因子构造思想:
通过研究这些因子的公式,理解顶级机构是如何将市场直觉转化为数学表达的。
作为特征工程的基础:
可以将这些因子值作为机器学习模型的特征输入。
灵感来源:
启发结合新的数据源(如舆情、另类数据)或新的方法,创造出属于自己的独家因子。
学习建议
入门: 先从传统的、逻辑清晰的因子(如市盈率、动量、波动率)开始学习。
研读原版论文:
找到《101 Formulaic Alphas》和《基于AI的选股因子挖掘框架》原文阅读,理解其精髓。
在聚宽上复现和测试:
选择几个代表性的因子,自己尝试计算,并与聚宽库中的结果对比。然后进行严格的因子测试。
思考与改进:
问自己:
这个因子为什么可能有效?
它在什么市场环境下会失效?
能不能修改参数或结合其他信息来增强它?
聚宽的Alpha 101和Alpha 191因子库是强大的工具和宝贵的学习资源,
但绝非“点石成金”的魔盒。
成功的量化投资需要深刻理解市场、严谨的研究流程和持续的创新。
聚宽单因子分析工具
https://github.com/JoinQuant/jqfactor_analyzer
上一篇
python随机数种子作用及使用方法
python3抽象类使用实例
WorldQuant 101 因子