首页  

聚宽因子库 Alpha191 Alpha101     所属分类 quant 浏览量 10
核心概念
阿尔法因子: 
一个可以被计算的具体指标或信号,理论上与股票未来的超额收益存在稳定的相关性。
例如:“过去一个月跌幅最大的股票,接下来可能会反弹”就是一个简单的因子逻辑。

聚宽因子库: 
聚宽(JoinQuant)量化平台将其实现的大量因子整理成库,方便用户直接调用、研究和构建策略。
Alpha 101 和 Alpha 191 是其中最经典的两组。

Alpha 101
起源: 
源于世界量化巨头 WorldQuant 在2015年发布的《101 Formulaic Alphas》学术论文。
该论文用简洁的公式定义了101个阿尔法因子,并提供了详细的数学表达式和预处理说明。

特点:
公式化: 每个因子都有明确的数学计算公式,可复现性强。
多样化: 涵盖了动量、反转、价量、相关性、非线性变换等多个维度。
复杂性: 
很多因子公式比较复杂,直接阅读不易理解其经济含义。
它们是数据挖掘和金融经验结合的产物。

示例(Alpha #001):

公式: 
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5)

通俗理解: 
这是一个结合了波动率和价格的复杂因子。
大致逻辑:
在下跌时考虑波动率,上涨时考虑价格,寻找某种极端情况的股票,预期其未来会发生反转。

Alpha 191
起源: 
由中国量化机构(据信是华泰证券金工团队)在2017年发布的《基于AI的选股因子挖掘框架》中提出。
他们利用机器学习方法,从价量数据中自动挖掘出了191个有效的因子。

特点:
AI挖掘: 
并非由人类专家直接设计,而是通过遗传规划等算法从基础运算符中自动生成和筛选出来的。
本土化: 
基于中国A股市场数据挖掘,理论上可能对A股市场有更好的适应性。
可解释性弱: 
很多因子的公式看起来像“乱码”,其金融逻辑不如传统因子清晰,更像是一种“数据模式”。

示例(Alpha #001):

公式: 
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5) 
注意:这只是示意,实际Alpha191的因子公式非常长且复杂

通俗理解: 
很难用一句话解释,它可能是机器找到的某种能预测未来收益的价量“模式”或“形状”。

对比总结
特性	Alpha 101	Alpha 191
提出方	WorldQuant(国际)	华泰证券(中国)
产生方式	专家经验与公式化	AI自动挖掘
逻辑可解释性	相对较强,有金融逻辑可循	相对较弱,更像数据模式
市场背景	基于全球市场(尤其美股)设计	基于中国A股市场数据挖掘
复杂度	高	极高
主要维度	价量、动量、反转、相关性等	价量模式为主



在聚宽平台上的使用
聚宽因子库已经原生实现了这两组因子,可以像使用内置指标一样方便地调用。

调用方法:

# 在聚宽研究环境或策略中
from jqdata import *

# 获取股票列表
stocks = ['000001.XSHE', '600519.XSHG']

# 获取日期
date = '2023-01-04'

# 获取 Alpha 101 中的第1号因子值
alpha_001 = get_alpha_factor(stocks, date, 'alpha_001') 
# 假设函数名如此,具体请查聚宽API文档

# 获取 Alpha 191 中的第1号因子值
alpha191_001 = get_alpha_factor(stocks, date, 'alpha191_001')
请注意: 
实际函数名请务必查阅最新的聚宽官方API文档,通常可能是 get_alpha101 或 get_alpha191 等。

使用流程:
因子获取: 调用API获得历史因子值。
数据处理: 处理缺失值、异常值。
因子检验: 进行IC分析、分层回测、收益归因等,检验因子的预测能力、稳定性、换手率。
组合构建: 将有效的因子与其他因子结合,构建综合评分模型,选择股票。
策略回测: 形成完整的交易策略进行回测。

注意事项(警告)
不是圣杯: 
这些因子是公开的,其有效性会随着市场变化和使用者的增多而衰减或失效。
直接使用而不加改进,很难获得持续稳定的收益。

过拟合风险: 
尤其是Alpha 191,由AI在历史数据中挖掘,过拟合风险极高。
它们在样本内可能表现惊人,但在样本外(未来)可能完全失效。

计算成本: 
这些因子计算量很大,实时计算对系统有要求。聚宽平台提供了优化后的函数。

学习的意义大于直接使用:
学习因子构造思想: 
通过研究这些因子的公式,理解顶级机构是如何将市场直觉转化为数学表达的。
作为特征工程的基础: 
可以将这些因子值作为机器学习模型的特征输入。

灵感来源: 
启发结合新的数据源(如舆情、另类数据)或新的方法,创造出属于自己的独家因子。

学习建议
入门: 先从传统的、逻辑清晰的因子(如市盈率、动量、波动率)开始学习。

研读原版论文: 
找到《101 Formulaic Alphas》和《基于AI的选股因子挖掘框架》原文阅读,理解其精髓。

在聚宽上复现和测试: 
选择几个代表性的因子,自己尝试计算,并与聚宽库中的结果对比。然后进行严格的因子测试。

思考与改进: 
问自己:
这个因子为什么可能有效?
它在什么市场环境下会失效?
能不能修改参数或结合其他信息来增强它?


聚宽的Alpha 101和Alpha 191因子库是强大的工具和宝贵的学习资源,
但绝非“点石成金”的魔盒。
成功的量化投资需要深刻理解市场、严谨的研究流程和持续的创新。

聚宽单因子分析工具
https://github.com/JoinQuant/jqfactor_analyzer

上一篇    
python随机数种子作用及使用方法

python3抽象类使用实例

WorldQuant 101 因子