文章详情|聚宽因子库 Alpha191 Alpha101

聚宽因子库 Alpha191 Alpha101 所属分类 quant 浏览量 161
核心概念
阿尔法因子： 
一个可以被计算的具体指标或信号，理论上与股票未来的超额收益存在稳定的相关性。
例如：“过去一个月跌幅最大的股票，接下来可能会反弹”就是一个简单的因子逻辑。

聚宽因子库： 
聚宽（JoinQuant）量化平台将其实现的大量因子整理成库，方便用户直接调用、研究和构建策略。
Alpha 101 和 Alpha 191 是其中最经典的两组。

Alpha 101
起源： 
源于世界量化巨头 WorldQuant 在2015年发布的《101 Formulaic Alphas》学术论文。
该论文用简洁的公式定义了101个阿尔法因子，并提供了详细的数学表达式和预处理说明。

特点：
公式化： 每个因子都有明确的数学计算公式，可复现性强。
多样化： 涵盖了动量、反转、价量、相关性、非线性变换等多个维度。
复杂性： 
很多因子公式比较复杂，直接阅读不易理解其经济含义。
它们是数据挖掘和金融经验结合的产物。

示例（Alpha #001）：

公式: 
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5)

通俗理解： 
这是一个结合了波动率和价格的复杂因子。
大致逻辑：
在下跌时考虑波动率，上涨时考虑价格，寻找某种极端情况的股票，预期其未来会发生反转。

Alpha 191
起源： 
由中国量化机构（据信是华泰证券金工团队）在2017年发布的《基于AI的选股因子挖掘框架》中提出。
他们利用机器学习方法，从价量数据中自动挖掘出了191个有效的因子。

特点：
AI挖掘： 
并非由人类专家直接设计，而是通过遗传规划等算法从基础运算符中自动生成和筛选出来的。
本土化： 
基于中国A股市场数据挖掘，理论上可能对A股市场有更好的适应性。
可解释性弱： 
很多因子的公式看起来像“乱码”，其金融逻辑不如传统因子清晰，更像是一种“数据模式”。

示例（Alpha #001）：

公式: 
(rank(Ts_ArgMax(SignedPower(((returns < 0) ? stddev(returns, 20) : close), 2.), 5)) - 0.5) 
注意：这只是示意，实际Alpha191的因子公式非常长且复杂

通俗理解： 
很难用一句话解释，它可能是机器找到的某种能预测未来收益的价量“模式”或“形状”。

对比总结
特性	Alpha 101	Alpha 191
提出方	WorldQuant（国际）	华泰证券（中国）
产生方式	专家经验与公式化	AI自动挖掘
逻辑可解释性	相对较强，有金融逻辑可循	相对较弱，更像数据模式
市场背景	基于全球市场（尤其美股）设计	基于中国A股市场数据挖掘
复杂度	高	极高
主要维度	价量、动量、反转、相关性等	价量模式为主



在聚宽平台上的使用
聚宽因子库已经原生实现了这两组因子，可以像使用内置指标一样方便地调用。

调用方法：

# 在聚宽研究环境或策略中
from jqdata import *

# 获取股票列表
stocks = ['000001.XSHE', '600519.XSHG']

# 获取日期
date = '2023-01-04'

# 获取 Alpha 101 中的第1号因子值
alpha_001 = get_alpha_factor(stocks, date, 'alpha_001') 
# 假设函数名如此，具体请查聚宽API文档

# 获取 Alpha 191 中的第1号因子值
alpha191_001 = get_alpha_factor(stocks, date, 'alpha191_001')
请注意： 
实际函数名请务必查阅最新的聚宽官方API文档，通常可能是 get_alpha101 或 get_alpha191 等。

使用流程：
因子获取： 调用API获得历史因子值。
数据处理： 处理缺失值、异常值。
因子检验： 进行IC分析、分层回测、收益归因等，检验因子的预测能力、稳定性、换手率。
组合构建： 将有效的因子与其他因子结合，构建综合评分模型，选择股票。
策略回测： 形成完整的交易策略进行回测。

注意事项（警告）
不是圣杯： 
这些因子是公开的，其有效性会随着市场变化和使用者的增多而衰减或失效。
直接使用而不加改进，很难获得持续稳定的收益。

过拟合风险： 
尤其是Alpha 191，由AI在历史数据中挖掘，过拟合风险极高。
它们在样本内可能表现惊人，但在样本外（未来）可能完全失效。

计算成本： 
这些因子计算量很大，实时计算对系统有要求。聚宽平台提供了优化后的函数。

学习的意义大于直接使用：
学习因子构造思想： 
通过研究这些因子的公式，理解顶级机构是如何将市场直觉转化为数学表达的。
作为特征工程的基础： 
可以将这些因子值作为机器学习模型的特征输入。

灵感来源： 
启发结合新的数据源（如舆情、另类数据）或新的方法，创造出属于自己的独家因子。

学习建议
入门： 先从传统的、逻辑清晰的因子（如市盈率、动量、波动率）开始学习。

研读原版论文： 
找到《101 Formulaic Alphas》和《基于AI的选股因子挖掘框架》原文阅读，理解其精髓。

在聚宽上复现和测试： 
选择几个代表性的因子，自己尝试计算，并与聚宽库中的结果对比。然后进行严格的因子测试。

思考与改进： 
问自己：
这个因子为什么可能有效？
它在什么市场环境下会失效？
能不能修改参数或结合其他信息来增强它？


聚宽的Alpha 101和Alpha 191因子库是强大的工具和宝贵的学习资源，
但绝非“点石成金”的魔盒。
成功的量化投资需要深刻理解市场、严谨的研究流程和持续的创新。

聚宽单因子分析工具
https://github.com/JoinQuant/jqfactor_analyzer
python随机数种子作用及使用方法

python3抽象类使用实例

WorldQuant 101 因子

《趋势跟踪》笔记

因子量化投资开源库

因子与量化投资联系和区别