投资中的经南宫体育典问题:因子解读
,这门32学时的量化投资课程面对的是金融专业的研究生,在这么短的时间内想讲清楚并不容易。
万丈高楼平地起,对于量化投资来讲,因子是基础是基石。所以,今天趁儿子上课,来咖啡厅写一篇因子解读的文章。2015年底,WorldQuant(世坤)的祖拉博士公开了阿尔法101因子,自此,量化投资的神秘面纱被揭示在世人面前,中国也迅速在2016年进入了量化元年。但网络上对于阿尔法101因子的解读,要么有错误,要么过于学术南宫体育,下面,就以著名的阿尔法101因子中的2号因子为例,聊一聊我的认识。
4、log,含义:取对数,通常的理解是为了减小数据之间的差异,也可以这样理解,将变量转换成时间变量,或是一种降维观测方法;5、volume,含义:成交量;
这个公式翻译成可以看懂的语言,就是说002号因子的预测能力,与(成交量增量的时间)和(价格上涨速度)之间的(相关系数)成(反比)。
因子分析一般包括七项:分组收益分析、因子分布、因子行业分布、因子市值分布、IC(IR)分析(信息系数、信息比率)、信号衰竭分析、因子拥挤度分析等。
1、网上分析结论:网上对2号因子的分析结论,大部分认为这个因子的IC比较低,是一个学渣级的表现,没有使用价值。
2、最新分析结论:由于网上的结论是基于以前的测试数据得出的南宫体育,所以,我们重新对最近3年的数据(全市场和沪深300两类)进行一下检验,去繁求简,我们重点来看一看这三项:IC(IR)分析、信号衰竭分析、因子拥挤度南宫体育分析。
(1)从IC因子分析的结论看,IC表现没有达到最低0.03的标准,但在全市场中的IR表现尚可,如果扣除沪深300的表现,说明游资对这个因子有特别的偏好,而基金经理显然不太关注这个因子。
(2)从信号衰竭分析可以看出,这个信号的衰竭属性似乎比较快,但在全市场中的强度要高于沪深300的强度。
(3)从因子拥挤度分析来看,当下在沪深300和全市场中的拥挤度都比较低,可能有潜在的价值。
1、思考方法:通常情况下,我们简化一个问题,是用极值方法来考虑的,这个公式的核心是成交量与价格两个变量,两个变量各有两种极值,对应了四种变化:A连续放量加速上涨,B连续缩量加速上涨,C连接缩量加速下跌,D连续放量加速下跌。
2、假设结论:我们假设公式是有效的,那么就会得出一个简单的结论,即投资,如果想买入未来最可能上涨的股票(或跑赢大盘的股票),应当对应B和D两种情况才对。这个结论对不对,或者这个因子是不是可以解释,你可以从行为金融学和博弈论的角度去思考(前提是,你是一个纯粹的量化投资者)。如果用有效市场假说理论(传统经济学)去思考,你可能会得出相反的结论,这也是为什么基金经理不怎么用,而游资特别喜欢用的原因。所以,这个因子能不能用于实战,取决是你是一个什么样的信徒。
3、指数观察:判断一个因子是否有效,指数比较有说服力。我们可以观察上证指数近几次顶底的组合,是否符合这一特征。我做了一个简单的比对图,从这个角度看,这个因子有较强的借鉴性。另外,我给一些游资做过相关的策略,这个002号因子在他们的策略中或多或少都有运用(上课中举实战案例)。
虽然世坤无私地公开了阿尔法101因子,但其参数和预处理并没有做详细的说明,所以,很明显,他们还是藏了私心。失之毫厘,缪之千里,缺少实战经验的纯学术研究很可能得出不同的结论,所以,关于因子的使用与改进,在这里简单提个方向:
根据近3年的数据测试,在沪深300中表现最好的是阿尔法028号因子。这个因子表述的是:价格越高越不用考虑成交量,只考虑收盘价的态势即可判断涨跌(收盘价与高低点的中值相比),这似乎在茅台身上得到了完美的验证。而股价越低,越要看成交量与低点的关系,价格越低成交量的权重越大,这在沪深300里价格最低的包钢股份身上得到了体现(看下图)。这说明基金经理或许有这种倾向。如果你资金大,得知道基金经理在想什么;如果你资金小,就得知道游资在想什么。需要警惕的是,028号因子可能已经被市场发现,因为它的拥挤度已经排入101因子的前10,并且峰值是002号因子峰值的3倍,年初以来的下跌,其实与拥挤度是高度相关的。
如何量化赚钱(780赞):你在国内亲眼见过自己一个人全职做 量化交易、并比同等相近能力的上班族赚得多很多的人吗?
如何区分量化(161赞):量化交易和条件单有区别吗?不都是到达条件触发的东西嘛?
如何转型量化(101赞):30岁,量化开发做的不错,转量化研究员,能有多大概率转成功?
如何参加比赛(025赞):worldquant(世坤)大赛指南:做量化交易的,如何挖掘新因子
如何才有智慧(1453赞)女友收入比我高,但平常约会开销是我在负担。今天女友告诉我,她会理财,每月都存钱。问我为什么不存钱?