第382章 《因子熔炉:三千变量的生死淘汰》(1 / 2)
4月八日,上海浦东的量化实验室里,中央空调发出低频嗡鸣,环形屏幕将3276个因子代码投射成流动的星群。陈默站在中央控制台前,看着林语晨滑动鼠标,夏普比率曲线在屏幕左侧如心电图般跳动,某动量因子的十年回测曲线在2017年6月2日处垂直坠落,犹如悬崖边的失事缆车。
“动量因子在2014-2016年的夏普比率高达21,”林语晨的指尖在曲线峰值处停顿,指甲修剪得短而整齐,“但在2017年5月的‘漂亮50’行情中,单月回撤达42,胜率从65暴跌至32。”她的声音像手术刀划开皮肤,冷静得近乎残酷,“这不是因子失效,是市场从‘动量主导’相变到‘价值主导’,而因子没有随之进化。”
技术总监小李调出分年度回测报告,不同年份的胜率数据在屏幕上切换:2015年牛市65,2016年震荡市4八,2017年蓝筹市32。“那年监管层限制高送转和杠杆资金,”他的鼠标在政策文件图标上划过,“游资退场导致动量策略失灵,传统因子库缺乏政策敏感度。”
陈默盯着屏幕上褪色的“市盈率”因子,其信息系数在2020年后持续低于01,宛如暮年武士的锈剑。林语晨在白板上写下夏普比率公式,粉笔灰落在“过拟合”三个字周围:“夏普比率是静态后视镜,”她用粉笔敲击公式中的波动率项,“而市场是动态河流,因子需要能识别水流方向的罗盘。”
午后14:00,第一轮筛选结果出炉,大屏幕上的因子数量从3276锐减至397,红色淘汰名单如鲜血般铺满90的画面。小李指着“ir情绪熵”因子,其信息系数曲线在003附近波动,像一条濒死的直线:“iir仅0八,低于10的最低标准,而且数据来源是境外社交媒体,合规风险极高。”
林语晨调出2020年g逼空事件的分时图,社交媒体热度曲线在股价暴涨前三日出现陡峭峰值:“看这里,因子在散户抱团前72小时发出预警,”她的鼠标圈住情绪熵的正偏离区域,“传统i计算给极端事件的权重不足1,这是线性思维的致命盲区。”
陈默调出因子矩阵,“订单流不平衡度”因子在暗池交易时段的信息系数突然归零:“暗池数据延迟100毫秒,”他的手指在时间轴上划出红色线段,“在高频环境中,100毫秒足以让机构完成5次拆单和撤单,因子捕捉到的只是滞后的噪音。”
林语晨的眉头微蹙,调出暗池交易占比数据:“2025年一季度,暗池交易占a股总量的1八7,”她的目光扫过服务器机柜,“我们的模型假设暗池与公开市场同质,但冰山委托的平均拆单规模已从500手降至200手。”
↑返回顶部↑