阅读历史 |

第394章 《另类数据的潘多拉魔盒》(2 / 2)

加入书签

“语音波动率超过3个标准差,”林语晨调出模型输出,“说谎概率92。”次日,该公司发布承认库存积压,股价暴跌12,做空该股票的对冲仓位获利颇丰。

林薇调出回测报告:“过去一年的数据显示,语音波动率因子在财报季的i值达031,”她的语气带着赞许,“但训练数据需要每周更新,否则会受语言模式变化影响。”

陈默点头,却眉头微皱:“就像方言进化会影响语音识别,管理层也会学习规避检测,需要持续迭代模型。”

深夜点,交易室的主灯已关闭,只剩林语晨工位的台灯亮着,光圈照亮她专注的脸庞。她递来新的卫星数据清单,纸质文件上印着模糊的卫星图片:“新能源车企a的工厂卫星图显示,生产线全开,产能利用率达95,”她的手指划过文字,“但财报显示销量同比下滑12,库存周转天数翻倍。”

陈默揉了揉眉心,调出美债收益率曲线,红色曲线陡峭上扬:“十年期收益率突破37,购车贷款成本上升导致月供增加20,”他划出股债相关性曲线,“消费贷利率每上升1,汽车销量下降35,这是宏观因子对需求端的压制。”

林语晨若有所思,在纸上写下公式:“产能利用率=供给端数据,销量=需求端数据,中间隔着库存和价格变量,”她的笔尖停顿,“或许该用美债收益率作为需求端的权重因子,调整产能数据的预测逻辑。”

“但这会让模型复杂度指数级上升,”陈默摇头,看着她电脑屏幕上的风险平价模型,“先做好单因子的逻辑校验,比如验证产能利用率与用电量的相关性——卫星数据可能无法区分生产与仓储。”他的目光落在模型参数上,“这个模型用了arki均值方差优化,但流动性因子的权重只有5。”

“流动性数据滞后性强,”林语晨解释,“用过去30天平均成交量作为代理变量。”

“加入成交量的变异系数,”陈默提醒,“当变异系数超过15时,说明流动性不稳定,模型需要降仓。”他的声音里带着一丝担忧,“2015年股灾时,很多量化基金死于流动性幻觉。”

陈默在操盘日志中写道:“另类数据是望远镜,能看见细节,却可能迷失方向。”钢笔尖在“方向”二字上停留过久,墨迹渗透纸页背面。他转头看向林语晨,她正咬着笔帽调试模型,发丝垂落额前:“小晨,风险平价模型的流动性参数设置是多少?”

“默认用过去30天的平均成交量,”她回答,调出参数界面,“但新能源板块近一周的成交量变异系数达1八,已经触发警示阈值。”

“记得加入冲击成本因子,”陈默站起身,活动僵硬的肩颈,“当成交量萎缩时,大额订单的滑点可能吞噬所有收益。”他保存日志时,系统提示林语晨的模型训练进度为7八,迭代次数显示为第127次,“过度拟合的风险在增加,适可而止。”

窗外,数据中心的ld指示灯如繁星闪烁,陈默知道,每一次数据创新都是对认知边界的挑战。另类数据打开了新的视角,却也带来更多需要解答的问题。当团队沉迷于数据细节时,他必须保持清醒,不让算法沦为数据的囚徒——因为在金融市场,比数据更重要的,是对人性与周期的敬畏。

↑返回顶部↑

书页/目录