预测 · ·7 min
时序基础模型在美股上:敌对场景
美股是 TSFM 不想做的压力测试。一个诚实的 zero-shot benchmark 必须怎么做?
- #Time Series
- #Forecasting
- #Finance
Chronos / TimesFM / FlowState 等时序基础模型的公开 benchmark 大多在信噪比高的领域测试 —— 能耗、零售需求、旅游、宏观指标。美股是完全相反的场景:低信号、厚尾、regime shift、随机游走已经能打败大多数 forecaster。
一个诚实的 zero-shot evaluation 需要:rolling-origin、固定 window / horizon / metric、按 horizon 拆分而非平均、把 calibration 从 accuracy 里独立出来衡量。
完整中文版稍后补;先看 英文版。
— 相关阅读