— 一封信
我做的东西
得真的跑起来。
Toronto / Thunder Bay · 2026
我在多伦多大学读的是数学与物理荣誉理学士(Honours BSc in Mathematics & Physics),是因为我想搞清楚「什么算证明」。之后的几年,基本是在课本外面找——这个问题在真实世界里还能不能拿到真的答案。答案大多落在「技术工作」和「现实世界」之间那道缝里,所以我就在那儿干活。
这是我大概是个什么人。
─ 引用,不要光说
没有出处的分只是装饰。FengShui Blueprint 最为信任做工作的那块,不是工程蓝图视觉风格,而是引擎里每一条规则都指向具体的古籍。二十四山来自 《青囊奥语》 和 《天玉经》。六种煞气分类来自 《阳宅十书》《阳宅撮要》《鲁班经》。四象分析来自 《葬书》 和 《雪心赋》。叙述器只能描述引擎算出来的东西,反过来不行。规则包本身是一个无依赖的 TypeScript module:纯函数、55 个 Vitest 测试、同输入同输出。一个我能给出处的小引擎,比一个我给不出出处的大引擎更值得上线。
─ 上线前先回测
我差点为欧冠冠军市场上线一个 3-模型 TSFM 集成(Chronos-2、TimesFM 2.5、FlowState)。回头跑了 83 场敲淘汰赛、五个赛季的回测,基线是调好的 Club Elo + Poisson 比分模型 + 5 万次 Monte Carlo,带 injury-weighted 评分,首回合 xG 折回二回合先验。TSFM 对点预测完全没增益。所以 Elo 上了线,TSFM 留在 --with-tsfm 的 ablation flag 后面。我打到 Polymarket 上的实仓 edge 用 half-Kelly 仓位,带显式的置信区间——而且只有在模型后验和市场预测的差,大于后验自身的噪声时,我才下。「希望模型 work」 的那个版本的我,我不让它去按 deploy 那个键。
─ 最小的可辩护单位
TaskMarket 的结算层是一个 Solidity 文件。四个状态(None / Funded / Released / Refunded)。不可升级、不走 proxy、没有第三个目的地址。Arbiter 仲裁争议时只能在两个已存在的出口之间二选一(原 payer 退款,或指定 payee 放行)——这是运营方在链上唯一的特权。费用 5%,常量上限 20%,每个 taskId 一次性。多伦多风水规则引擎是一个无依赖的 TypeScript package,测试可以穷举状态空间。两者都是「故意做小」的——任何系统里 load-bearing 的那一块,我希望它小到一个陌生人读一遍就能装进脑子,小到测试可以覆盖整个状态空间。
─ 为生产建,不为 demo 建
Tensor Proxies 自 2022 起在真实基础设施上服务付费用户。lakebbs 跑着一个活的中文社区论坛——Next.js 16 + Drizzle ORM + MySQL 5.7,nginx 反向代理,rsync 部署,uptime 监控全开,机器在多伦多。hypebot-rs 是一个永续 + 现货交易机器人的 Rust 重写,在 Hyperliquid 上管真实仓位。fengshui-web 用 @opennextjs/cloudflare 部到 Cloudflare Workers;API worker 用 D1 存评估归档、KV 做地理编码缓存兼 Google Maps 每日配额守卫、R2 存分享卡。没有任何一个有「demo 模式」。坏了的话,有人会立刻发现。
─ 市场一直来找我
我一直绕回到同一个形状:一个连续的分,一个仓位,一个被测出来的 edge。
hypebot-rs 是一个 Hyperliquid 交易机器人的 Rust 重写——永续 + 现货,实仓,信号管道 + 执行 + 风控全跑在同一个 runtime 里。fin-forecast-arena 是给时间序列基础模型做股票回测的 benchmark,这是 TSFM 的「逆境用例」:短时窗、regime break、没明显季节性。文章里诚实地写了基础模型故事在哪儿崩。UEFA / World Cup Oracle 是 Elo + Poisson + Monte Carlo 系统,在 Polymarket 几十亿美元体量的赛事市场上实时报 edge,half-Kelly 仓位、xG 和 injury 混合先验。TaskMarket 的 USDC escrow 本身就是一个市场原语——把一段聊天变成 marketplace 所需要的最小结算代码。market-option-monitor 看衍生品 flow。
底下那条线不是「我喜欢交易」。是金融系统是端到端测试预测和激励设计最干净的地方,因为它的 loss function 是诚实的。你可以骗 benchmark;市场不在乎你想让什么是真的。
─ 对三位小数保持警惕
测度论告诉你哪里允许不精确。统计力学告诉你一个问题最多能吸收多少噪声。两者都让你怀疑那种在并不配三位小数的数据上、报告三位小数的 dashboard。在任何预测项目上,我花得最多的时间是搞清楚「诚实的精度」到底是多少——校准图、对输出做 isotonic 回归、遵守时间顺序的 holdout split、walk-forward validation。模型是我最后才碰的东西。我宁可诚实地报一个宽区间,也不报一个我撑不住的点估计。
─ 一根穿过去的线
找到那个最小的、可被审计的信任单位,然后把系统的其余部分围着它建起来。这是我现在愿意署名的唯一一条命题。
─ 最近在读
- Statistical Rethinking — Richard McElreath
- Designing Data-Intensive Applications — Martin Kleppmann
- Advances in Financial Machine Learning — Marcos López de Prado
- 古典经卷:《葬书》《阳宅十书》《河图》
- Working in Public — Nadia Eghbal