— 一封信

我做的东西
得真的跑起来。

Toronto / Thunder Bay · 2026

我在多伦多大学读的是数学与物理荣誉理学士（Honours BSc in Mathematics & Physics），是因为我想搞清楚「什么算证明」。之后的几年，基本是在课本外面找——这个问题在真实世界里还能不能拿到真的答案。答案大多落在「技术工作」和「现实世界」之间那道缝里，所以我就在那儿干活。

这是我大概是个什么人。

─ 引用，不要光说

没有出处的分只是装饰。FengShui Blueprint 最为信任做工作的那块，不是工程蓝图视觉风格，而是引擎里每一条规则都指向具体的古籍。二十四山来自《青囊奥语》和《天玉经》。六种煞气分类来自《阳宅十书》《阳宅撮要》《鲁班经》。四象分析来自《葬书》和《雪心赋》。叙述器只能描述引擎算出来的东西，反过来不行。规则包本身是一个无依赖的 TypeScript module：纯函数、55 个 Vitest 测试、同输入同输出。一个我能给出处的小引擎，比一个我给不出出处的大引擎更值得上线。

─ 上线前先回测

我差点为欧冠冠军市场上线一个 3-模型 TSFM 集成（Chronos-2、TimesFM 2.5、FlowState）。回头跑了 83 场敲淘汰赛、五个赛季的回测，基线是调好的 Club Elo + Poisson 比分模型 + 5 万次 Monte Carlo，带 injury-weighted 评分，首回合 xG 折回二回合先验。TSFM 对点预测完全没增益。所以 Elo 上了线，TSFM 留在 --with-tsfm 的 ablation flag 后面。我打到 Polymarket 上的实仓 edge 用 half-Kelly 仓位，带显式的置信区间——而且只有在模型后验和市场预测的差，大于后验自身的噪声时，我才下。「希望模型 work」的那个版本的我，我不让它去按 deploy 那个键。

─ 最小的可辩护单位

TaskMarket 的结算层是一个 Solidity 文件。四个状态（None / Funded / Released / Refunded）。不可升级、不走 proxy、没有第三个目的地址。Arbiter 仲裁争议时只能在两个已存在的出口之间二选一（原 payer 退款，或指定 payee 放行）——这是运营方在链上唯一的特权。费用 5%，常量上限 20%，每个 taskId 一次性。多伦多风水规则引擎是一个无依赖的 TypeScript package，测试可以穷举状态空间。两者都是「故意做小」的——任何系统里 load-bearing 的那一块，我希望它小到一个陌生人读一遍就能装进脑子，小到测试可以覆盖整个状态空间。

─ 为生产建，不为 demo 建

Tensor Proxies 自 2022 起在真实基础设施上服务付费用户。lakebbs 跑着一个活的中文社区论坛——Next.js 16 + Drizzle ORM + MySQL 5.7，nginx 反向代理，rsync 部署，uptime 监控全开，机器在多伦多。hypebot-rs 是一个永续 + 现货交易机器人的 Rust 重写，在 Hyperliquid 上管真实仓位。fengshui-web 用 @opennextjs/cloudflare 部到 Cloudflare Workers；API worker 用 D1 存评估归档、KV 做地理编码缓存兼 Google Maps 每日配额守卫、R2 存分享卡。没有任何一个有「demo 模式」。坏了的话，有人会立刻发现。

─ 市场一直来找我

我一直绕回到同一个形状：一个连续的分，一个仓位，一个被测出来的 edge。

hypebot-rs 是一个 Hyperliquid 交易机器人的 Rust 重写——永续 + 现货，实仓，信号管道 + 执行 + 风控全跑在同一个 runtime 里。fin-forecast-arena 是给时间序列基础模型做股票回测的 benchmark，这是 TSFM 的「逆境用例」：短时窗、regime break、没明显季节性。文章里诚实地写了基础模型故事在哪儿崩。UEFA / World Cup Oracle 是 Elo + Poisson + Monte Carlo 系统，在 Polymarket 几十亿美元体量的赛事市场上实时报 edge，half-Kelly 仓位、xG 和 injury 混合先验。TaskMarket 的 USDC escrow 本身就是一个市场原语——把一段聊天变成 marketplace 所需要的最小结算代码。market-option-monitor 看衍生品 flow。

底下那条线不是「我喜欢交易」。是金融系统是端到端测试预测和激励设计最干净的地方，因为它的 loss function 是诚实的。你可以骗 benchmark；市场不在乎你想让什么是真的。

─ 对三位小数保持警惕

测度论告诉你哪里允许不精确。统计力学告诉你一个问题最多能吸收多少噪声。两者都让你怀疑那种在并不配三位小数的数据上、报告三位小数的 dashboard。在任何预测项目上，我花得最多的时间是搞清楚「诚实的精度」到底是多少——校准图、对输出做 isotonic 回归、遵守时间顺序的 holdout split、walk-forward validation。模型是我最后才碰的东西。我宁可诚实地报一个宽区间，也不报一个我撑不住的点估计。

─ 一根穿过去的线

找到那个最小的、可被审计的信任单位，然后把系统的其余部分围着它建起来。这是我现在愿意署名的唯一一条命题。

─ 最近在读

Statistical Rethinking — Richard McElreath
Designing Data-Intensive Applications — Martin Kleppmann
Advances in Financial Machine Learning — Marcos López de Prado
古典经卷：《葬书》《阳宅十书》《河图》
Working in Public — Nadia Eghbal