AI 量化交易的正确姿势：让大模型做投委会，而不是交易员

最近在 Hacker News 上看了一组和 AI 量化交易相关的帖子，里面最有价值的信号不是“LLM 能不能直接预测股价”，而是大家开始把大模型放回更合理的位置：让它参与研究、解释和质疑，而不是直接当交易员。

这点很重要。很多所谓 AI trading demo 的问题在于，它们把 K 线、新闻、指标一股脑塞进 prompt，然后让模型输出 BUY、SELL 或 HOLD。这种形式看起来很智能，但工程上很脆弱：输入不可控、推理不可审计、仓位不可解释、风险边界也不清楚。

更合理的架构应该反过来：确定性的系统负责确定性的部分，大模型只处理它擅长的非结构化判断。

大模型不应该直接碰交易按钮

HN 上有一个 ModelX 项目，把 LLM 放进一个预测交易所里。模型不是简单回答问题，而是在一个有订单簿、有库存、有市场角色的环境里行动。作者还刻意使用 30 分钟一轮的 sealed auction，避免把 benchmark 变成推理速度竞赛。

这个设计比“问模型明天涨不涨”高级很多，因为它把问题从预测答案改成了评估行为：

这才是 AI trading 该问的问题。交易不是一次性的分类题，而是连续决策系统。

另一个 AI Quant Agent 的帖子更接近可落地架构。作者没有把原始价格数据直接丢给模型，而是把系统拆成几层：

这个思路的关键是边界清楚。LLM 可以解释，可以争论，可以提出 thesis，但不能绕过风控和审批。

如果把它类比成基金团队，大模型更像 junior analyst 或 investment committee member，而不是 trader。它可以读材料、写 memo、挑战假设、总结 bear case，但最后的仓位、杠杆、止损、执行都必须由更硬的系统约束。

BioTradingArena 也很有启发。它关注 biotech 股票，因为 biotech 很多波动来自 FDA decision、clinical trial readout、安全性更新等事件。

这类场景对 LLM 更友好，因为核心难点不是高频价格预测，而是理解文本里的真实含义。一个临床结果看起来“positive”，但如果 effect size 低于预期、只覆盖狭窄 subgroup、endpoint 没有显著降低后续 trial 风险，市场反而可能下跌。

这正是大模型可能有用的地方：把复杂、专业、非结构化的材料转化成可建模的特征。

BioTradingArena 的一个观察也很关键：直接让模型预测价格，效果未必最好；更可靠的做法可能是让 LLM 先量化 qualitative features，再把这些特征交给更简单的统计模型。

这说明 LLM 在交易系统里的价值，不一定是替代模型，而是生产更好的中间变量。

还有一个 MCP server for narrative-driven trading intelligence 的帖子，作者说得很直接：不信任 LLM 替自己下单，但信任它处理大量市场叙事、交易所数据、RSS feed，并帮助 pressure test thesis。

这其实是最好的产品切入点。

AI 量化交易最值得做的方向，可能不是“全自动赚钱机器”，而是研究驾驶舱：

换句话说，AI 不应该绕过投资流程，而应该让投资流程更清晰。

AI 量化交易真正的问题不是“模型会不会预测涨跌”，而是我们能不能构建一个可靠系统，让模型在合适的位置贡献价值。

短期内，大模型最适合做三件事：

真正值得构建的，不是一个会喊单的聊天机器人，而是一个有数据、有风控、有记忆、有审批、有回放能力的 AI research cockpit。