最近在 Hacker News 上看了一组和 AI 量化交易相关的帖子,里面最有价值的信号不是“LLM 能不能直接预测股价”,而是大家开始把大模型放回更合理的位置:让它参与研究、解释和质疑,而不是直接当交易员。
这点很重要。很多所谓 AI trading demo 的问题在于,它们把 K 线、新闻、指标一股脑塞进 prompt,然后让模型输出 BUY、SELL 或 HOLD。这种形式看起来很智能,但工程上很脆弱:输入不可控、推理不可审计、仓位不可解释、风险边界也不清楚。
更合理的架构应该反过来:确定性的系统负责确定性的部分,大模型只处理它擅长的非结构化判断。
大模型不应该直接碰交易按钮
HN 上有一个 ModelX 项目,把 LLM 放进一个预测交易所里。模型不是简单回答问题,而是在一个有订单簿、有库存、有市场角色的环境里行动。作者还刻意使用 30 分钟一轮的 sealed auction,避免把 benchmark 变成推理速度竞赛。
这个设计比“问模型明天涨不涨”高级很多,因为它把问题从预测答案改成了评估行为:
- 模型能不能维持一致的仓位观点?
- 模型是更适合做 market maker,还是更适合做 directional taker?
- 模型会不会反复打脸,频繁从自己的头寸里逃出来?
- 模型在面对新闻、订单簿和库存时,是否能形成稳定策略?
这才是 AI trading 该问的问题。交易不是一次性的分类题,而是连续决策系统。
让 LLM 做 Brain,让代码做 Hands
另一个 AI Quant Agent 的帖子更接近可落地架构。作者没有把原始价格数据直接丢给模型,而是把系统拆成几层:
- 数学层:用 Python 或 Node.js 计算 SMA、ATR、RSI、历史胜率等确定性指标;
- 上下文层:抓取新闻、SEC filing、分析师评级等非结构化材料;
- LLM 层:让模型像投委会一样权衡技术面和新闻催化;
- 风控层:无论模型多看多,都要经过 ATR 和 volatility parity sizing;
- 执行层:通过 Telegram 做 human-in-the-loop 审批。
这个思路的关键是边界清楚。LLM 可以解释,可以争论,可以提出 thesis,但不能绕过风控和审批。
如果把它类比成基金团队,大模型更像 junior analyst 或 investment committee member,而不是 trader。它可以读材料、写 memo、挑战假设、总结 bear case,但最后的仓位、杠杆、止损、执行都必须由更硬的系统约束。
事件驱动市场更适合测试 LLM
BioTradingArena 也很有启发。它关注 biotech 股票,因为 biotech 很多波动来自 FDA decision、clinical trial readout、安全性更新等事件。
这类场景对 LLM 更友好,因为核心难点不是高频价格预测,而是理解文本里的真实含义。一个临床结果看起来“positive”,但如果 effect size 低于预期、只覆盖狭窄 subgroup、endpoint 没有显著降低后续 trial 风险,市场反而可能下跌。
这正是大模型可能有用的地方:把复杂、专业、非结构化的材料转化成可建模的特征。
BioTradingArena 的一个观察也很关键:直接让模型预测价格,效果未必最好;更可靠的做法可能是让 LLM 先量化 qualitative features,再把这些特征交给更简单的统计模型。
这说明 LLM 在交易系统里的价值,不一定是替代模型,而是生产更好的中间变量。
可写成产品的不是自动交易,而是研究驾驶舱
还有一个 MCP server for narrative-driven trading intelligence 的帖子,作者说得很直接:不信任 LLM 替自己下单,但信任它处理大量市场叙事、交易所数据、RSS feed,并帮助 pressure test thesis。
这其实是最好的产品切入点。
AI 量化交易最值得做的方向,可能不是“全自动赚钱机器”,而是研究驾驶舱:
- 自动聚合新闻、公告、财报、链上数据、市场 microstructure;
- 让 LLM 生成 bull case、bear case、variant perception;
- 把每个判断映射到可验证的数据点;
- 自动追踪 thesis 是否被证伪;
- 在下单前检查仓位、相关性、波动、回撤和流动性;
- 给人类一个结构化审批界面。
换句话说,AI 不应该绕过投资流程,而应该让投资流程更清晰。
结论
AI 量化交易真正的问题不是“模型会不会预测涨跌”,而是我们能不能构建一个可靠系统,让模型在合适的位置贡献价值。
短期内,大模型最适合做三件事:
- 把非结构化市场信息转化成结构化判断;
- 帮助研究员生成和反驳交易 thesis;
- 在受控环境里参与 benchmark,而不是直接管理真实资金。
真正值得构建的,不是一个会喊单的聊天机器人,而是一个有数据、有风控、有记忆、有审批、有回放能力的 AI research cockpit。