项目体验地址:agent.sparkvalues.com
散户交易者的痛点
在研究交易的过程中,我发现散户真正想要的是长期可复现,能够让人安心拿住/卖出的alpha
但在实际中,散户的选择只有为数不多的以下几种:
第一,把资金交给有耀眼头衔的人类交易员,但这些明星交易员是如此的不可控,就像爆发的超新星一样,耀眼一下就很快没落,跑赢标普500都是寥寥无几,但是,由于交易员个人/团队失误所造成的经济损失却是实实在在由用户来承担。
第二,凭借自己能力交易的人,要么就是凭情绪的追涨杀跌,要么就是企图从海量的金融新闻数据、老套的rsi\macd中获得圣杯。但结果是,数据和新闻的更新是如此的频繁,人脑很难高频率处理这么多甚至会互相矛盾的数据,还能稳定得出胜率高的结论。
第三,就算是用量化工具,找到一些量化因子,但是也是不可解释的黑箱状态,至于好不容易训练出来的量化因子,什么时候失效也是不可控的状态。
总结下来,散户投资者的痛点可以概括为3点: 1、委托黑箱不可控 2、难以处理海量噪音数据 3、情绪主导的追涨杀跌
为什么我要做量化交易系统DATA?
**一个可解释、可约束、可风控的 AI 交易系统,可以跑赢基准收益长期存活吗?
最近nofi.ai 的AI 交易大赛很火,给了我很多启发——如果让AI 来“降噪”信息,摒除“情绪”的影响来做决策又会怎样呢?
但DATA这个系统并不是nofi 的简单复刻,我在nofi的基础上了还做了更多的改良,总结来说,之前AI 交易产品(如 nofi.ai)的问题在于:
- 纯 LLM
- Prompt 风控
- 无中台约束
而 DATA的进化是:
- 计算交给程序qlib+LightGBM
- 推理交给 LLM
- 风控交给中台系统规则
优化后DATA已经可以实行比nofi 更加稳健、可靠的交易行为,在极端行情下,可以对用户的资产进行有力的保护与提升,并且在最近一个月的试运行中,它已经大幅跑赢比特币的收益率。
而DATA这个名字也是来自于《星际迷航-下一代》的生化人助手,在星舰的日常运作和各种任务里,凭借强大的运算能力,处理海量复杂信息,就如同高效的 “降噪” 处理器,为星舰成员提取出最关键的行动指引,我希望这个交易系统也可以帮助用户如此。
后端/中台模块MVP设计
除了用户侧可以看到的前端页面以外,在后台设计上,我设计了三个层级:

一、数据获取层
好厨子也要有好食材,AI的输出质量取决于数据的质量。
数据层是对交易所需数据的获取和计算,包括基础价格数据、合约相关数据、宏观经济数据与新闻。
计算完成特征工程比如:RSI、MACD、Funding Z-Score、波动率等20+指标;同时还要处理时间对齐,避免不同来源的数据时间错位。
原始的数据是格式各异的,通过ETL 层,可以把混乱的数据清洗出来统一的模型可快速阅读的dataframe。
二、大脑推理层
将’逻辑推理’与’数学计算’解耦,防止大模型在处理数值时产生幻觉。
这一部分我采用的推理大模型是deepseek V3 , 因为它在nofi 之前的比赛中表现良好,而且费率相对低廉。
不同的是,在把清洗过的数据给它之前,我还进行了进一步的降噪处理,同样使用的是微软mirosoft的开源量化模型qlib + LightGBM, 它可以针对不同币种特征工程训练得出当前的强势币种。
在新闻信息方面也设计了预处理的机制,因为每天的经济数据非常多,为了让模型聚焦在关键信息上,我在这个模块做了“关键词过滤”,比如:特朗普、cpi、非农数据、美联储、失业率、日本利率、监管等。
因此这个模块会过滤掉绝大多数的跟加密行业无关的新闻,把真正有用但又非结构化的数据传递给大模型,减少大模型的思考负担。
同时还会将单调的数据语义翻译给模型,比如获取到合约多头爆仓量大于空头2倍的时候,不会直接把这个数据传递给模型,因为它可能并不能明确反应出这意味着什么,我的系统会为模型生成提示语句:多头爆仓量大于空头2倍,可能存在超卖反弹。
就这样,通过层层的预处理和降噪,模型能够通过更加精确和聚焦的信息进行推理,得出相对可靠的结论。
三、风险控制层
先为不可胜,以待敌之可胜
交易是概率游戏,即使再完美的交易逻辑都需要严格的风控系统,它是整个交易的最后一道防线,可以保证用户持仓在极端行情下不会承受过大的损失,可以让账户存活下去以待下一次的胜利。
在这层的设计中,我并不会像nofi 一样把风控交给模型,而是通过写死系统的方式严格执行。
在实际中也发现,虽然已经告诉模型风控的规则,但它有时候还是会“上头”违反,而这个时候就需要我们的风控系统进行强制处理。
在这个板块主要设置了”三道防线”:
第一道防线:波动熔断 (Volatility Guard)
当检测到市场波动率 (ATR) 为 "High" 时(超过>8%),强制将所有新开仓位的杠杆降为 1x。
防止在插针行情中被瞬时爆仓。
第二道防线:宏观风控 (Dynamic Exposure Cap)
牛市模式: (BTC > SMA50 且 恐慌指数 > 40):允许 100% 仓位敞口。
熊市/防御模式:强制限制总敞口为 NAV 的 50%。
自动化管理 Beta 风险,在下跌趋势中强制“保住本金”。
第三道防线:集中度风控 (Concentration Limit)
严格限制同时持仓不超过3个标的。防止 AI "分散撒网",确保每一笔交易都是高确信度。
总结下
“DATA”系统采用的是混合式智能架构。不是单纯依赖大语言模型(LLM),而是构建了三层递进的决策流程:
- 数据层:通过ETL和特征工程,将原始、混乱的市场数据转化为高质量的输入。
- 大脑层:利用成熟的量化模型(Qlib + LightGBM)先行计算,为LLM“降噪”,再由LLM(DeepSeek V3)在聚焦后的信息基础上进行推理。
- 风控层:设计了独立于AI的、严格执行的系统规则,通过“三道防线”——波动熔断、宏观敞口管理和持仓集中度限制——为资产安全提供最终保障。
该系统旨在结合程序的计算优势与AI的推理能力,同时用刚性的规则约束AI可能出现的“越界”行为。
经过一个月的初步测试,“DATA” 已展现出跑赢市场基准的潜力。
未来,该系统计划通过引入模型反思、社区订阅和API交易分润等功能,持续迭代并走向成熟,最终为用户提供一个如《星际迷航》中“DATA”般可靠、高效的智能交易伙伴。
最后附上项目开源github地址:https://github.com/yuqiaowu/ai-crypto-agent
欢迎大家一起建设,共同完善。