标签: 人工智能

  • 中国AI编码模型打破”落后6-9个月”框架:开源权重+低成本改写全球格局

    说实话,当我看到2026年4月这波中国AI编码模型的密集发布时,第一反应是:那个”中国AI落后6-9个月”的老框架,真的该扔进历史垃圾桶了。

    12天,4家实验室,一场静悄悄的能力赶超

    从4月底到5月初,短短12天里,4家中国AI实验室接连发布了各自的最新编码模型,而且全部是开源权重。这可不是小打小闹的demo,而是实打实能打的工程级模型:

    • Z.ai的GLM-5.1
    • MiniMax的M2.7
    • Moonshot的Kimi K2.6
    • DeepSeek的V4

    最关键的是,它们在SWE-Bench Pro这个权威编码基准上的得分全部落在56-59分区间——什么概念?这个得分已经和西方前沿模型持平了。

    价格才是真正的杀手锏

    如果能力持平还不够震撼,那成本数据绝对让你倒吸一口凉气:这4款模型的推理成本,最高不超过Claude Opus 4.7的三分之一

    我觉得这里有个被很多人忽略的逻辑:AI能力如果可以低价获取,那么”前沿模型的护城河”到底在哪里?如果Kimi K2.6或者DeepSeek V4能以1/3的价格做到Opus 4.7差不多的事情,那企业采购决策会不会悄然生变?

    这不是简单的性价比问题,而是整个AI供应链的话语权在转移。

    “落后6-9个月”为什么不成立?

    State of AI报告里有一句话我很认同:”中国落后6-9个月”的旧框架在智能体编码领域已不成立

    NIST的CAISI评估显示,DeepSeek V4的跨域基准综合表现落后美国前沿约8个月,但DeepSeek自己的模型卡显示V4-Pro与Opus 4.6、GPT-5.4持平。两个结论都是对的——只不过评估的维度和基准不同而已。

    这其实揭示了一个更深的真相:AI能力的比较,已经不再是单一时间轴上的先后问题,而是评估者、支架工程、基准设计的综合博弈。当多个最优模型来自中国且为开源权重时,”追赶者”这个标签就已经失效了。

    开源权重:中国AI的”农村包围城市”?

    还有一个细节值得琢磨:这4款模型全部开源权重。我觉得这不是巧合,而是一种极其聪明的战略选择。

    开源意味着什么?意味着全球开发者可以本地部署、可以微调、可以嵌入自己的产品而不用看任何人的脸色。当西方实验室还在纠结”该不该开源”的时候,中国实验室已经用开源完成了全球开发者生态的布局。

    Kimi K2.6发布时展示了一个12小时连续工具使用轨迹,演示了将推理引擎移植到Zig的完整过程——这种”晒能力”的方式本身就很有说服力,比发一篇论文直观多了。

    这件事的真正影响可能还没显现

    我觉得现在讨论”中国AI是否赶超”还为时尚早,但有一个趋势已经很清晰了:在整个AI领域最具经济影响力的能力(编码和智能体工程)上,多个最优模型来自中国且为开源权重,这件事的长期影响可能被严重低估了。

    企业采购、开发者工具链、云服务定价、甚至AI安全的研究议程——所有这些都将因为这个变化而重新调整。我不是在说”中国AI已经全面领先”,而是说”全面落后”这个叙事已经失去了事实基础。


    参考资料:State of AI: May 2026, Air Street Press

  • TradingAgents:用多智能体协作做金融交易决策,GitHub 7.3万星

    TradingAgents:用多智能体协作做金融交易决策,GitHub 7.3万星

    TradingAgents架构图

    📋 项目简介

    TradingAgents 是一个多智能体LLM金融交易框架,模拟真实交易公司的运作方式——部署基本面分析师、情绪分析师、技术分析师、交易员和风控团队等多个专业AI智能体,通过协作讨论来评估市场状况并做出交易决策。

    项目目前在GitHub上已获得 73,887 ⭐,本周新增 7,259 颗星,热度持续攀升中!🔥

    🛠️ 安装要求和过程

    环境要求

    • Python 3.10+
    • 至少一个LLM API密钥(OpenAI / Google / Anthropic / DeepSeek / Ollama等均可)
    • Alpha Vantage API密钥(用于获取市场数据,免费注册即可)

    快速安装

    # 克隆仓库
    git clone https://github.com/TauricResearch/TradingAgents.git
    cd TradingAgents
    
    # 创建虚拟环境
    conda create -n tradingagents python=3.13
    conda activate tradingagents
    
    # 安装依赖
    pip install .
    
    # 设置API密钥
    export OPENAI_API_KEY=your_key_here
    export ALPHA_VANTAGE_API_KEY=your_key_here
    
    # 启动交互式CLI
    tradingagents

    🐳 Docker用户:

    cp .env.example .env  # 填入你的API密钥
    docker compose run --rm tradingagents

    如果想用本地模型(Ollama),还可以:

    docker compose --profile ollama run --rm tradingagents-ollama

    ⚡ 核心功能

    1. 🧠 多智能体协作架构:模拟真实交易公司的团队分工,包括基本面分析师、情绪分析师、新闻分析师、技术分析师、看涨/看跌研究员、交易员、风控团队和投资组合经理,共8大角色协同工作。
    2. 🤖 多LLM支持:兼容OpenAI、Google Gemini、Anthropic Claude、xAI Grok、DeepSeek、Qwen、GLM、MiniMax、OpenRouter,还支持Ollama本地部署和Azure OpenAI等企业级方案。
    3. 💾 持久化决策日志:记录历史决策和收益表现,让智能体从过去的经验中学习,越用越聪明。
    4. 🔄 断点续跑:运行中断后可从上次成功步骤恢复,不怕意外崩溃丢失进度。
    5. 📊 交互式CLI:通过命令行界面选择股票代码、日期、LLM模型和研究深度,操作简单直观。

    🎯 典型使用场景

    1. 📈 个人投资研究助手:我平时关注几只科技股,用TradingAgents可以让多个AI分析师从不同角度评估一只股票——基本面、技术面、市场情绪一次性看全,比我自己翻研报效率高太多了。比如分析NVDA,它会自动调用基本面数据、近期新闻、Reddit讨论,然后给出综合判断。
    2. 🏫 金融AI研究实验:项目附带了学术论文(arXiv:2412.20138),如果你在做LLM+金融方向的研究,可以直接基于这个框架做对比实验、消融实验,代码结构清晰,改起来很方便。
    3. 🎓 量化交易学习与实践:想入门量化交易但又不想从零搭建系统的同学,TradingAgents提供了一个完整的端到端框架。从数据获取、多维度分析到交易决策和风控,全流程覆盖,而且支持DeepSeek、Ollama等本地模型,零成本就能跑起来。

    💡 推荐理由

    说实话,我试用过不少AI交易工具,但大部分要么太简单(单模型单任务),要么太黑盒(不知道AI为什么这样决策)。TradingAgents不一样——它的多智能体辩论机制让我印象深刻。看涨研究员和看跌研究员会针对同一只股票展开辩论,最终由交易员综合双方观点做出决策。这种机制比单一模型直接输出”买”或”卖”要透明得多,你清楚地知道决策背后的逻辑。

    另外,对国内用户很友好:支持DeepSeek、Qwen、GLM等国产模型,还区分了国内版和国际版的API密钥,Ollama本地部署也很丝滑。即使没有海外API,照样能用。

    ⚠️ 友情提醒:项目明确标注仅供研究用途,不构成投资建议。股市有风险,AI也有幻觉,千万别直接拿它的输出当交易信号。

    🔗 下载地址

  • Anthropic Q1收入暴涨80倍!AI赛道正式进入”商业化决赛”

    Anthropic用一份惊人的财报证明了:AI公司不只可以讲故事,还可以真正赚钱。


    从”小而美”到”超级独角兽”

    说实话,我之前对Anthropic的印象一直是”技术很强、商业化很佛系”。毕竟背靠Google和Amazon两位金主爸爸,似乎没必要那么着急变现。

    但最新数据直接打了我的脸——Anthropic Q1收入同比增长80倍,ARR(年度经常性收入)已经突破440亿美元。

    这是什么概念?440亿美元已经相当于一个中大型科技公司的体量了。而且是在AI赛道普遍还在”烧钱换增长”的背景下实现的。

    💡 小科普:ARR是Annual Recurring Revenue的缩写,即年度经常性收入,是SaaS公司最核心的指标之一。


    算力即护城河:与SpaceX的超级合作

    更让我惊讶的是他们的基础设施布局。

    Anthropic刚刚与SpaceX签署了Colossus 1超级计算机的合作协议——220,000+块NVIDIA GPU、300MW算力

    300MW是什么概念?一个小型城市的用电量。

    这波操作的逻辑很清晰:算力就是AI时代的护城河。谁掌握了更多算力,谁就能训练出更强的模型,谁就能吸引更多付费客户。


    Agentic AI:从玩具到印钞机

    Q1增长80倍的背后,我认为最关键的原因是Agentic AI(AI智能体)的商业化落地

    他们内部有个叫”Project Deal”的项目——69个AI Agent在分类市场上完成了186笔交易。这不是PPT上的Demo,是真金白银的收入。

    这说明什么?企业用户终于愿意为”能干活”的AI买单了。不是聊天机器人那种玩具,而是能自动化完成业务流程的智能体。

    🤖 划重点:Agentic AI(AI智能体)是能够自主完成复杂任务的AI系统,如自动处理订单、数据分析、客户服务等。


    我的思考

    说实话,Anthropic的爆发让我重新审视了AI赛道的竞争格局。

    之前大家都在说OpenAI是绝对的老大,但看看数据:Anthropic ARR 440亿+增长80倍,DeepSeek正在谈450亿估值融资,国内的GLM、MiniMax、Kimi也在疯狂追赶。

    AI已经进入”商业化决赛”阶段了。 光有技术不行,还得能变现。这波浪潮里,能活下来的要么是技术绝对领先,要么是商业化能力超强。

  • AI专家和普通人之间的鸿沟,正在越拉越大

    AI专家和普通人之间的鸿沟,正在越拉越大

    AI发展

    前几天看到斯坦福大学发布的年度AI报告,有个数据让我印象挺深:美国只有10%的普通人对AI感到兴奋,而高达56%的AI专家相信AI会让美国变得更好。这差距,不是一般的大。

    更让我意外的是,这股反AI情绪的主力军,居然是年轻人。调查报告显示,Z世代虽然天天在用AI,但反而越来越悲观、越来越焦虑。这个结论,说实话有点颠覆我的认知——按理说,年轻人应该是最先拥抱新技术的群体才对。

    仔细想想,其实也不难理解。我们每天刷到的新闻,不是某某公司用AI裁员,就是电价要涨、因为数据中心太耗电了。对普通人来说,AI再高大上,也比不上月底的工资条来得实在。反观那些AI大佬们,张口闭口都是AGI(通用人工智能)、超级智能,听着就像在聊科幻片。

    这种”鸡同鸭讲”的局面,最近闹出了不少动静。前阵子OpenAI CEO山姆·奥特曼的家被人袭击,社交媒体上的反应两极分化——圈内人震惊于这种暴力行为,但民间评论区的画风却是另一回事,甚至有人把它跟之前一些极端事件相提并论。这种情绪的蔓延,值得警惕。

    报告里还有几个数据挺有意思:84%的AI专家认为AI会改善医疗,但只有44%的普通人这么想。73%的专家看好AI对工作的影响,而公众这边只有23%。69%的专家认为AI对经济有益,普通人这边只有21%。

    最让我意外的是关于就业的预测——64%的美国人觉得AI会导致失业,但AI专家们反而没那么悲观。这就有意思了,到底是专家们太乐观,还是普通人太悲观?

    还有个数据值得关注:美国人对政府监管AI的信任度只有31%,在全球主要国家里排名最低。新加坡最高,达到81%。但与此同时,41%的美国人觉得现有的监管力度还不够,只有27%担心管得太严。

    说到这里,我想聊聊我自己的观察。我身边做技术的朋友,大多数对AI是积极拥抱的态度,觉得这是工具革命,是提效神器。但做传统行业的朋友,普遍更谨慎,有的甚至有点抵触。这种分歧,不只是认知问题,更多是利益站位不同——受益于AI的人和可能受损的人,想法自然不一样。

    那么问题来了:这种鸿沟会越来越大吗?我个人的判断是,短期内可能还会加剧。毕竟AI技术迭代太快,普通人很难跟上节奏。但长期来看,当AI真正渗透到各行各业,大家发现”原来这玩意儿也没那么可怕”的时候,态度可能会慢慢转变。

    关键是,在这个过渡期里,怎么让AI发展的红利更均匀地分配,让更多人受益,而不是只肥了少数人。这才是真正需要解决的问题。

    至于我们普通人,与其焦虑,不如早点学会用AI。毕竟,会用工具的人,永远比被工具替代的人多一条路。