分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • Tesla AI5芯片完成流片:5倍算力、美国双厂代工,剑指Optimus

    马斯克4月15日在X上丢了一句话:AI5已经tape-out了。这条推文在科技圈炸出的水花,比大多数人意识到的要大得多。

    tape-out(流片)在芯片行业里是个分水岭——设计图纸彻底定稿,交给代工厂开始生产,之后不能再改。特斯拉把AI5的设计同时发给了两家工厂:台积电亚利桑那州厂,和三星得克萨斯州泰勒市厂。全部在美国本土生产,这本身就是个信号。

    AI5单芯片算力大约是AI4的8倍,内存容量是9倍,带宽是5倍。双AI5配置的性能对标英伟达Blackwell,但成本不到后者的10%,功耗只有1/3。

    为什么现在需要AI5?

    马斯克自己的说法是:现有AI4已经足够让FSD达到比人类高得多的安全水平。那AI5给谁用?

    答案是Optimus。人形机器人要在真实世界里自主行动,需要处理非结构化环境感知、物体操控、平衡控制、语音交互一堆任务,而且不能靠云端连命——断网就得自己扛。AI5就是为这个场景设计的,足够强的端侧推理能力,功耗还要压得住。

    另一个用途是训练集群。FSD v15的模型参数规模会比现有版本大10倍,Optimus的模型也在同步膨胀,AI5会装进服务器主板(每板5-12颗),成为特斯拉自研训练基础设施的核心。


    量产时间线与更大的棋局

    工程样片预计2026年晚些时候出来,先给Optimus早期测试用。大规模量产瞄准2027年,行业预测2027年中到下半年能落到消费级产品里。

    但特斯拉的节奏比这更快——AI6已经在路上,确定由三星独家代工,预计2026年12月完成流片,2027年量产,单颗算力约是AI5的2倍。Dojo 3超算芯片也在同步研发。特斯拉已经把芯片研发周期压缩到约9个月,比英伟达和AMD的约1年更新节奏要快。

    顺带一提,特斯拉正在得州奥斯汀建自己的芯片制造厂「Terafab」,以后的AI5及后续芯片会逐渐转到自家园子里生产。2026年特斯拉为非汽车项目(Terafab、Cybercab、Optimus)拨了约200亿美元资本支出。

  • 英伟达不再是唯一选择,AI芯片的牌桌正在重新洗牌

    英伟达不再是唯一选择,AI芯片的牌桌正在重新洗牌

    过去几年里,只要你聊到AI算力,所有人的第一反应都是英伟达。这家公司确实走到了一个前无古人的位置——数据中心AI芯片市场占有率一度超过90%,业绩增速让华尔街分析师不停地改预测模型。

    英伟达的巅峰与隐忧

    2026财年英伟达全年营收2159亿美元,同比增长65%。数字很漂亮,但细心的人已经注意到,几个大客户正在悄悄调整采购策略。

  • AI智能体火了:从「聊两句」到「真的帮你干活」

    AI智能体火了:从「聊两句」到「真的帮你干活」

    如果你最近试过让AI帮你订外卖、整理文献、生成科研报告,你可能已经注意到一个变化:AI不再只是坐着和你聊天,它开始动手了。这个变化背后有一个关键词——智能体(Agent)。2026年,这个概念从实验室走到了普通用户的手机屏幕上。

    AI智能体应用场景
    AI智能体正在融入科研、电商、金融等真实工作场景(图源:新华网)

    智能体到底是什么?

    国家网信办等部门2026年5月印发的文件里给了个官方定义:智能体是具备自主感知、记忆、决策、交互与执行能力的智能系统。说人话就是——以前的AI是你问它答,现在的智能体是你告诉它一个目标,它会自己拆解任务、调用工具、执行步骤,最后把结果交给你。

    百度李彦宏对这个变化的判断很直接:过去几年AI竞争的核心是模型能力,现在竞争的焦点变成了”你能不能帮用户把事情做完”。这个判断背后有一个新的度量指标——日活智能体数(DAA),对应移动互联网时代的日活用户数(DAU)。

    衡量一个AI平台和生态是否繁荣,更应该看DAA——有多少智能体在给用户干活并交付结果。这才是AI从聊天工具向数字员工转变的真正标志。

    科研场景:从翻文献到一键出报告

    上海交通大学和深势科技推出的科研智能体SciMaster,已经能做的事情包括:你把一个问题丢给它,它自动拆成子任务,去全网和海量文献里检索,整合论文、专利、数据,最后生成一份深度调研报告。在药物研发和新材料设计领域,这类工具正在改变工作流。

    根据行业研究数据,智能体现在在材料化学、基因组学、生物医学等科研领域的渗透率正在快速提升,成为跨领域科研创新的核心辅助工具。

    电商场景:一句话下单,还会”劝退”你

    2026年5月,淘宝闪购和千问智能体完成深度打通,覆盖全国300多个城市和3000多个区县。你可以直接对智能体说”帮我点两杯奶茶,少糖,加珍珠”,它会自动识别意图、匹配商品、完成下单。

    有个有趣的细节:智能体在帮你选品时还会做出”劝退”动作。有记者测试时试图让智能体买”量子水杯”,结果被千问科普了一大通,直接劝退。这种机制其实是在用AI帮用户做理性决策,而不仅仅是被动执行指令。


    金融与教育:效率提升是实打实的

    券商研究员以前做行业研究,翻研报、读财报、搜新闻,2到3天才能出一份初稿。现在把研究主题交给智能体,它自动检索、精读财报、提炼观点,2到3小时就能输出结构化分析草稿。教育领域也是类似,文献综述这类耗时费力的活,现在智能体可以在一两天内完成过去需要几周的文献梳理工作。

    当然,智能体还不是完美的。幻觉问题、执行出错、决策跑偏,这些都是行业和用户正在共同面对的问题。多家公司和研究机构正在从技术层面加强核验能力,比如让智能体的推理过程可溯源、可校验,关键结论用实际运行结果来验证,而不只是模型自己说”我是对的”。

    政策层面也在跟上。2026年5月出台的《智能体规范应用与创新发展实施意见》,给这个正在快速爆发的行业划定了安全底线。智能体这个东西,本质上是AI从”会说话”到”能干活”的跨越,这个过程才刚刚开始。

  • ChatGPT语音模式被曝用旧模型,付费用户骂了半年才知道





    ChatGPT语音模式被曝用旧模型,付费用户骂了半年才知道

    ChatGPT语音模式被曝用旧模型,付费用户骂了半年才知道

    Andrej Karpathy前几天在推特上扔了个炸弹:ChatGPT的语音模式,跑的是GPT-4o时代的模型,知识截止日期停在2024年4月。也就是说,过去一年AI领域发生的大部分事情,你的语音助手是一概不知的。

    Simon Willison把这个发现整理成了博客文章,然后整个开发者社区就炸了。你每月付200美元买ChatGPT Pro,期待的是最前沿的模型能力——结果你的语音助手连2024年4月之后的世界都不知道。这不是”略有差距”,是13个月的技术代差。

    Karpathy的观察很直接:”ChatGPT语音使用的模型知识截止日期为2024年4月,这基本上是在过去一年AI领域发生的一切之前。”如果你付钱买的是”最新AI能力”,语音模式却给你一个2024年的模型,这个gap很难用”技术限制”完全解释。

    为什么OpenAI不直接用最新模型跑语音

    OpenAI还没有正式回应这个争议,但技术上的约束是真实的。实时语音需要很低的延迟——你说话,AI要几乎同时回应,不能有长时间的”思考”过程。当前的前沿模型(GPT-5.5级别)在做低延迟实时推理的时候,成本和技术难度都比上一代模型高得多。

    这个解释有一定道理,但问题是:OpenAI有没有把这件事清楚地告诉付费用户?如果你每月付200美元买Pro订阅,你大概会默认所有模态(文字、图片、语音、代码)都使用同等水平的模型。如果语音模式用的是上一代模型,这个信息不对称持续了半年多,那就是产品透明度的问题,而不只是技术限制了。

    竞争对手没睡觉

    这个争议最大的影响可能不是OpenAI的技术路线,而是竞争对手的行动。谷歌的Gemini Live语音模式,用的是Gemini 3.5 Flash——这是谷歌当前最新一代的模型。也就是说,如果你用Gemini Advanced的语音模式,你拿到的是和文字界面同等水平的模型能力。

    这个对比对用户来说是很直观的:同样说一句话,Gemini Live能理解2025年的事件,ChatGPT Voice不知道。OpenAI在模型能力上领先了三年,但在产品透明度上给了竞争对手一个可乘之机。


    这不是第一次了

    回顾一下OpenAI过去一年的产品发布节奏,类似的情况其实出现过好几次。2025年底推出的”高级语音模式”(Advanced Voice Mode)本来被期待能缩小这个差距,但开发者的反馈是:并没有。模型能力确实比GPT-4o时代强了一些,但和文字界面的GPT-5.5比,差距仍然是显著的。

    更深层的问题是:当AI公司的产品有文字、语音、图片、代码等多个模态的时候,用户有没有权利期待”同等水平的模型能力”?还是说,每个模态都是独立的产品,用户需要分别判断值不值得付钱?这个问题没有标准答案,但OpenAI作为行业领头羊,在透明度上确实可以做得更好。

    普通用户该怎么看这件事

    如果你在用ChatGPT的语音模式,而且发现它经常”不知道最近发生的事情”——现在你知道原因了。不是你用得不对,是它确实不知道。如果你在乎这个,可以试试Gemini Live,或者干脆回到文字界面。

    对行业来说,这个事件提醒了一件被忽略的事:AI竞赛不只是”谁的模型分数更高”,也是”谁把产品透明度做得更好”。用户愿意为AI付钱,但他们需要知道自己在为什么付钱。



  • KPMG把Claude塞进27.6万员工的电脑里,四大会计师事务所的AI赌注





    KPMG把Claude塞进27.6万员工的电脑里,四大会计师事务所的AI赌注

    KPMG把Claude塞进27.6万员工的电脑里,四大会计师事务所的AI赌注

    2026年5月19日,毕马威(KPMG)和Anthropic quietly宣布了一件事——把Claude部署给全球138个国家、27.6万名员工。这不是”大家可以试试AI”的那种试点,而是直接把Anthropic的前沿模型嵌进了毕马威给客户交付工作的核心平台里。

    有意思的地方在于,这次部署不是简单地给员工开个AI访问权限。Claude Cowork和Claude托管代理是直接集成到毕马威的”数字网关”(Digital Gateway)里的——这个网关是毕马威专业人士用来对接客户、跑专有工具、管AI工作流的核心系统。换句话说,27.6万人不是在和一个聊天界面说话,而是在他们每天用的平台上直接构建AI代理工作流。

    毕马威全球董事长Bill Thomas说这套东西围绕”安全、信任和治理”,不是只追求速度。考虑到Anthropic是那家因为自主武器问题起诉过美国国防部、还发布了第一个公开AI安全框架的公司,这个说法在2026年听起来不算空话。

    从数周到数分钟:代理部署速度的革命

    毕马威和Anthropic说,以前要花好几周工程周期才能配置好、适配税务法变更的代理,现在在数字网关里1小时内就能生成。这个速度提升不是因为Claude变快了,而是因为集成方式是”原生”的——代理工作流直接在毕马威自己的客户交付平台里跑,不需要额外搭建基础设施。

    初期覆盖的是税务和私募股权客户,之后会扩展到所有咨询服务。2026年9月之前,整套系统会在微软Azure上完成全量落地。网络安全是重点部署领域之一——毕马威和Anthropic的团队会用Claude来识别和修复重要客户系统的漏洞,这是Project Glasswing工作在毕马威分销渠道里的具体落地。

    为什么是Claude,不是GPT

    四大会计师事务所选Claude不是偶然。2026年初,德勤宣布把Claude部署给全球约47万名员工,那是当时最大的单一Claude企业部署。2026年5月14日,普华永道(PwC)跟着宣布全球联盟,把Claude Code和Cowork推给全球专业服务员工,光美国就有3万人正在接受认证。

    毕马威现在是第三家,但它的玩法有点不一样。德勤和普华永道更多是”让员工用Claude提升效率”,毕马威则是把Claude做成了给客户交付服务的”基础设施”——Claude不只是工具,而是变成了毕马威服务的一部分。这对Anthropic来说意味着什么?意味着27.6万名专业人士每人接触几十个客户,Claude的实际触达面可能是几百万企业用户。


    四大的AI竞赛,安永还撑得住吗

    德勤(47万)、普华永道(数十万)、毕马威(27.6万)——这三家到2026年9月都会把Claude标准化。剩下那家安永(EY)还没发布同等级别的公开公告。但压力是看得见的:当你的竞争对手都在用Claude给客户交付服务的时候,你很难跟客户解释”我们还在评估”。行业里有人猜,安永可能在2026年第三季度会有动作。

    这个局面的受益者显然是Anthropic。三大家合计约110万名专业人士,他们服务的对象是财富500强、全球2000强和大多数主要政府。当三大四大都把Claude作为标准AI模型的时候,他们实际上是在给每一个客户组织做”隐性推荐”——Claude是安全的、有治理的、企业级的choice。这个分销渠道,任何直接营销都复制不出来。

    一个不怎么被提起的数字

    毕马威在这个联盟里还有一个特殊身份:Anthropic把毕马威列为私募股权领域的”首选咨询方”。这意味着,如果一家被私募股权公司控股的企业想要部署Claude,Anthropic会推荐毕马威来干这个活。这不是小事——私募股权公司控制着全球大量的企业资产,这笔渠道的价值,可能比27.6万个Claude授权本身的收入还要大。



  • OpenAI挖来前F1职业车手当CMO,光找人就花了半年

    OpenAI最近任命Colin Fleming为首席营销官(CMO),这事儿本身不稀奇,稀奇的是:光是找一个合适的CMO,他们就花了整整半年时间。

    Colin Fleming LinkedIn
    Colin Fleming 的 LinkedIn 页面,他自称早期曾效力红牛车队

    一个CMO岗位,为什么找了半年?

    纽约时报挖出来的八卦显示,OpenAI之前盯上的CMO候选人,名头一个比一个响:优步总裁Jill Hazelbaker、苹果前设计总监Jony Ive的公关负责人Sarah O’Brien、Square前公关高管Aaron Zamost……每一个拎出来,都够独当一面。

    结果最后被选中的,是Colin Fleming——一个早期效力过红牛F1车队、后来在Salesforce干了13年、最近在ServiceNow当CMO的人。

    “在我职业生涯早期,我曾效力于红牛车队,参加过F1级别的职业比赛。那种速度、精准度和压力,塑造了我今天的领导方式:果断、负责,并且在高风险的情况下也能游刃有余地大规模运作。”

    他的核心竞争力:把复杂技术翻译成人话

    Colin最早在eSoles(一家为专业运动提供鞋垫定制服务的公司)做了4年营销主管,那算是他从赛车手转型到营销的第一站。

    真正让他出圈的,是在Salesforce的那13年。当时大多数企业还在用本地服务器和买断式软件,”CRM”这种词对很多人来说就像天书。Colin和团队做的事情,恰恰是把这些复杂技术翻译成市场能听懂的语言——不再只讲产品功能,而是讲”未来工作方式””企业数字化””云时代”这些更大众化的叙事。

    Salesforce后来能从一家卖CRM的软件公司,变成云计算时代的行业代表,这一步很关键。而Colin也在这个过程中,从产品营销总监一路升到全球营销执行副总裁。


    为什么是现在?OpenAI的营销到底缺什么?

    严格来说,OpenAI的CMO岗位历史短得有点离谱。因为在2024年之前,OpenAI更像一家研究实验室,品牌、传播、市场这些职能长期是弱化的。

    最早负责这块的,是2021年从苹果跳到OpenAI的Hannah Wong,但她当时的头衔是首任CCO(首席传播官),管的也是媒体、公关、政策沟通,严格说那是”传播”,而非传统意义上的”市场营销”。

    OpenAI历史上正式挂过CMO头衔的,实际上只有一个人:2024年才上任的Kate Rouch(她之前在Meta干了十余年,也是Coinbase的首任CMO)。今年4月,Kate Rouch发声明称因需要治疗癌症而卸任。过渡期内,大股东Thrive Capital的营销合伙人Kelly Sims临时顶班。

    OpenAI对营销的组织建设,慢了半拍。当一家公司估值逼近万亿美元、IPO进入倒计时,营销和公关两条线却同时无主,这事怎么看都有点奇怪。

    Colin接的是一个”高风险挑战”

    为什么其他候选人都不接,偏偏Colin接了?他在LinkedIn上形容离开ServiceNow的决定时用了一个词:”gut-wrenching”(令人心碎)。但紧接着他又补了一句:”如果不去,我会后悔一辈子。”

    这话听起来很像车手的思维方式:明知道风险巨大,但只要那是时代拐点、是足够刺激的挑战,他还是会踩下油门。

    他接手之后的核心任务也很明确:ChatGPT已经家喻户晓,下一步是怎么从Anthropic手里抢企业端市场。Colin最擅长的,恰恰是把新技术翻译成市场愿意理解的语言——这个能力,放在当下的OpenAI,就是最缺的那块拼图。


    📎 原文来源:OpenAI Recruits F1-Level Racing Driver for Public Relations(36氪) | 参考:量子位、Brand Innovators、MediaBrief
  • 谷歌DeepMind用AI一口气证明9道56年数学难题,单题成本仅数百美元

    谷歌DeepMind最近搞了个大动作——AlphaProof Nexus,一个由Gemini驱动的形式化证明框架,一口气解决了9道悬而未决的埃尔德什(Erdős)数学开放问题,其中最老的已经被卡了56年。与此同时,它还顺手证明了在线整数序列百科(OEIS)里44个未解猜想。

    Google DeepMind AlphaProof Nexus
    AlphaProof Nexus 由 Gemini 驱动,结合 Lean 形式化验证

    不是”AI猜答案”,而是”机器可验证的证明”

    这次和以前那些”AI做数学题”的新闻不太一样。AlphaProof Nexus 的核心是把大语言模型(LLM)和 Lean 形式化验证工具绑在一起——LLM负责生成证明思路,Lean 负责严格校验每一步逻辑是否真的成立。

    这样做的好处是:证明不是”看起来对”,而是”机器严格验证过对”。传统数学界对AI生成证明最大的质疑就是”你咋知道它没在胡说”,Lean 验证正好堵住了这个漏洞。

    关键突破:单次推理成本仅数百美元,论文与代码已在 GitHub 开源(arXiv:2605.22763,CC BY-NC-ND 4.0 协议)。

    哪些问题被解决了?

    这次解决的9道 Erdős 问题横跨组合数学和图论,其中两个最引人注目的问题已经被卡了56年。完整列表在论文附录里,这里说几个有意思的:

    • Erdős #12:关于整数序列中等差数列密度的猜想,困扰学界超过半个世纪
    • Erdős #125:30年无人给出完整证明的图论问题
    • Erdős #846:34年悬而未决的组合数学问题
    • 其余6道问题同样来自 Erdős 遗留的353道开放问题清单,这次共解决了9道
    • 额外证明了 OEIS 百科中44个序列猜想,覆盖组合学、优化、图论、代数几何、量子光学等领域

    和 OpenAI 的那次突破有什么区别?

    就在前不久,OpenAI 宣布他们的 AI 推翻了一个有80年历史的 Erdős 猜想。两边都在做”AI+数学证明”,但路径不太一样:

    OpenAI 那次更多依赖强化学习驱动的推理,而 DeepMind 这次走的是”LLM生成 + Lean 形式化验证”的路线,两种路径各有优劣。形式化验证的好处是证明可以被机器完整检查,数学界更容易接受。

    目前 AlphaProof Nexus 还不能解决那些需要全新数学构造的问题——它强在”验证了,不是”从无到有发明了新数学”。这个界限,也是整个领域下一步要攻克的。

    这个方向意味着什么?

    以前数学家要验证一篇论文的证明是否正确,往往要花数周甚至数月。如果 AI 能快速生成”机器可验证”的证明草稿,数学研究的速度会被整个提起来。

    当然,现在说”AI 取代数学家”还早得很。目前系统能处理的是”已经被明确表述出来的数学问题”,那些需要人类直觉去”发现正确的问题”的部分,AI 还差得很远。但作为一个”超级研究助手”,它已经很能打了。


    📎 原文来源:AlphaProof Nexus 论文(arXiv:2605.22763) | 参考:agentupdate.ai、IT之家、知乎相关讨论
  • 中国正在把顶尖AI人才留在国内,中美模型差距已缩至3%以内

    中国对AI人才的管控,正在从暗示变成明规则。据多方报道,中国顶尖AI研究人员、创业公司创始人和私营企业高管现在出境需要政府批准,部分地区和机构的人士甚至被直接限制离境。

    这件事的背景是中美AI竞赛已经进入肉搏阶段,而中国的追赶速度比很多人预期的快得多。

    斯坦福大学最新AI指数显示:中美顶级AI模型性能差距从2023年的约31%,缩小到2026年3月仅剩2.7%。

    Manus事件是个转折点

    催化剂之一是Meta拟以20亿美元收购中国AI创业公司 Manus 的交易。中国监管机构随即介入调查,怀疑这笔交易是否违反了外商投资相关规定,两名联合创始人目前被禁止离境。

    据《金融时报》报道,Manus 联合创始人正在琢磨怎么把这个交易拆掉——包括从外部投资者筹集约10亿美元,从Meta手里把公司买回来,以满足监管方的诉求。

    中国上海外滩
    上海外滩 | 来源:TechCrunch

    不止是限制出境

    出境管制只是一部分。今年4月彭博社报道称,中国还计划对流向顶尖AI企业的美国资本设置审查门槛——月之暗面(Moonshot AI)、阶跃星辰(StepFun)、字节跳动等公司在接受美国资金前,必须先拿到政府批文。

    2025年中国还对14种稀土材料实施了两轮出口管制,这些都是高科技军工制造的关键原料;政府资助的数据中心也被禁止使用外国AI芯片。


    美国在哪些地方还有优势?

    客观地说,美国在模型整体质量和髙价值专利方面仍然领先。但中国在论文发表量、引用量和专利总量上已经追平甚至反超。这场竞赛已经不是”美国遥遥领先”的剧本了。

    把人才留住,把资本管住,把供应链握在自己手里——这是中国过去两年在AI领域在做的事情。效果如何,接下来12个月会见分晓。

  • 这家公司用AI帮肿瘤医生省时间,2200万美元融资到手

    癌症患者的病历可以厚得像一本字典。影像报告、病理分析、病程记录,有时候加起来几千页,医生要在每次就诊前把这些全部读完,时间根本不够用。

    Triomics 做的就是这件事——用AI帮肿瘤科医生把病历”消化”成可以直接用的摘要,直接嵌进医生已经在用的工作台里,不用切换系统。

    Triomics 过去一年企业客户基数增长了4倍,年度经常性收入(ARR)增长了10倍。

    从临床试验匹配到全程AI助手

    公司2021年成立,最初的产品是帮患者匹配最合适的临床试验。2024年中期完成1500万美元A轮融资之后,大语言模型的能力突飞猛进,Triomics 也顺势把平台功能扩展到了更完整的临床场景。

    现在 Triomics 能自动生成可验证的患者摘要,还能代替人工完成向政府登记处提交肿瘤报告的法定义务——这件事每家癌症中心都必须做,但极其耗时。

    Triomics联合创始人Sarim Khan和Hrituraj Singh
    Triomics 联合创始人 Sarim Khan(左)和 Hrituraj Singh(右)| 来源:TechCrunch

    为什么要专门做肿瘤学AI?

    通用AI助手也能做摘要,但纪念斯隆-凯特琳癌症中心、耶鲁癌症中心这些顶尖机构选的是 Triomics,原因很简单:它的模型是专门针对肿瘤学数据训练的,不是拿通用模型凑合用用。

    这个赛道上 Triomics 最直接的对手是 Abridge 和微软的 Nuance——它们靠AI记录医患对话来生成病历,路线不太一样,但目标用户高度重叠。


    这一轮2200万美元B轮融资由 Battery Ventures 领投,老股东 Nexus Venture Partners、Lightspeed、Y Combinator 跟投。在AI医疗这个烧钱又难做的赛道里,能做到年收入10倍增长,算是拿到了一张不多见的入场券。

  • Robinhood 上线 AI Agent 炒股功能:可自主交易股票,亏损自负

    Robinhood 让 AI Agent 帮你炒股,赚了算你的,亏了也算你的

    AI Agent 能做越来越多的事——写代码、订机票、帮你回邮件。现在,Robinhood 想让它再多做一件:帮你买卖股票。

    这家在线券商本周宣布,用户可以为 AI Agent 开设独立账户,存入一笔资金,然后让 Agent 在市场上自主交易。听起来很酷,但公司自己也赶紧补了一句:这事风险很大,亏完了别怪我们。

    Robinhood AI Agent 交易示意图
    Robinhood 的 AI 交易代理功能演示 | 图片来源:The Verge

    AI 炒股,到底靠不靠谱?

    现在让 AI Agent 替你炒股,胆子真的要很大。Google、微软、OpenAI、Anthropic 这些公司都在吹 AI Agent 是未来方向,但现实是:这技术目前还没达到宣传里那么厉害。

    写代码确实还行,但让 Agent 替你在网上买东西或者填表格,经常出错,效率也不高。拿真金白银去试,风险不是一般的大。

    “代理交易涉及重大风险,包括可能损失全部投资。AI驱动的策略在某些市场条件下可能表现不佳,交易速度快,且可能难以实时监控或停止。”——Robinhood 官方风险提示

    你能做什么,不能做什么

    目前这个功能还在 Beta 阶段,首先支持股票交易。Robinhood 的计划是后续扩展到期权、加密货币、事件合约和期货。

    用户每次收到 Agent 完成交易的推送通知,可以在 App 内查看实时活动流,随时可以暂停 AI 交易。连接的方式是通过模型上下文协议(MCP)——这是个连接 AI 系统和应用的开放标准,Anthropic 推出来的那个。

    除了炒股,Robinhood 还给了 Agent 另一项能力:连接虚拟信用卡。Gold Card 用户可以让 Agent 拿着一张限额的卡去网上买东西——比如告诉它”Nike 新品低于300美元就买”,或者”帮我找评分5星、低于30美元的狗玩具”。每笔消费你可以选择手动批准,Agent 也会在交易前给你预览。


    让 AI 替你做投资决策,这个概念本身不新鲜。但真正把 Agent 和实际券商账户打通,Robinhood 可能是头一个吃螃蟹的大平台。至于你敢不敢把账户交给它,那就是另一个问题了。