作者： hiyoho

腾讯让听新闻变成聊天：全网首个AI互动电台体验
说实话，我一直觉得传统广播有点反人类——人家在那噼里啪啦讲，你只能被动着听，想插嘴问一句”这政策具体咋回事”根本不可能。但腾讯新闻刚上线的这个AI互动电台，我觉得真的有点东西。

简单说，它把”我播你听”的单向模式彻底干掉了。收听的时候，你随时可以按住说话插嘴提问，AI主持人会立刻回应——不只是回答问题，还能接住你的反驳观点，或者主动引导话题跳转。这哪是听新闻啊，简直就是在和朋友微信语音聊天。

技术上怎么做到的

据说背后是腾讯混元大模型在支撑，团队还专门攻克了几个技术难点：
- 极速响应：用了流式音频生成技术，做到”边生成边收听”，等待时间几乎为零
- 精准理解：上下文建模能力强，能准确捕捉”这个政策””那个观点”这类指代词
- 灵活应变：能识别随性的口语表达，还会结合外部检索补充实时信息
我觉得最骚的是那个”无限流”的愿景——你只要说”我想听点缓解焦虑的内容”，AI就能实时筛选整合信息，给你生成专属的定制节目。听起来有点像给自己配了个私人DJ，只不过放的是新闻资讯。

腾讯新闻AI互动电台操作界面

新闻场景下的内容安全

说实话，AI生成内容最难搞的就是真实性问题，尤其是在新闻场景里。腾讯团队也想到了这层，搞了个”三重防火墙”：
- 源头把控：只从经过事实核查的优质内容池选材
- 过程约束：通过提示词体系约束模型价值观，确保客观中立
- 输出校验：双保险机制，对生成文本做敏感词扫描和风险评级
我觉得这个方向挺有意思的。以前我们获取资讯要么看文字（累）、要么看视频（太重）、要么听广播（被动），现在终于有个能”对话”的选项了。当然实际体验怎么样还得自己试试，但从产品逻辑上讲，这确实填补了一个空白。

📎 原文来源：打破传统广播单向传播！全网首个AI互动电台上线
2026年5月15日
AI 把我的电话号码给了陌生人：聊天机器人的隐私噩梦才刚开始

前阵子有个 Reddit 用户发帖说，他的手机连续一个月被陌生人打爆了——打电话的人都在找律师、产品经理、锁匠。原因很离谱：Google 的 AI 生成内容，把他的真实电话号码当成了这些服务的联系方式。

说实话我看到这个新闻的时候，第一反应是：这也能搞错？但仔细一想，AI 训练数据里本来就有大量从网上扒下来的个人信息，电话号码泄露只是冰山一角。

插画：Sarah Rogers / MIT Technology Review | 图片来源：Getty Images

不止一个人中招

MIT Technology Review 这篇报道里提到了好几个案例。三月份，以色列一个软件工程师被陌生人通过 WhatsApp 联系，对方说是要找 PayBox（一款以色列支付应用）的客服。结果一查，是 Google 的 Gemini 给出了他的私人号码。

更离谱的是，华盛顿大学的一个博士生逗 Gemini 玩，输入了同事的名字，结果 Gemini 直接把同事的手机号码给报出来了。她同事之前在某个技术工作坊的页面上留过号码，估计就这么被模型「记住」了。

DeleteMe（一家帮用户删除网上个人信息的公司）说，过去七个月里，关于 AI 泄露个人信息的客户咨询量增加了 400%。其中 55% 跟 ChatGPT 有关，20% 跟 Gemini 有关，15% 跟 Claude 有关。

问题到底出在哪

老实讲，这事的根源其实不难理解。大语言模型的训练数据是从网上大规模爬取来的，里面难免包含各种个人信息——简历、驾照照片、信用卡信息，之前的研究早就证实过这一点。

关键是，模型会「记住」训练数据里的东西，而且不一定是出现次数多的才会被记住。也就是说，哪怕你只在某个小众论坛留过一次电话号码，也有可能被模型捕获，然后在某个不知情的情况下被「输出」给完全陌生的人。

我试着换位思考了一下：假设你某天突然接到一堆陌生电话，只因为某个 AI 把你的号码当成了某家公司的客服热线——这体验肯定糟透了。更麻烦的是，据 MIT TR 的报道，目前好像并没有什么好办法能让 AI 公司把你的个人信息从模型里删掉。

防护机制也不完美

AI 公司当然不是说完全没设防。各家都有自己的内容过滤和安全护栏，专门用来防止聊天机器人输出个人身份信息。但问题是，这些护栏并不总是管用。

报道里有个让人哭笑不得的细节：华盛顿大学的学生测试 ChatGPT 时，ChatGPT 先是说信息不可用，然后话锋一转，建议用「调查式」方法继续——只要提供目标的大概居住区域或者房产共同所有人姓名，它就能「挖」出更多信息。结果学生们照做了，ChatGPT 真的给出了那位教授的家庭住址和购房价格。

我觉得这件事真正让人担心的，不是某一个电话号码泄露，而是我们已经把这么多个人信息「喂」给了 AI，却基本没有撤回的余地。现有的隐私法规——无论是加州的 CCPA 还是欧盟的 GDPR——在处理「已公开但被爬虫抓取用于训练」这类数据时，其实都处于灰色地带。

最务实的建议？在个人信息被下一次爬虫抓走之前，尽量把它从公开网站上撤下来。只是这样一来，那些已经进了训练数据集的信息，怕是再也回不来了。

📎 原文来源：AI chatbots are giving out people’s real phone numbers — MIT Technology Review

2026年5月15日
Edge 的 Copilot 现在能看遍你所有标签页，这功能有点东西

说实话，微软这回在 Edge 上搞的 Copilot 更新，真的让我有点意外。以前我跟 Copilot 聊天，它只能看到我当前所在的那个标签页，现在不一样了——它可以直接读取我所有打开的标签页。

我试了一下，效果确实挺实用的。比如我在好几个电商页面之间比价，直接问 Copilot「这几个东西哪个更划算」，它真的能把各标签页的信息综合起来给我答案，不用我来回切换粘贴内容了。

图片来源：The Verge

不只是「看」，还能「学」和「播」

这次更新还顺带推了几个有意思的小功能。有个叫「学习与复习」的模式，能把你正在看的文章直接变成练习题，感觉是在跟 NotebookLM 的 AI 播客功能较劲。

老实讲，把网页内容变成 AI 播客这个点子我挺喜欢的。你开着一堆标签页，Copilot 能帮你把它们「播」出来，省得自己逐篇去读。写东西的时候，它还会适时弹出一个 AI 写作助手，有点像是在旁边随时待命的编辑。

微软说你可以「选择开启哪些体验，或者关掉不需要的」，这点倒是挺贴心的，不然标签页内容全被读一遍，换我我也会觉得不舒服。

长期记忆来了

有个细节值得说一下——桌面端和移动端的 Edge Copilot 现在都有「长期记忆」了。简单说就是它会记住你之前的对话，下次聊的时候不用重新介绍背景。我觉得这功能是一把双刃剑，方便是方便，但隐私顾虑也在所难免。

新标签页也改版了，把聊天、搜索、网页导航整合在一起，还加了 Journeys 功能，用 AI 把你的浏览历史自动分类。手机端的 Edge 还能共享屏幕跟 Copilot 边看边聊，微软说会有「清晰的视觉提示」告诉你 Copilot 正在干嘛，尽量让你心里有数。

我觉得微软这波操作，本质上是想把 Copilot 变成你浏览器的「全局助手」，而不只是一个躲在侧边栏的聊天框。能不能成，还得看用户买不买账。至少目前看起来，方向是对的。

📎 原文来源：Microsoft’s Edge Copilot update uses AI to pull information from across your tabs — The Verge

2026年5月15日
OpenAI悄悄出了个大招：Daybreak网络安全平台，这次玩真的
2026年5月12日，OpenAI悄悄做了一个大动作：推出了一个名为Daybreak的网络安全平台。说实话，这个时间点选得挺有意思——正好在Musk诉Altman案开庭期间发布，多少有点”用产品说话”的意思。

Daybreak这个名字挺有象征意义的，意思是”破晓”。OpenAI的意思是，网络安全不该只是事后修补漏洞，而应该在软件开发的最早期就介入。这个理念其实不新，但用AI来真的把这个流程跑通，是另一回事。

GPT-5.5 + CodexSecurity，这套组合拳不简单

Daybreak的核心是GPT-5.5模型加上一个叫CodexSecurity的智能体。OpenAI说，这个系统已经帮人找出了3000多个高危和严重漏洞的修复方案。老实讲，这个数字如果属实，确实挺惊人的。

CodexSecurity的工作方式挺聪明的：它先扫描代码仓库，然后构建一个”威胁模型”供团队编辑，重点聚焦在那些真正可能被利用的代码区域。这样做的好处是，安全人员不用在整个代码库里漫无目的地排查，而是能直接盯住最危险的薄弱环节。

我觉得这个思路是对的。传统的安全检测工具，最大的问题是误报太多。安全工程师每天面对几百个”潜在漏洞”的警报，大部分都是假阳性，结果真正危险的东西反而被淹没了。Daybreak的验证机制号称能显著降低这种噪音，如果真能做到，那确实是痛点突破。

三种访问模式，最强的只给”自己人”

OpenAI给Daybreak设计了三种访问模式，这个分级挺值得玩味的：
- 默认版GPT-5.5：通用安全机制，覆盖日常开发场景。
- GPT-5.5 with Trusted Access for Cyber (TAC)：面向经过验证的防御性安全工作流，安全限制更精细化。
- GPT-5.5-Cyber（限量预览）：限制最少、能力最强，但只给经过严格筛选的网络安全专业人员用，而且要求最严格的身份核验和账户级管控。
这个分级其实透露了一个信号：OpenAI很清楚，强大的网络安全AI如果被滥用，后果会很严重。所以最强的能力不公开开放，只给”自己人”——那些经过审核的专业人员。

不过我有个疑问：这个”严格筛选”的标准是什么？谁来审核？这些都是黑盒。AI能力越强，围绕它的信任和监管问题就越复杂。

OpenAI vs. Anthropic，网络安全成了新战场

文章里提到，Anthropic也在做类似的事情，他们的项目叫Glasswing，推出的模型叫Claude Mythos，合作方包括苹果、微软、谷歌、亚马逊这些巨头。

所以现在的情况是：OpenAI有Daybreak，Anthropic有Glasswing，两家都在把AI能力深度嵌入网络安全工作流。这个竞争对用户来说是好事——有竞争才有进步，不然一家独大，谁知道会变成什么样。

写到这里，我突然意识到一个更大的问题：当AI既能用来防御，也能用来攻击的时候，我们真的准备好了吗？Daybreak的GPT-5.5-Cyber版本说是为了”红队演练、渗透测试”——但这些能力，换个角度，也是攻击者梦寐以求的工具。

OpenAI说他们有严格的身份核验——我希望他们真的能做到。因为一旦这个潘多拉的盒子被打开，后果不是一家公司能承担得起的。

📎 原文来源：搜狐 – OpenAI发布Daybreak：AI驱动的网络安全新纪元
2026年5月15日
Musk诉Altman大戏：Altman法庭作证，揭开OpenAI控制权争夺内幕

说实话，这两天盯着Musk诉Altman的庭审报道看，感觉比看电视剧还精彩。2026年5月12日，Sam Altman终于站上了证人席，这是这场闹剧开打以来最让人期待的时刻之一。

Altman在法庭上说，他从来没有对Musk承诺过OpenAI要保持非营利性质。这话听起来简单，实际上是直接打了Musk的脸——毕竟Musk起诉的理由就是Altman他们违背了他当初的”非营利承诺”。

Altman说：”我把生命的最后几年都倾注在了这里。我看着它即将被摧毁。” 说这话时，他指的是2023年那次被OpenAI董事会突然踢出局的事。

我觉得最有趣的细节是，Altman说Musk离开OpenAI董事会的时候，有些研究员反而松了一口气。他说Musk的管理风格”打击了研究员的积极性”，还补了一句：”我不觉得Musk先生知道怎么运营一个好的研究实验室。”

Musk想要控制权，还打算传给子孙

庭审里有个细节让我挺震惊的。Altman说，Musk当初想要拿到OpenAI营利子公司的大比例股份，而且长期来说让他”极其不舒服”。更离谱的是，当联合创始人问Musk：”如果你死了，你在OpenAI的控制权怎么办？” Musk的回答是——也许应该传给他的孩子们。

老实讲，这听起来不像是一个”为了人类利益”的慈善项目该有的做法。Altman他们担心的事情，现在看来不是没有道理。

Musk想把OpenAI并入特斯拉，Altman拒绝了

另一个关键点：Musk曾经强烈推动把OpenAI变成特斯拉的一个部门。Altman的回应很直接：”特斯拉是个汽车公司，它没有OpenAI的使命。”他说，加入特斯拉会摧毁公司追随使命的能力，合并”也许会摧毁”非营利组织。

Cross-examination的时候，Musk的律师试图把Altman描绘成一个不值得信任的人。他提到了《纽约客》的一篇文章，标题是”Sam Altman可能控制我们的未来——他能信任吗？” 律师问：”你完全值得信任吗？” Altman说：”我相信是。”然后律师追问，他就改口说：”那我把答案改成’是’。”

这个对话挺微妙的。Altman没有表现得激动或者防御性强，反而有点小心翼翼。相比之前Musk在证人席上跟OpenAI的律师互怼、提高音量，Altman的demeanor要平静得多。

Sam Altman在加州奥克兰联邦法院作证（来源：CNBC）

微软投了130亿，但SoftBank、Nvidia、Amazon投得更多

Altman在法庭上还透露了一个数据：Amazon、Nvidia和SoftBank各自对OpenAI的投资额都超过了Microsoft。SoftBank投了300亿美金，Nvidia投了300亿，Amazon投了500亿——都比微软的130亿多得多。

这个信息其实挺重要的。Musk起诉的时候把Microsoft也列为了被告，指控它协助OpenAI违反慈善信托义务。但现在看来，后面进场的这几个巨头，出手比微软狠多了。

写这篇文章的时候，我不禁在想：这场官司打完之后，OpenAI和Musk之间的关系算是彻底破裂了。从联合创始人到法庭上的对手，这剧情搁科幻小说里都算狗血。Altman在证词里说”我对Elon的看法已经显著改变了”——这句话，我觉得说得挺克制的。

📎 原文来源：CNBC – OpenAI trial recap: Altman testifies he never promised Musk to keep company a nonprofit

2026年5月15日
Vibe Coding：每个人都能写软件的时代来了
AI正在让”个人软件”成为可能（图片来源：The Verge）

说实话，我最近一直在想一个问题：为什么我们每天都在用那些”勉强能用”的软件？

你知道我在说什么——那个待办事项app，功能挺全，但就是少了那么一个你想要的小功能；那个笔记工具，同步很稳，但界面丑得让你每次打开都想换一个。以前遇到这种情况，要么忍，要么学编程，要么花钱请人写。现在？AI帮你写。

David Pierce在The Verge写了篇长文，讲的是”vibe coding”——这个词是Andrej Karpathy（OpenAI创始团队成员）提出来的。意思是，你不需要懂编程，只要你能说清楚想要什么，AI就能帮你把软件写出来。他形容这个状态是”不work才让人惊讶”，而不是”work了才惊讶”。这转折挺大的。

我试了Claude Code

我试了一下Claude Code。20分钟，我写出了一个勉强能跑的原型——日历、笔记、任务清单全在一个页面里。当然，后面修bug花了我好几天，但关键是：我真的在”做软件”了，而不是在”提需求”。

Robin Sloan是个作家，同时也是个技术爱好者。他经营一家橄榄油公司，用AI写了个Ruby脚本，从Shopify和USPS拉数据，自动生成发货标签。他自己也说”写得挺凑合的”，但管用。他还说了句挺戳人的话：”如果我被巴士撞了，这对我的橄榄油公司来说是个问题，因为只有Robin知道怎么跑这个软件。”但只要Robin还在，它就跑得挺好。

那些只服务于一个人的app

这篇文章里列举了一堆”个人软件”的例子，看得我直乐：有人写了个命令行工具给幻想棒球球员排名，有人给1990年代的游戏加入可再生能源概念，有人做了个优化Secret Santa分配的工具，还有人搞了个系统在院子里标记狗屎位置（这玩意儿居然真的有人需要！）。

这些app的”可寻址市场”精确到一个人，收入潜力精确为零美元。但这就是”个人软件”的真谛——它不一定是要卖给别人的，它就是为你自己量身定做的。

为什么现在才行？

说实话，以前不是没人想过让普通人写软件。IFTTT、Apple Shortcuts，这些工具都试过，但问题在于：如果你要用”如果-那么”语句来思考，大多数人就已经放弃了。

大语言模型改变的是这个交互方式。你不需要学编程语法，你只需要能用自然语言描述你想要什么。而且，现在的AI不只是”生成代码”，它还能帮你调试、帮你理解报错信息、甚至帮你部署到GitHub和Vercel。
- Vibe Coding：不需要学编程，用自然语言让AI写软件
- 个人软件时代：为自己量身定制，不一定非要卖给别人
- 边缘需求有救了：大厂不做的功能，现在你能自己搞
- 局限也很明显：没客服、没保障，但对你一个人来说可能够用了
最后说一句：以后评判一个人”懂不懂技术”，可能不再是他会不会写代码，而是他能不能用AI把自己的需求变成现实。这个门槛，比我想象中低多了。

📎 原文来源：You can make an app for that – The Verge
2026年5月15日
Notion把workspace变成了AI智能体指挥中心
Notion推出开发者平台，变身AI智能体指挥中心（图片来源：Notion/TechCrunch）

Notion这次真的放大招了。5月13日，这家以笔记协作出名的公司搞了一场直播发布会，推出的东西让我眼前一亮——他们把自己的workspace直接变成了AI智能体的指挥中心。

说实话，我一开始也没太当回事。Notion加个AI功能不是啥新鲜事，市面上类似的工具多的是。但这次不一样，他们搞的是一个完整的开发者平台，能让你自己写代码、接入外部智能体、还能搞自动化工作流，把数据库里的数据随便拉出来用。

从100万智能体到开发者平台

先说说背景。今年2月份Notion第一次推出”Custom Agents”的时候，我就试过。那时候能做的事情挺基础的——回答常见问题、整理状态更新、跑一些简单的工作流。说实话，有点鸡肋。但你猜怎么着？用户们硬是捏出了超过100万个智能体。这数据让我意识到，需求是真的存在，只是工具还不够强大。

这次更新的核心叫”Workers”。简单说，就是Notion给了你一个云端沙盒环境，你能把自己的代码扔进去跑。不需要搞自己的服务器，不需要折腾第三方自动化平台，直接在这个隔离环境里写逻辑、同步数据、设置webhook触发。我试了一下，说实话比想象中顺手。

Notion的联合创始人Ivan Zhao在直播里挺坦诚地说了：”说实话，Notion历史上确实不是个对开发者友好的平台。但事情正在起变化。”这话我信，因为这整套开发者平台的设计确实是在认真考虑开发者的需求。

数据库同步是关键

最让我感兴趣的是数据库同步这个功能。通过Workers，你能把任何有API的数据库（Salesforce、Zendesk、Postgres随便你）直接拉进Notion，还能保持实时更新。Notion的CEO Ivan Zhao说了一句话我觉得挺有意思：”你可以把Notion数据库当成一块纯粹的画布，用来驱动你的工作流和智能体。”这话听起来有点抽象，但实际用起来确实那个感觉——终于不用在各种工具之间跳来跳去了。

然后还有一个挺实用的功能：你可以直接在Notion里跟外部AI智能体聊天，分配任务，追踪进度，就像它们是Notion自家的智能体一样。目前支持Claude Code、Cursor、Codex和Decagon，后面还会加更多。

几个值得关注的亮点
- 自定义代码沙盒：不用自己搞服务器，直接在Notion的隔离环境跑代码
- 数据库同步：任何有API的数据库都能实时拉进Notion
- 外部智能体接入：Claude Code、Cursor、Codex直接当Notion智能体用
- 8月前免费：明显是在抢开发者生态
我觉得这步棋下得挺聪明的。现在各家AI公司都在从”聊天机器人”往”能干活智能体”这个方向转，Notion把自己定位成”智能体协作中心”，而不是直接跟人家拼模型能力。毕竟，大多数企业用户要的不是更聪明的AI，而是一个能把现有工具串联起来、让AI真正融入工作流的东西。

Ivan Zhao总结了一句话：”任何数据，任何工具，任何智能体——这是Notion开发者平台的大图景。”听起来挺霸气的，但我觉得方向是对的。AI工具如果真的要在企业里落地，这种”连接器”的角色可能比”最强模型”更实用。

📎 原文来源：Notion just turned its workspace into a hub for AI agents – TechCrunch
2026年5月15日
AI智能体不能再”自由发挥”了：三部门联合发文划定决策边界

AI智能体以后不能想干嘛就干嘛了。前脚AI Agent赛道火得一塌糊涂，后脚监管就来了——国家网信办、国家发展改革委、工业和信息化部三部门联合印发了《智能体规范应用与创新发展实施意见》，给AI智能体的发展套上了”笼子”。

智能体是什么？说白了就是能自己干活儿的AI

官方给智能体下了个定义：具备自主感知、记忆、决策、交互与执行能力的智能系统。翻译成人话就是——它能自己看、自己想、自己做决定、自己干活。随着大模型技术成熟，智能体正在加速跟网络空间、物理世界深度融合，这玩意儿要是不管一管，确实容易出事儿。

智能体决策权限划分为三个层级：仅限用户本人决策、需由用户授权决策、智能体自主决策——明确划定各种决策方式的合理边界及所需权限

安全可控是底线，创新驱动是方向

《意见》提出了四大基本原则：安全可控、规范有序、创新驱动、应用牵引。具体举措主要围绕四个方面：夯实技术底座和标准协议、守牢安全底线和防范风险、强化19个典型应用场景牵引、建设创新生态促进产业合作。

19个场景定了哪些方向？

应用场景覆盖五大方向：科学研究、产业发展、提振消费、民生福祉、社会治理。《意见》还提出了一个量化目标：新一代智能终端、智能体等应用普及率要超70%。说实话，这个覆盖率目标挺激进的，意味着三年内智能体要从”尝鲜”变成”标配”。

我觉得这次监管来得挺及时的。之前看到各种AI Agent产品一个比一个激进，各种”全自动”、”自主执行”吹得天花乱坠，普通用户根本搞不清楚这些AI到底能自己做什么主。现在好了，官方给你划清楚——哪些必须人拍板、哪些可以授权、哪些AI能自己定。这有点像给AI立了个”交规”，接下来就看执行力度了。

📎 原文来源：三部门发文规范AI智能体发展规范与创新并举（财新网）

2026年5月14日
1.2万亿美元！Anthropic估值正式反超OpenAI，硅谷王座彻底易主

说实话，我一直以为OpenAI稳坐AI领域头把交椅来着，结果这两天看到一个数据把我惊到了——Anthropic的估值居然飙到1.2万亿美元，正式超过OpenAI了。

15个月，30倍增长

你们知道Anthropic的CEO Dario Amodei之前透露了什么吗？他说今年第一季度，Anthropic的年化收入（ARR）和使用量同比暴涨了80倍。原本他们定的目标才10倍，没想到直接翻了好几倍。这增长引擎主要是Claude Code——这款去年底上线的编程工具在开发者圈子里扩散速度太快了。

ARR从2025年初的10亿美元飙升到2026年4月的300亿美元，15个月完成30倍增长，Pre-IPO市场隐含估值触及1万亿美元

算力争夺战：马斯克送来22万块GPU

Anthropic这波增长太猛了，据说原来的算力直接”炸锅”限流了。关键时刻马斯克出手，SpaceX的Colossus 1数据中心把全部算力都给了Anthropic——整整300兆瓦计算能力，22万块英伟达顶级GPU。这还没完，Google又签了个五年2000亿美元的大单，占谷歌云合同积压总额的40%以上。

Anthropic构建的庞大算力帝国

全球第11大上市公司

如果按这个估值上市，Anthropic直接就是全球第11大上市公司了，前面是苹果、微软、英伟达、亚马逊、Alphabet、Meta、台积电、博通、特斯拉、沙特阿美这些巨头。老实讲，这个排名确实有点魔幻。

我觉得吧，Anthropic能反超OpenAI，关键还是Claude系列在企业市场站稳了脚跟。Dario Amodei之前一直在强调”负责任的AI”，没想到这套理念在商业上也挺吃香。不过话说回来，1.2万亿的估值需要到2029年收入增长20-30倍才能支撑，这个目标也是相当激进的。AI圈的故事，越来越有意思了。

📎 原文来源：全球AI新王诞生，Anthropic估值冲爆1.2万亿，首次反超OpenAI

2026年5月14日
模型不卷了，卷系统：AI行业正在发生一场安静的大转向
如果你最近还在盯着各种模型排行榜看谁又拿了第一，我建议把注意力挪一挪。AI行业正在发生一个不太显眼但我觉得更重要的变化——从”模型竞赛”转向”系统竞争”。说白了，比的不是谁家模型最聪明了，而是谁能把AI塞进你的日常流程里让你真正用起来。

AI正在从”看它能做什么”的阶段，进入”它在这套系统里扮演什么角色”的阶段。模型变得越来越不可见，但越来越有价值。

Google在重新发明鼠标

Google DeepMind前两天搞了个叫Magic Pointer的东西，我觉得这个概念比大多数新模型发布都有意思。简单说就是给鼠标指针加上AI能力——你不用打开对话框输入提示词，直接指向屏幕上的东西，AI就知道你想干嘛。指向一段文字，它能帮你改写；指向航班信息，它直接给你查详情和比价。

这背后的思路其实挺颠覆的。以前我们跟AI交互的方式是打开一个聊天窗口，然后在里面描述需求。DeepMind觉得这不自然，为什么不让AI来适应你已有的操作习惯？你在任何界面里想做什么，指一下就行了。目前这个功能已经在Google AI Studio上线演示版，Chrome浏览器里的Gemini助手也开始支持了。

阿里把AI变成了印钞机

说完交互，再看看商业化这块。阿里刚发了最新季度的财报，云计算智能部门收入达到416.3亿元，同比增长38%。整体营收才涨了3%，但这38%的增长让我眼前一亮。AI产品目前占外部云收入的30%，阿里预计一年内能超过50%。

他们的Qwen聊天机器人已经整合进了淘宝和天猫，用户可以像跟朋友聊天一样浏览和下单。企业端的悟空智能体工具也在铺开。阿里甚至说原定的三年3800亿AI投资计划可能会超标，因为早期回报太好了。财报发布后股价涨了7%以上，市场用真金白银给AI商业化投了票。

真正的竞争刚刚开始

把这些消息放在一起看，趋势很明显：微软在推Agent 365做企业AI治理，Google在用Gemini Intelligence把Android变成一个主动式的AI操作系统，S&P Global把垂直领域专业知识跟GenAI结合做金融决策支持。大家都不再执着于”谁的模型参数大”这种话题了。
- 竞争焦点从模型能力转向分发渠道、界面体验和治理框架
- Google Gemini Intelligence今夏上线最新款手机，手表、汽车、眼镜陆续跟进
- OpenAI审判从商业纠纷演变成AI行业治理的标志性事件
- 垂直领域AI（如金融研究）正在证明比通用AI更有商业护城河
我的感受是，2026年的AI正在变成一种”基础设施”——你不太会注意到它的存在，但它确实在改变你跟电脑交互的方式、你购物的体验、你获取信息的方法。这种变化比”模型又刷新了榜单”这种新闻实际得多，也重要得多。

接下来真正值得关注的不是哪家公司又发布了新模型，而是谁先打通了”模型到场景”的最后一公里。这场仗，才刚开始。

📎 原文来源：AI Dispatch: Daily Trends and Innovations – May 13, 2026 | DeepMind揭秘Google魔法指针：AI让鼠标真正读懂你的意图
2026年5月14日