博客

  • Google I/O 2026前瞻:这次不拼模型拼变现,Gemini Intelligence要接管你的手机了

    下周一就是Google I/O 2026了。这次的画风跟往年还真不太一样——大家不再一窝蜂猜测”Gemini 4.0到底发不发”,而是把目光盯在了一个更实在的问题上:Google的AI能力,到底能换成多少真金白银?

    Cloud业务成了全场最靓的仔

    先说财务数据,Google Cloud今年Q1交出了200.28亿美元的成绩单,同比暴涨63.4%。积压订单更是夸张,达到4623亿美元,环比接近翻倍,同比暴增400.3%。Token消耗量环比也涨了60%。这几个数字放在一起,给我的感觉就是:AI算力需求这列车,根本刹不住。

    Gemini版本发布时间线
    Gemini版本发布时间线|来源:华尔街见闻

    AI Max要重构广告投放逻辑

    除了模型和云业务,Google Marketing Live也是这次的重头戏。AI Max计划今年9月完全取代Dynamic Search Ads,这个动作对广告主影响巨大。现在AI驱动的广告活动已经占搜索广告支出的30%以上,Smart Bidding Exploration能带来约27%的额外转化,AI Max完整功能更是能提升14%的转化。

    传统上,约20%的查询具有商业属性。如果AI搜索让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板可能上移。

    Android要从”操作系统”变”智能系统”

    Google还提前剧透了Android的新AI功能。Gemini Intelligence是这次的核心品牌,主打三大能力:

    • 应用自动化:系统可以帮你跨应用完成任务,比如从Gmail找到课程大纲,自动跳到购物App加购书籍。目前和DoorDash、Uber合作测试
    • Auto Browse:6月底上线,Gemini会自动解析网页完成多步骤任务,支持实时观看或后台静默运行
    • Create My Widget:用描述性提示词创建自定义小组件,比如”根据天气推荐穿搭”

    说实话,桌面端Auto Browse的体验之前被吐槽挺多的,速度和准确性都不太行。但移动端页面结构更简单,实际体验可能会有所改善。

    搜索份额稳住了,Chrome也涨了

    值得注意的一个信号:Google全球搜索份额4月份是90%,环比还涨了10个基点。Chrome全球份额68%,美国份额50%,也都稳中有升。之前大家担心AI搜索会冲击Google广告基本盘,现在看这个担忧至少目前还不成立。


    5月19日Google I/O、5月21日Google Marketing Live——这两场活动连着来,算是Google今年最密集的”秀肌肉”时间。模型发布固然重要,但市场现在更想看的是:Google能不能把AI能力真正变成收入引擎,而不是停留在demo和PPT层面。

  • GPT-5.6下个月就发布?OpenAI与Anthropic补贴大战同日开打,开发者坐收渔利

    GPT-5.6下个月就发布?OpenAI与Anthropic补贴大战同日开打,开发者坐收渔利

    AI圈的军备竞赛,卷出新高度了。

    三周前GPT-5.5刚刚发布,今天GPT-5.6的消息就传出来了。知名爆料人Leo透露,GPT-5.6的开发已经进入全速阶段,首批内部检查点已经开始测试,下个月很可能就会正式露面。更离谱的是,有人在OpenAI内部Codex的日志里发现了rollout mapping的痕迹——虽然大部分调用还指向GPT-5.5,但有一条记录已经悄悄落在了GPT-5.6身上。内部代码名也曝光了:ember-alphabeacon-alpha

    网友们的反应出奇一致:这迭代速度,根本追不上。

    GPT-5.6内测

    Codex ultrafast:2-3倍提速

    速度上的突破同样炸裂。本周四OpenAI将在Codex上线”ultrafast模式”,响应速度直接提升2到3倍。注意,这是在旗舰主力模型上的加速——不是阉割版,不是小模型凑数,是正儿八经的全尺寸加速。对开发者来说,Agent循环、长任务流水线、浏览器自动化……所有需要”等”的地方,体验将彻底不同。

    有意思的是,就在这个时间点,OpenAI和Anthropic的”补贴大战”也同日开打了。

    补贴大战:白送400美元

    先出手的是Anthropic。6月15日起,给付费用户每月提升50%的编程额度,覆盖Claude Agent SDK、命令行工具和Claude Code。同时推出Opus 4.7 Fast模式,主打比Codex更快的高级推理。

    OpenAI的反手同样迅速:未来30天内,任何从其他平台迁移到Codex的企业,直接获赠2个月免费使用权。按Pro计划每月200美元计算,相当于白送400美元。奥特曼亲自下场喊话:“Codex是市面上最强的AI编程产品。”

    战报数据很说明问题:2000名开发者在3小时内主动联系了OpenAI。这场补贴战的逻辑很清晰——抢开发者就是抢生态,抢生态就是抢未来。

    补贴大战

    AI飞轮:AI在帮AI造更强的AI

    但真正让我觉得有意思的,是这背后隐藏的AI飞轮效应。

    GPT-5.3-Codex是OpenAI首个”参与自身训练”的模型。GPT-5.5阶段,OpenAI内部85%的员工每周都在用Codex写代码。而GPT-5.6,几乎可以确定是在GPT-5.5的深度参与下开发出来的。

    换句话说:AI正在帮OpenAI造更强的AI。

    Codex现在有300万周活跃用户。数百万开发者把AI编程工具当成日常标配,生成的代码反哺回AI的训练与部署,这个循环只会越转越快。当两家万亿级公司开始用”补贴战”加速这一切的普及,通往ASI(超级人工智能)的飞轮,已经开始自转了。

    开发者们,你们准备好坐收这波红利了吗?


  • 一周翻倍、一个月涨四倍:中国大模型五强格局彻底成型

    一周翻倍、一个月涨四倍:中国大模型五强格局彻底成型

    2026年5月第二周,中国AI圈上演了一场史无前例的资本狂欢。

    短短七天,月之暗面、阶跃星辰、DeepSeek三家未上市公司密集传出巨额融资,而已登陆港股的智谱和MiniMax则以堪称暴力的股价涨幅刷新认知。中国大模型赛道的”五强”格局,就此彻底成型:DeepSeek、智谱、MiniMax、月之暗面、阶跃星辰

    大模型五强

    先说数字。DeepSeek这轮融资敲定后,估值已经到了3000到3500亿元区间,换算成美元大概300到515亿。智谱更猛——5月13日单日暴涨36.9%,市值直接冲破5000亿港元大关,一举超越了许多人印象中”很赚钱”的传统科技公司。做个对比你就懂了:科大讯飞去年营收271亿、净利润8.39亿,市值大概1187亿。而智谱呢?2025年营收才7.24亿元,市值却是讯飞的四倍多。这估值逻辑,你说它疯狂也好、泡沫也罢,但市场就是这么定价的。

    投资方结构根本性变化

    有意思的是,这轮行情的投资方结构发生了根本性变化。过去中国AI企业背后的金主主要是美元VC和互联网巨头,现在呢?月之暗面引入了中国移动,阶跃星辰拉来了华勤、龙旗、豪威这些产业链资本,连DeepSeek的潜在领投方都传出了国家集成电路产业投资基金的身影。用一位一级市场业内人士的话说:“大模型不再只是一个商业故事,它正在上升为国家科技竞争力的关键筹码。”

    从”美元+互联网”到”国资+产业链”,投资方的迭代本身就折射出大模型产业地位的变化。

    DeepSeek的故事尤其值得细说。创始人梁文锋在这轮融资里直接掏出200亿元,真金白银砸进去。他个人持股从之前的1%一路提升到34%,加上间接持股合计控制约84.29%股权。这种创始人自己押重注的操作,在行业内并不多见。有分析师评价说,DeepSeek的融资标志着中国AI产业进入新阶段——过去我们靠商业模式创新,现在开始在基础技术层面与美国巨头正面竞争。

    估值暴涨不等于躺赢

    当然,估值暴涨不等于躺赢。行业里有个说法:“百模大战”正在收敛为”千亿竞赛”——谁能率先证明自己的商业化能力,谁才能真正活下去。目前各家都在跑马圈地,但收入规模跟估值比起来还差得远。智谱的MaaS API平台ARR是17亿元,同比提升60倍,听着吓人,但距离支撑5000亿港元市值需要的营收体量,还早着呢。

    总之,这轮大模型资本盛宴,你怎么看?是”对下一代通用智能平台的信仰定价”,还是泡沫堆积前的最后疯狂?时间会给出答案。


  • 21天估值翻4.5倍!DeepSeek首轮融资500亿,梁文锋自己掏200亿押注

    DeepSeek融apital这事,我盯了快一周,今天终于可以好好聊聊了。简单说:DeepSeek正在搞史上最大规模的首轮融资,目标500亿元人民币,而创始人梁文锋自己就要掏200亿——占整轮的40%。

    21天,估值从100亿美元涨到450亿美元

    你可能还记得,DeepSeek V4是4月24日才发布的。那时候公司估值大概100亿美元出头。结果不到一个月,现在已经飙到450亿美元了——21天翻了4.5倍。这增速,放在整个AI行业都是炸裂的存在。

    梁文锋个人出资200亿,这什么概念?相当于他把大半身家押在了DeepSeek身上。这种创始人all-in的架势,投资人不心动才怪。

    国家队也下场了

    据The Information透露,国家集成电路产业投资基金(大基金)正在洽谈领投。这是正儿八经的国家队信号——说明DeepSeek的战略价值已经被顶层认可。毕竟,能在大模型领域跟OpenAI、Anthropic正面掰手腕的中国公司,屈指可数。

    腾讯、阿里也都在谈。虽然阿里之前有消息说没谈拢,但DeepSeek现在估值涨成这样,筹码只会越来越厚——想进的抓紧,想谈条件的恐怕要吃亏了。

    V4.1定档6月,多模态终于来了

    技术层面,DeepSeek V4.1已经官宣6月发布。相比V4,这次最大的升级是两点:

    • 多模态能力:V4.1将首次支持同时处理图像和音频,真正意义上的”全能选手”
    • MCP协议深度支持:对标Anthropic的Model Context Protocol,企业接入更方便

    还有个细节:DeepSeek准备把发布节奏”加速到接近行业常规速度”。之前V4憋了大半年才出,现在6月就要跟V4.1,说实话有点卷——但对用户来说是好事,迭代越快,能力越强。

    理想主义者要变成重资产公司了

    DeepSeek之前给我的印象一直是”技术宅”——埋头搞研究,不怎么谈商业化。但这次融资说明,梁文锋想明白了:光靠理想留不住人。

    文章提到好几位明星研究员已经离职跳槽:郭达雅、王炳宣、魏浩然……融资的钱,很大一部分就是要拿来”买人心”的——用期权定价,让核心人才真正绑在船上。

    算力、人才、产品、渠道……DeepSeek正在从一家”实验室”变成一家真正的”重资产AI公司”。这条路很难,但我倒挺看好——毕竟技术再牛,也得有人买单才能持续下去。


  • 每家75000颗!美国批准10家中国公司买英伟达H200,联想第一个站出来

    说实话,这条消息我看完愣了好几秒——美国商务部正式批准了10家中国企业采购英伟达H200芯片,而且每家最多能买75000颗。这可不是小打小闹,是实打实的芯片松绑。

    联想第一个站出来确认了

    名单一曝光,行业炸锅。阿里、腾讯、字节跳动、京东、联想、富士康……全是国内数一数二的互联网和制造巨头。联想那边更是直接官宣:自己是英伟达H200的中国区授权分销商。这意味着以后国内公司想买H200,不一定非要直接找英伟达,通过联想这条渠道也行。

    每家公司最多可购买75,000颗H200芯片——这是什么概念?中国早在今年1月就同意进口数十万颗H200,这批货足够喂饱好几年。

    黄仁勋随特朗普访华,芯片政策同步松动

    这事有意思的地方在于时间节点。5月14日,路透社放出消息的同一天,英伟达CEO黄仁勋正随特朗普的访华代表团在北京。你说这是巧合?我倒觉得更像是两边谈出来的结果。

    要知道,在H200之前,美国先放行的是H20——那是H200的”小弟”,性能差一截。就这,国内厂商也是等了大半年才拿到货。现在H200直接松绑,速度反而快了不少,这背后的谈判力度可见一斑。

    英伟达股价先涨为敬,但交付还没影

    消息一出,英伟达美股夜盘直接拉升,一度涨超2%,盘前又涨了2.6%,眼看就要七连阳。港股的阿里、腾讯也跟着沾光,股价走强。

    不过路透社泼了盆冷水:截至目前,英伟达尚未实际交付任何产品。这波更像是”政策落地”,真正的货还得再等等。

    中国市场对英伟达有多重要?

    这么说吧,之前被禁售的时候,英伟达在中国高端AI芯片市场的份额一度跌到谷底。但美国人算过账:中国市场太大了,放弃等于把蛋糕白送给AMD和英特尔。与其这样,不如定点放开——只卖给”听话”的大公司,既赚了钱,又不至于完全失控。

    所以我的判断是:这次H200解禁不是终点,后续很可能会逐步扩大范围。但前提是——你得够大、够正规。中小公司想分一杯羹?暂时还不在这份名单里。


  • Open WebUI:127k Stars!为Ollama打造的终极Web界面

    Open WebUI Banner

    如果你在用 Ollama 运行本地大模型,肯定知道自带的命令行事先张扬地”反人类”。每次想切换模型、调参数、看历史记录,都要折腾一堆命令行操作。Open WebUI 就是来解决这个问题的——给你一个漂漂亮亮的 Web 界面,把 Ollama 的能力全部释放出来。


    🚀 项目简介

    Open WebUI 是一个功能强大、可高度自定义的自托管 AI 交互界面,GitHub 已获得 127k+ Stars。它最初是 Ollama 的 Web UI,现在已经发展成支持 Ollama、OpenAI API、Claude 等多种后端的通用 AI 界面平台。核心理念是让每个人都能轻松地与本地或云端大模型交互,完全离线运行,数据自主可控。

    Open WebUI 演示界面


    ⚙️ 安装要求

    硬件要求

    • CPU:支持 AVX 指令集的现代处理器
    • 内存:取决于使用的模型(建议 8GB+)
    • 磁盘:10GB+(用于存储应用和数据)

    软件依赖

    • Docker(推荐)
    • 或 Python 3.11+
    • 浏览器(Chrome / Edge / Firefox)

    快速安装(Docker 方式,最简单)

    docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

    启动后访问 http://localhost:3000

    快速安装(pip 方式)

    pip install open-webui
    open-webui serve

    启动后访问 http://localhost:8080


    💡 核心功能

    • 🤖 多后端支持:支持 Ollama、OpenAI API、Claude、vLLM 等多种模型后端,一个界面管理所有模型
    • 📚 RAG 知识库:内置 RAG 功能,可以上传文档构建私有知识库,让 AI 基于自有资料回答问题
    • 🧩 插件系统:支持插件扩展,可按需安装功能插件,满足个性化需求
    • 🔧 工具调用:支持 Tool Calling,可以调用外部工具完成复杂任务
    • 📝 上下文管理:智能管理对话上下文,优化长对话体验,支持对话历史管理和标签分类

    📦 典型使用场景

    🎯 场景一:本地 Ollama 模型可视化交互

    安装 Ollama 后拉取任意模型(Llama 3、Qwen、Mistral 等),通过 Open WebUI 的友好界面进行对话、切换模型、调整参数。完全本地运行,隐私无忧。

    🎯 场景二:企业私有知识库问答

    上传公司内部文档到 RAG 系统,构建专属知识库。员工通过对话形式查询制度、文档、数据,AI 精准基于自有资料回答,无需接触外部服务。

    🎯 场景三:团队共享 AI 助手

    部署在内网服务器上,团队成员通过浏览器访问同一个 AI 界面。可以连接多个模型后端,按需切换,适合开发和测试场景。


    ⭐ 推荐理由

    我之前一直用命令行跑 Ollama,每次调模型都要记一堆参数。用上 Open WebUI 之后,体验直接提升了好几个档次。界面简洁好看,功能也很全面,RAG、插件、多后端支持这些都用得上。

    最关键的是完全开源、可以自托管,数据不离开自己的服务器。对于企业用户来说,这个优势很明显——既能用上 AI 能力,又不用担心数据泄露问题。

    如果你在用 Ollama 或者想搭建本地 AI 界面,Open WebUI 绝对值得一试。


    📧 下载地址

  • ChatGPT被Claude超了:AI企业市场王座易主,OpenAI慌了吗?

    说实话,我一直觉得OpenAI在企业市场稳如老狗,毕竟ChatGPT的名气摆在那儿。结果刚看到的这个数据把我惊到了——根据金融科技公司Ramp发布的最新AI指数,Anthropic的企业采用率居然达到了34.4%,直接把OpenAI的32.3%给超了。

    这可不是什么小幅增长。回看一年前的数据:Anthropic只有9%,OpenAI是32%。一年时间,Anthropic翻了将近四倍,而OpenAI呢?只涨了0.3个百分点。你没看错,0.3%。

    Anthropic企业市场占有率:34.4%(首次超越OpenAI的32.3%)
    一年增长率:将近4倍
    OpenAI同期增长:0.3个百分点

    Anthropic凭什么翻盘的

    我觉得关键在于两个杀手锏:

    第一,按量计费干掉了SaaS订阅思维。 Anthropic完全放弃了固定订阅费,转型成按Token计费。年度经常性收入已经飙到450亿美元级别——去年底还只有现在的三分之一。微软自己虽然家里有OpenAI,但今年在Claude上的支出高达5亿美元。超过1000家大客户每年给Anthropic支付超过100万美元。

    第二,AI Agent的印钞效应。 举个实际案例:Workato团队用Claude构建了一个Agent,负责抓取客户支出数据、自动写开发信、更新Salesforce数据库。结果Claude的调用量在单季翻了4倍,这个Agent一个季度直接带来100万美元的销售额增长。你说这老板能不心动吗?

    AI企业市场格局变化
    Claude vs ChatGPT 企业采用率对比

    但问题也很明显

    Ramp的经济学家指出了Anthropic面临的三重困境,说实话这些也挺要命的:

    • 利益错配:Anthropic靠Token用量赚钱,天然倾向于推用户用更贵的模型。等企业开始精打细算,把简单任务路由到便宜模型时,增长就会撞墙
    • 产品体验下滑:Claude最近频繁出现服务中断、速率限制,用户投诉增多。4月份还重置了用户使用限额,跟SpaceX签数据中心协议也是在补救,但窗口期很短
    • 成本持续上涨:最新模型更新导致包含图片的提示Token成本翻3倍,企业客户账单哗哗涨

    有个CIO吐槽说,他们30个员工的Claude账单在30天内翻了三倍。更离谱的是,有员工开发的Agent因为代码逻辑问题,在一天内触发了循环调用,直接把原本计划一个月的Token配额给烧光了。现在CIO们得专门派人每天盯着Anthropic账单,这画面想想都觉得好笑又心酸。


    总的来说,我觉得这场竞争的本质变了——大模型竞争已经从”谁的模型跑分更高”切换到”谁能进入企业的核心工作流”。Anthropic用450亿美元ARR证明了AI真的能印钞,但最贵的AI供应商同时也是增长最快的AI供应商,这个矛盾能维持多久,是接下来最值得盯着的数据。OpenAI并没有输,但确实遇到了一位前所未有的劲敌。

  • 腾讯让听新闻变成聊天:全网首个AI互动电台体验

    说实话,我一直觉得传统广播有点反人类——人家在那噼里啪啦讲,你只能被动着听,想插嘴问一句”这政策具体咋回事”根本不可能。但腾讯新闻刚上线的这个AI互动电台,我觉得真的有点东西。

    简单说,它把”我播你听”的单向模式彻底干掉了。收听的时候,你随时可以按住说话插嘴提问,AI主持人会立刻回应——不只是回答问题,还能接住你的反驳观点,或者主动引导话题跳转。这哪是听新闻啊,简直就是在和朋友微信语音聊天。

    技术上怎么做到的

    据说背后是腾讯混元大模型在支撑,团队还专门攻克了几个技术难点:

    • 极速响应:用了流式音频生成技术,做到”边生成边收听”,等待时间几乎为零
    • 精准理解:上下文建模能力强,能准确捕捉”这个政策””那个观点”这类指代词
    • 灵活应变:能识别随性的口语表达,还会结合外部检索补充实时信息

    我觉得最骚的是那个”无限流”的愿景——你只要说”我想听点缓解焦虑的内容”,AI就能实时筛选整合信息,给你生成专属的定制节目。听起来有点像给自己配了个私人DJ,只不过放的是新闻资讯。

    AI互动电台界面
    腾讯新闻AI互动电台操作界面

    新闻场景下的内容安全

    说实话,AI生成内容最难搞的就是真实性问题,尤其是在新闻场景里。腾讯团队也想到了这层,搞了个”三重防火墙”:

    • 源头把控:只从经过事实核查的优质内容池选材
    • 过程约束:通过提示词体系约束模型价值观,确保客观中立
    • 输出校验:双保险机制,对生成文本做敏感词扫描和风险评级

    我觉得这个方向挺有意思的。以前我们获取资讯要么看文字(累)、要么看视频(太重)、要么听广播(被动),现在终于有个能”对话”的选项了。当然实际体验怎么样还得自己试试,但从产品逻辑上讲,这确实填补了一个空白。

  • AI 把我的电话号码给了陌生人:聊天机器人的隐私噩梦才刚开始

    前阵子有个 Reddit 用户发帖说,他的手机连续一个月被陌生人打爆了——打电话的人都在找律师、产品经理、锁匠。原因很离谱:Google 的 AI 生成内容,把他的真实电话号码当成了这些服务的联系方式。

    说实话我看到这个新闻的时候,第一反应是:这也能搞错?但仔细一想,AI 训练数据里本来就有大量从网上扒下来的个人信息,电话号码泄露只是冰山一角。

    AI聊天机器人泄露用户电话号码
    插画:Sarah Rogers / MIT Technology Review | 图片来源:Getty Images

    不止一个人中招

    MIT Technology Review 这篇报道里提到了好几个案例。三月份,以色列一个软件工程师被陌生人通过 WhatsApp 联系,对方说是要找 PayBox(一款以色列支付应用)的客服。结果一查,是 Google 的 Gemini 给出了他的私人号码。

    更离谱的是,华盛顿大学的一个博士生逗 Gemini 玩,输入了同事的名字,结果 Gemini 直接把同事的手机号码给报出来了。她同事之前在某个技术工作坊的页面上留过号码,估计就这么被模型「记住」了。

    DeleteMe(一家帮用户删除网上个人信息的公司)说,过去七个月里,关于 AI 泄露个人信息的客户咨询量增加了 400%。其中 55% 跟 ChatGPT 有关,20% 跟 Gemini 有关,15% 跟 Claude 有关。

    问题到底出在哪

    老实讲,这事的根源其实不难理解。大语言模型的训练数据是从网上大规模爬取来的,里面难免包含各种个人信息——简历、驾照照片、信用卡信息,之前的研究早就证实过这一点。

    关键是,模型会「记住」训练数据里的东西,而且不一定是出现次数多的才会被记住。也就是说,哪怕你只在某个小众论坛留过一次电话号码,也有可能被模型捕获,然后在某个不知情的情况下被「输出」给完全陌生的人。

    我试着换位思考了一下:假设你某天突然接到一堆陌生电话,只因为某个 AI 把你的号码当成了某家公司的客服热线——这体验肯定糟透了。更麻烦的是,据 MIT TR 的报道,目前好像并没有什么好办法能让 AI 公司把你的个人信息从模型里删掉。

    防护机制也不完美

    AI 公司当然不是说完全没设防。各家都有自己的内容过滤和安全护栏,专门用来防止聊天机器人输出个人身份信息。但问题是,这些护栏并不总是管用。

    报道里有个让人哭笑不得的细节:华盛顿大学的学生测试 ChatGPT 时,ChatGPT 先是说信息不可用,然后话锋一转,建议用「调查式」方法继续——只要提供目标的大概居住区域或者房产共同所有人姓名,它就能「挖」出更多信息。结果学生们照做了,ChatGPT 真的给出了那位教授的家庭住址和购房价格。


    我觉得这件事真正让人担心的,不是某一个电话号码泄露,而是我们已经把这么多个人信息「喂」给了 AI,却基本没有撤回的余地。现有的隐私法规——无论是加州的 CCPA 还是欧盟的 GDPR——在处理「已公开但被爬虫抓取用于训练」这类数据时,其实都处于灰色地带。

    最务实的建议?在个人信息被下一次爬虫抓走之前,尽量把它从公开网站上撤下来。只是这样一来,那些已经进了训练数据集的信息,怕是再也回不来了。

  • Edge 的 Copilot 现在能看遍你所有标签页,这功能有点东西

    说实话,微软这回在 Edge 上搞的 Copilot 更新,真的让我有点意外。以前我跟 Copilot 聊天,它只能看到我当前所在的那个标签页,现在不一样了——它可以直接读取我所有打开的标签页。

    我试了一下,效果确实挺实用的。比如我在好几个电商页面之间比价,直接问 Copilot「这几个东西哪个更划算」,它真的能把各标签页的信息综合起来给我答案,不用我来回切换粘贴内容了。

    Microsoft Edge Copilot 多标签页功能
    图片来源:The Verge

    不只是「看」,还能「学」和「播」

    这次更新还顺带推了几个有意思的小功能。有个叫「学习与复习」的模式,能把你正在看的文章直接变成练习题,感觉是在跟 NotebookLM 的 AI 播客功能较劲。

    老实讲,把网页内容变成 AI 播客这个点子我挺喜欢的。你开着一堆标签页,Copilot 能帮你把它们「播」出来,省得自己逐篇去读。写东西的时候,它还会适时弹出一个 AI 写作助手,有点像是在旁边随时待命的编辑。

    微软说你可以「选择开启哪些体验,或者关掉不需要的」,这点倒是挺贴心的,不然标签页内容全被读一遍,换我我也会觉得不舒服。

    长期记忆来了

    有个细节值得说一下——桌面端和移动端的 Edge Copilot 现在都有「长期记忆」了。简单说就是它会记住你之前的对话,下次聊的时候不用重新介绍背景。我觉得这功能是一把双刃剑,方便是方便,但隐私顾虑也在所难免。

    新标签页也改版了,把聊天、搜索、网页导航整合在一起,还加了 Journeys 功能,用 AI 把你的浏览历史自动分类。手机端的 Edge 还能共享屏幕跟 Copilot 边看边聊,微软说会有「清晰的视觉提示」告诉你 Copilot 正在干嘛,尽量让你心里有数。


    我觉得微软这波操作,本质上是想把 Copilot 变成你浏览器的「全局助手」,而不只是一个躲在侧边栏的聊天框。能不能成,还得看用户买不买账。至少目前看起来,方向是对的。