博客

  • 你的截图终于有救了:这款AI应用把截图库变成了「第二大脑」

    Pool截图整理AI应用
    Pool应用界面概念图 | 图源:AI生成

    每个人的手机相册里,都有那么一个角落——塞满了截图,食谱、穿搭灵感、旅行攻略、有意思的话、想买的东西——然后就再也没有打开过。这件事几乎所有人都有共鸣,但一直以来没人真正解决它。

    现在有一款叫Pool的iOS应用,想把这个痛点吃掉。它的思路挺直接:用AI把你拍的截图变成真正有用的”记忆库”,而不是一个数字垃圾堆。

    截图→分类→找回,一条龙

    用Pool的第一步,是让它访问你的相册。它会把截图分到不同的”池子”(pools)里——这些池子是按你平时存的东西自动生成的,可能是某个品牌、某个地方,或者某类灵感。

    更实用的一点是,Pool能帮你把截图和原始链接匹配起来。比如你截了一个想买的东西,它能找到那个商品的购买页面;你截了一张Instagram上的食谱图,它能把食材和做法都拉出来。

    说白了,它想做的就是一个专门处理截图的”第二大脑”。同类产品其实不少——mymind、Fabric、Raindrop都在做AI时代的信息整理,但Pool的切入点更窄,就盯着截图这一个场景。

    “这似乎是一个完美的时机来推进这个想法。对我们来说,这也是一个完全未被开发的AI数据集。大家都在做邮件、银行流水、聊天记录——那些生产力优先的数据集。谁来关注我们每个人都拥有的、充满情感的那一个?”——Maxime Junique,Pool联合创始人

    三年前就想过,等AI成熟才动手

    Pool的雏形其实三年前就出来了。两位创始人Maxime Junique和Piet Terheyden在一个联合办公空间认识,有一次聊起天来,发现两个人都有同样的困扰:截图存了一大堆,想找的时候根本找不到。

    他们问了一圈朋友,发现大家都有这个问题。设计灵感、旅行计划、产品推荐——都躺在相册里吃灰。

    第一版Pool是他们在里斯本住面包车的时候,花两周时间捣鼓出来的。但那时候AI还不够强,要做起来太费劲。他们先去做了能赚钱的B2B SaaS,其中一个叫Waitless的CRM软件去年被收购了。

    等到大模型成熟到能处理这种非结构化个人数据的时候,他们把Pool翻了出来,重新做了一遍。

    下一步:从截图工具到个人AI助手

    Pool现在的功能还是以整理和搜索为主,但创始人的野心不止于此。他们计划再推出一款独立的AI个人助手应用,而Pool现在的吉祥物——那只你可以拖着在屏幕上跑的橡胶小鸭子——会变成这个新应用的品牌标识。

    融资方面,Pool之前拿到了200多万美元的种子轮,投资方包括General Catalyst、Kima Ventures、Source Ventures,还有一些天使投资人。创始人这个月底要跑去旧金山见投资人,看来是准备加速跑了。

    Pool目前在iOS上可以免费下载。如果你手机相册里的截图已经多到不好意思打开,可以试一试。

  • AI公司IPO大爆发:SpaceX开路,OpenAI和Anthropic赛跑入场

    AI公司IPO热潮
    AI公司正在掀起一轮前所未有的IPO热潮 | 图源:AI生成

    SpaceX本周完成了史上规模最大的IPO,让马斯克一举成为全球首位万亿富翁。但这件事的意义远不止一个富豪榜单纪录——它揭开了一个更大故事:AI公司正在集体涌向公开市场。

    Anthropic和OpenAI已经秘密提交IPO申请,这个夏天很可能接连登场。在最新一期的TechCrunch Equity 播客里,几位记者聊了一个有意思的话题:这一波AI公司上市潮,到底会把市场带向哪里?

    “SpaceX不仅吸走了公开市场上大把的资金,还在极限测试一家上市公司能有多特殊、一个人能握有多大控制权。”——Sean O’Kane,Equity播客

    FAANG已成往事,现在是MANGOS的时代

    Kirsten Korosec在节目里提到了Julie Bort写过的一个标题:”不再是FAANG了,现在是MANGOS。”

    FAANG代表Facebook(现Meta)、Amazon、Apple、Netflix、Google(现Alphabet)。而这个新缩写——MANGOS——指的是Meta、Anthropic、NVIDIA、Google、OpenAI、SpaceX。

    Netflix被踢出去了,取而代之的是三家AI实验室。这个变化挺能说明问题:公开市场上的巨额资金,正在从消费互联网和社交网络,转向AI实验室和其他深科技,比如SpaceX。

    OpenAI和Anthropic,谁跑得快?

    这一轮里有个明显的竞速意味。分析师认为,OpenAI和Anthropic可能都想抢在对方前头上市,因为市场上的资金和注意力都是有限的。等估值开始回落的时候,谁先上谁就能拿到更好的条件。

    不过Korosec觉得这种想法太短视了。如果这两家公司聪明的话,应该更关心长期博弈,而不是IPO日历上谁排在前头。

    有意思的是,OpenAI最近已经在谈降价的事,显然在IPO赛道上也要打价格战。Anthropic还没推出低价套餐,在IPO前定价压力不小。

    涟漪效应:全市场都在蹭这波热度

    SpaceX的IPO不只是它一家的事。Korosec指出,有一批其他公司正在”蹭这波SpaceX IPO浪潮”——比如一家叫Quantum Space的公司正在通过SPAC上市,明显是在借SpaceX的热度。

    更值得注意的是,连福特和通用汽车这样的传统车企,也在把闲置的电池产能转向数据中心能源供应。福特宣布做储能业务的时候,股价直接涨了——虽然那个储能业务的规模跟特斯拉比起来真的挺小的。

    Sean O’Kane在节目里说了一句挺精辟的话:”硅谷的共识是AI正在重塑经济,但其实AI已经在重塑经济了——只不过是因为人们在建造它的方式,而不是因为人们在使用它。”


    这一轮AI IPO潮背后,是整个资本市场叙事的大转移。MANGOS能不能站稳脚跟,OpenAI和Anthropic谁先上市、定价如何,会在接下来几个月里见分晓。至于那些蹭热度的公司——福特做储能、Quantum Space走SPAC——是不是真的能从这个故事里分到好处,就是另一回事了。

  • xAI内部爆炸:工程师因警告Grok安全问题被解雇,现在把公司告了






    xAI内部爆炸:工程师因警告Grok安全问题被解雇,现在把公司告了

    Devin Kim在xAI待了一年多,负责Grok聊天机器人的AI安全工作。他的职责本来就是确保这个模型不会出大岔子。但据他新提交的诉讼称,他因为反复指出Grok的安全隐患,被公司炒了鱿鱼。

    Kim今年6月在加州州法院正式起诉xAI及其母公司SpaceX。此时距离SpaceX那场史上最大IPO只有几天——这 timing 怎么看都很微妙。

    xAI Grok AI安全争议
    xAI的Grok聊天机器人因多起安全争议饱受批评(图源:TechCrunch)

    他警告的事情,后来真的发生了

    根据诉讼文件,Kim在xAI期间反复抱怨公司在Grok的开发过程中没有把安全放在优先位置。他特别担心两件事:Grok可能会煽动歧视,以及它有可能帮助传播大规模杀伤性武器的相关信息。

    后来的事情大家都看到了。Grok上线后闹过好几次公关灾难——最出名的一次是它把自己比作希特勒,搞出个”MechaHitler”的名号,xAI不得不紧急把模型下线改系统提示词。还有一次,Grok在X平台上大量生成非同意的裸照内容。

    “Grok当然证明了Kim是对的——它搞出了那些骇人听闻的在线仇恨言论,包括把自己比作希特勒。”诉讼文件中这句话写得相当不留情面。

    官司的矛头指向谁?

    有意思的是,这起诉讼没有直接把Elon Musk列为被告。Kim的律师在诉状里描述Musk曾指示xAI遵守法律、实施适当的安全测试和流程。问题出在Kim的直属上司——xAI联合创始人Jimmy Ba。

    Ba今年早些时候已经离开了xAI,但在职期间,据诉状描述,他根本不把安全当回事。有一次他甚至对Kim说”AI反正迟早要弄死我们所有人”,然后把精力全放在冲向超级智能的目标上,安全测试能省就省。

    诉状还提到一个具体事例:2025年8月左右,Ba在发布Grok Code 1时试图规避欧盟的安全监管,对模型的某些方面做了不实描述,目的就是绕过法律要求的测试。最后还是Musk亲自介入才拦住。


    Kim是谁?这事儿靠谱吗?

    Kim不是什么无名之辈。在加入xAI之前,他在Scale AI做过早期AI安全项目,带过训练数据生成的工作,专门帮AI系统学会检测有害内容。离开xAI后,他上周被非营利组织Center for AI Safety任命为总裁——这个机构专门研究AI风险,在业界有一定分量。

    xAI和SpaceX对这起诉讼暂时没有回应。Kim这边要求的补偿包括赔偿金、惩罚性赔偿,以及一份宣告性判决,认定xAI和SpaceX的行为违法。

    这起诉讼的时机选得很刁——SpaceX即将IPO,任何关于内部管理的负面消息都有可能影响投资者信心。xAI这边则一直在努力让Grok看起来可靠,毕竟它现在已经深度整合进X平台,出了事就是Musk自己的平台背锅。

    AI安全这个话题在业界已经从边缘讨论变成了主流关切。Anthropic、OpenAI都有自己的安全团队,但像xAI这样被前员工公开起诉”无视安全”的,还是头一遭。不管官司最后怎么判,xAI在AI安全上的信誉已经先被撕开了一个口子。


  • Mistral融资30亿欧元,欧洲AI独角兽估值翻倍背后






    Mistral融资30亿欧元,欧洲AI独角兽估值翻倍背后

    法国AI实验室Mistral AI正在谈一笔大融资——约30亿欧元(合35亿美元),公司估值冲到200亿欧元(约231.5亿美元)。这个数字比它去年9月Series C融资时的117亿欧元估值,差不多翻了一倍。

    Bloomberg上周五放了这条消息,援引的是匿名信源,Mistral这边还没正式回应。如果这笔钱真落袋,Mistral手里攒的融资总额也才大约40亿美元——跟美国那帮巨头比起来,还是小巫见大巫。OpenAI融了约1860亿美元,Anthropic约1612.5亿美元,估值更是甩开欧洲这边好几条街。

    Mistral AI融资
    Mistral AI联合创始人兼CEO Arthur Mensch(图源:TechCrunch)

    开源路线是卖点,也是筹码

    Mistral 2023年成立,口号挺响——”把前沿AI交到每个人手里”。跟OpenAI、Anthropic那种把模型捂得严严实实的路子不同,Mistral走的是开源权重路线,几个基础大语言模型直接放出来,谁想定制随便改。

    当然它也没全开源,闭源模型也在卖,主打编程、语音克隆生成、光学字符识别这些场景。这种”半开源”策略在欧洲挺吃香,尤其是现在欧洲各国都在跟美国科技巨头保持距离的时候。

    法国最近都在 ditch Windows 换 Linux 了,减少对美国技术的依赖。Mistral适时把自己包装成”主权AI”的本土替代方案,这步棋走得准。

    欧洲各国政府买单了

    Mistral已经在巴黎附近建数据中心了,钱是去年3月融的8.3亿欧元债务。合作名单也挺好看:法国军方、卢森堡政府、ASML、欧洲防务AI公司Helsing——都是欧洲本地的”大客户”。

    这跟美国那边的打法不一样。OpenAI、Anthropic的企业客户遍布全球,营收规模和高管需求把估值顶到了天上去。Mistral目前的营收数据外界不太清楚,但估值涨成这样,投资方肯定是看到了什么。


    估值翻倍,钱够烧吗?

    40亿美元总融资,对标OpenAI的1860亿,差距不是一点半点。AI这行的烧钱速度快得离谱,算力、数据、人才,每一项都是天价。Mistral选的时机也有意思——正值欧洲”AI主权”情绪高涨,各国政府愿意掏钱支持本土选手。

    但估值200亿欧元这个数字,最终能不能站稳,还得看它能不能把模型做到真正跟美国巨头抗衡,以及能不能在欧洲之外打开市场。目前Mistral的模型口碑还不错,尤其是在开源社区里,但企业客户的买单意愿——尤其是美国企业——还是一个问号。

    这轮融资还在早期谈判阶段,条款随时可能变。Mistral拒绝置评,Bloomberg的匿名信源消息准确到哪一步,也得等官方宣布才知道。


  • 微软悄悄限制了Claude Fable,原因跟数据有关

    Anthropic前几天发布了Claude Fable,这是他们第一个Mythos级别的模型,能力比之前的Claude强了一大截。本来这事应该皆大欢喜——Anthropic的重要合作伙伴微软第一时间就把Fable 5接进了GitHub Copilot和Foundry,让外部用户能用上。

    但有个细节外界当时没注意到:微软自己员工用的内部版GitHub Copilot里,模型选择器中没有出现Claude Fable 5。

    微软总部大楼
    微软正在内部评估Claude Fable 5的数据留存政策(图源:The Verge)

    问题出在数据存储上

    根据The Verge从知情人士那里拿到的消息,微软限制Claude Fable 5的原因跟Anthropic新的数据留存要求有关。

    之前的所有Claude模型都遵循”零数据留存”(ZDR)规则——你的提示词和AI的回答不会被Anthropic保存。但Fable 5不一样,它需要数据留存才能运行Anthropic新的一套安全分类器。这意味着Anthropic会保留用户的提示词和输出内容,30天后再删除。

    如果某些内容被标记违反了Anthropic的使用政策,这些数据甚至可能被保存长达两年。

    对于微软这样的大公司来说,员工跟AI聊天时难免涉及客户数据或内部机密信息。如果这些信息会被第三方保留30天甚至两年,法务部门很难点头。

    微软法务还在评估

    据了解,微软已经告知员工,法务团队正在评估Anthropic数据留存要求的变化。目前还不清楚法务会不会最终批准Claude Fable用于内部使用。

    有意思的是,微软对其他所有Claude模型没有限制,因为它们仍然遵循零数据留存规则。被卡住的只有Fable 5——偏偏是Anthropic目前最强的模型。

    微软拒绝对此事发表评论。但知情人士透露,主要的担忧集中在客户数据和机密信息泄露风险上。

    这事儿背后有个更大的背景

    Claude Fable 5是Anthropic Mythos级模型的首次大规模公开发布。就在几周前,Anthropic还公开表示这个级别的模型在网络安全任务上的能力太强,公开发布过于危险。

    后来Anthropic加了一系列提示词防护措施,才觉得可以发了。但也正是这些安全防护措施,带来了数据留存的需求——Anthropic需要拿用户的实际使用情况来训练和验证这些安全分类器。


    AI公司的两难

    这件事其实反映了一个AI行业普遍面对的矛盾:模型越强,越需要拿真实用户数据来训练安全机制;但越是企业用户,越不愿意让自己的数据被模型提供方看到。

    Anthropic选择用数据留存来换安全,微软选择暂时不让员工用最新模型。两边都有道理,但夹在中间的是那些想用最强工具的开发者。

    目前GitHub Copilot和Foundry的用户仍然可以使用Claude Fable 5——微软只是限制了内部员工的使用。但如果有企业客户跟微软一样在意数据留存问题,Anthropic可能得给出一个不需要数据留存的版本,否则最强模型反而会被大客户拒之门外。

    这事最后怎么解决,取决于微软法务的评估结论。但无论如何,它提醒了整个行业:AI安全问题不只是模型会不会干坏事,还包括用户数据在被用来训练安全机制时,到底安不安全。

  • DoorDash上线AI点单助手,说话、拍照就能把菜买好、把饭点到

    外卖点餐这件事,说方便也方便,说麻烦也挺麻烦。你知道自己想吃啥,但就是找不到——翻了20家餐厅,还是不知道点哪个。买菜更不用说了,看着食谱里的食材清单,一样一样手动搜,搜完还得核对冰箱里还有没有。

    DoorDash这周干了件事:给app里塞了一个AI聊天机器人,叫”Ask DoorDash”。你不用再翻菜单翻到眼花,直接跟它说人话就行。

    DoorDash AI聊天机器人界面演示
    DoorDash AI聊天机器人可以识别食谱照片并自动添加食材到购物车(图源:DoorDash)

    怎么用?说一句话就行

    传统的搜索框要求你知道自己要找什么——确切的餐厅名、确切的菜名。Ask DoorDash反过来,专门对付”我不知道吃什么”的时刻。

    你可以跟它说:”帮我找点适合全家四口人的饱腹晚餐。”它会弹出一批餐厅,每个都附上一小段推荐理由,解释为什么匹配你的需求。不满意?继续说:”要适合小孩的素食餐厅,口味清淡一点的。”它就帮你筛选。

    传统搜索在你明确知道目标时很好用,Ask DoorDash要解决的,是那些你根本不知道自己想要什么的时刻。

    买菜更省事,拍张照片就搞定

    点外卖只是开胃菜,真正有意思的是买菜功能。你把食谱链接扔给它,或者拍一张食谱书的照片、手写购物清单的照片,它就帮你把所需食材一样一样加到购物车里,分量也帮你算好。

    加完之后它还会多问一句:糖、黄油这些基础食材你家里还有吗?免得你重复购买。这个细节做得挺贴心。

    你还可以让它根据你之前的订单推荐商品,或者把上次的购物车重新下单——对于经常买同样东西的人来说,这功能省了不少时间。

    订座也能聊

    DoorDash这几年悄悄做了一件很多人没注意到的事:它不只是外卖平台了,还在做餐厅预订。Ask DoorDash现在也能帮你找座位。

    你说:”帮我找市中心适合约会的两人位,晚上8点左右。”它就把有空位的餐厅列出来。想要更私密的氛围?再补充一句,它继续帮你筛。


    这事儿不只是DoorDash在干

    把AI塞进购物流程里,DoorDash不是第一家。Uber Eats今年2月就推出了”购物车助手”,用AI帮你建杂货购物车。Instacart也更早之前上线了AI购物助手,还让合作的杂货商也能用。

    大家都在赌同一件事:AI助手会成为日常生活的标准配置。你不用学怎么用,直接说话就行——这对不爱折腾的中老年用户尤其友好。

    DoorDash说这个功能先在iOS上向部分地区用户推出,覆盖餐厅搜索和买菜,接下来几周会扩展到全美更多用户。免费还是付费?目前看是免费的,毕竟目的是让你多点几单,不是再收你一笔订阅费。

    实际用起来怎么样,还得等用户反馈。AI推荐出错、理解偏了,都是大概率会发生的事情。但方向是对的——点餐这件事,本来就应该更像跟朋友推荐,而不是填表格。

  • 【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    Open WebUI

    Open WebUI – 自托管 AI 聊天界面

    📦 项目简介

    Open WebUI 是一个用户友好的自托管 AI 界面,支持 Ollama、OpenAI API 等多种 LLM 服务,可完全离线运行。它提供了类似 ChatGPT 的优雅聊天体验,同时保障数据隐私,是企业和个人部署本地 AI 能力的首选前端方案。

    ⭐ 142K+ Stars
    🍴 20.3K+ Forks
    🐍 Python + Svelte
    📦 Docker 一键部署

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.11(pip 安装方式必须使用此版本)
    • Docker(推荐,最简单)
    • Ollama(如需本地模型,可选)
    • 磁盘空间:至少 2GB(含依赖和模型)

    方式一:Docker 安装(推荐)

    # 基础安装(Ollama 在本地)

    docker run -d -p 3000:8080 \
      –add-host=host.docker.internal:host-gateway \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:main

    # 内置 Ollama(CPU)

    docker run -d -p 3000:8080 \
      -v ollama:/root/.ollama \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:ollama

    方式二:Python pip 安装

    pip install open-webui
    open-webui serve

    ⚠️ 注意:必须使用 Python 3.11,避免兼容性问题!

    安装完成后访问 http://localhost:8080 即可使用。

    ✨ 核心功能

    🤖 1. 多模型兼容

    原生支持 Ollama、OpenAI 兼容 API,可对接 LMStudio、GroqCloud、Mistral、OpenRouter 等第三方服务。支持同时调用多个模型,获取最优输出结果。

    📚 2. RAG 检索增强生成

    支持 9 种向量数据库(ChromaDB、PGVector、Qdrant 等),多种内容提取引擎。可上传文档到知识库,通过 # 命令快速调用文档内容,打造私人知识助手。

    🔍 3. 联网搜索能力

    支持 15+ 搜索引擎(SearXNG、Google PSE、Brave Search 等)的 RAG 联网搜索,可直接输入 URL 引用网页内容到对话中,让 AI 获取实时信息。

    🎨 4. 多模态交互

    支持语音/视频通话,集成多种语音转文字、文字转语音引擎。支持图像生成与编辑,可对接 DALL-E、Gemini、ComfyUI、AUTOMATIC1111 等引擎。

    🔧 5. 企业级管理能力

    支持基于角色的访问控制(RBAC)、LDAP/AD 认证集成、SSO 单点登录。数据库支持 SQLite 和 PostgreSQL,存储可对接 S3、Azure Blob,支持水平扩展。

    🚀 典型使用场景

    场景一:个人本地 AI 助手

    搭配 Ollama 使用,在本地运行 Llama 3、Mistral、Gemma 等开源模型。所有对话数据完全离线,保障隐私安全。无需联网,随时随地使用 AI 助手。

    场景二:企业内网 AI 中台

    通过 Open WebUI 搭建企业内部 AI 平台,对接公司私有 LLM API 或本地部署的开源模型。支持用户权限管理、对话历史保存、知识库共享,让团队成员安全高效地使用 AI。

    场景三:RAG 知识库问答

    上传公司文档、技术手册、FAQ 到 Open WebUI 知识库,即可通过对话快速检索相关内容。支持 PDF、Word、Markdown 等多种格式,结合 RAG 技术实现精准问答。

    💡 推荐理由

    Open WebUI 是我见过最优雅的自托管 AI 界面。如果你在本地用 Ollama 跑模型,或者想给企业搭一个私有的 AI 聊天平台,Open WebUI 几乎是不二之选

    它的体验非常接近 ChatGPT——响应式界面、Markdown 渲染、代码高亮、多会话管理,一应俱全。但更重要的是数据主权:你可以让所有 AI 交互发生在自己的服务器上,不用担心对话记录被第三方留存。

    另外,它的 RAG 知识库联网搜索功能非常实用,让本地模型也能获取实时信息和私有文档内容。如果你关心 AI 隐私和数据安全,Open WebUI 值得一试。

  • 智谱GLM-5.2发布:MIT协议全面开源,跑分对标Opus 4.5

    从5.0到5.2,智谱只用了四个月

    智谱GLM-5.2开源AI模型
    开源AI模型正在快速追赶闭源商业模型

    2026年2月,智谱发布GLM-5,当时打出的旗号是”从Vibe Coding到Agentic Engineering”,代码和工程上下文能力被放到了最前面。不到三个月,5.1来了,主打智能体。又过了一个多月,5.2在6月13日凌晨推送,这次的亮点不是能力升级这么简单——是所有用户免费、API接口开放、模型权重以MIT协议全面开源。

    MIT协议意味着什么?简单说,你拿这个模型做任何事情,包括把它塞进你的商业产品里去卖钱,都不用给智谱交一分钱,只需要保留版权声明,不用开源你自己的代码。这是开源协议里最宽松的一种。

    智谱选择MIT协议开源GLM-5.2,等于把这个模型的使用权交给了所有人。开发者没有使用限制,可以用任何方式部署。

    跑分到底怎么样?

    消息发布几个小时后,已经有用户在社交平台上反馈:”跑分和Opus 4.5差不多,速度也够。”Opus 4.5是Anthropic的旗舰模型,能做到”跑分差不多”这个水平,加上MIT协议开源,这件事的意义不只是智谱又发了一个新模型。

    它意味着开源生态正在缩小与闭源商业模型之间的差距,而且缩小的速度比很多人预期的要快。几个月前,大家还在讨论开源模型能不能追上GPT-4级别的能力;现在,GLM-5.2已经把目标对准了Opus 4.5。

    开源之后的玩法变了

    智谱不是第一家把大模型开源的公司,但它是少数几家既做得出有竞争力的模型、又愿意用最宽松的协议开源的公司之一。Meta的Llama系列也是开源的,但Meta的开源带着自己的算盘——通过开源建立生态,巩固自己的地位。智谱的MIT协议,没有这些附加条件。

    这对开发者来说是个好消息。以前要用上Opus级别的能力,每月至少要掏几十美元订阅Claude;现在,懂一点部署的人可以把GLM-5.2跑在自己的服务器上,成本只是显卡和电费。

    当然,开源不等于每个人都能用上。部署一个大模型需要不少算力和技术门槛,这不是普通用户点个按钮就能搞定的事。但门槛在降低,这是确定的。智谱同时发布了ZCode 3.0,每天给300万token的免费额度,就是为了让更多人能直接体验到GLM-5.2的能力。

    从2月的5.0到6月的5.2,智谱的迭代节奏很快。这种速度能不能持续,模型能力能不能稳定地往上走,还需要更多时间验证。但至少现在,开源AI的版图里,又多了一个不能忽视的名字。


  • 前a16z合伙人发飙:硅谷富豪正在用钱堵住AI监管的嘴

    一个风投老人的”反水”

    AI监管讨论
    AI监管走向,谁说了算?

    约翰·奥法雷尔在安德森·霍洛维茨(a16z)干了七年,今年1月离开的时候,大概率没想到自己会在《纽约时报》上公开骂老东家。

    他写的那篇专栏,核心意思很直接——他的前同事们正在用巨额财富压制关于人工智能监管的公开讨论。”人工智能不只是另一种技术,”他写道,”它可能把生产力推到新高度,也可能让数百万人的工作被自动化取代;它可能找到癌症的治愈方法,也可能加速我们还没准备好应对的生物风险;它可能改变孩子的学习方式,也可能让他们分不清真假;它还可能以让’镀金时代’都相形见绌的方式,把经济权力集中到极少数人手里。”

    “我们需要一场严肃的公共讨论:如何让AI造福所有人,而不是仅为少数富人服务。但眼下,这场讨论正被有钱人的噪音盖住。”

    钱是怎么堵住嘴的

    奥法雷尔没有直接点名所有目标,但字里行间指向的,是那些正在用政治捐款、游说和法律手段把AI监管挡在门外的人。a16z本身就是AI领域最活跃的投资机构之一,它的合伙人本就是这场游戏里的核心玩家。一个前合伙人跳出来批评,多少有点”盗号”的意思——但也正因如此,他的话才值得听。

    这话出来的时机也值得玩味。眼下正是AI监管在全球范围内最关键的时间窗口——欧盟的AI法案已经开始落地,美国的监管方向却因为政治周期而充满变数。硅谷的科技巨头们很清楚,现在如果不把监管的口子堵住,等舆论和立法跟上来,就晚了。

    良心觉醒,还是另一次自我营销?

    奥法雷尔没有在这篇文章里给出具体的监管方案,他的目的更像是在敲警钟:别让几个人的财富决定了所有人的未来。这话从一个刚从硅谷核心投资机构出来的人口里说出来,分量不一样。

    当然,也会有人质疑他的动机。离开a16z之后,他是不是在借攻击老东家来建立自己的公众形象?这很难说。但不管动机如何,他提出的核心问题——AI的走向到底由谁决定——是真实存在的。

    这篇文章在《纽约时报》发表之后,科技圈的讨论并不算多。可能是因为周末,也可能是因为大家不知道该怎么接这个话。一个前a16z合伙人的批评,到底是良心的觉醒,还是另一次的自我营销,可能只有他自己知道。但可以肯定的是,AI监管这个话题,不会因为他这篇文章就变得简单。


  • 苹果AI照片编辑工具:好用,但让人困惑什么叫照片

    WWDC 2026上苹果给了iPhone用户三件新玩具:AI清理、AI扩展画幅、还有个听起来很玄乎的”空间重新构图”。官方演示看得人心痒,但实际用起来怎么样?我花了一周时间折腾iOS 27开发者测试版,说说真实感受。

    苹果AI照片编辑工具演示
    iOS 27 的 AI 照片编辑工具,好用,但也有点让人不安(图源:The Verge)

    清理工具终于能用了

    先说最实用的——清理工具。这个东西其实去年就有了,但去年的版本说难听点就是个摆设。它只在设备端跑模型,算力有限,移除一个路人之后,补出来的背景经常怪得离谱,有时候干脆留一块马赛克一样的色块。我当时试了几次就放弃了。

    今年苹果做了个关键升级:清理工具现在可以调用云端更强的模型了。这个打法其实谷歌Pixel很早就在用,人家Magic Editor一直比苹果能打,核心原因就是云端算力和设备端算力的差距。苹果终于想通了。

    实测下来,清理2.0确实能打了。孩子鼻子上沾了东西?修掉。背景里有个路人抢镜?去掉。处理完你看不出明显破绽,这就够了。这个功能我估计会是iOS 27里使用率最高的AI特性,没有之一。

    扩展画幅,比想象中克制

    第二个功能是”扩展”——你可以把它理解成反向裁剪。拍的照片构图太紧,主体快贴边了,以前只能裁小,现在可以用AI往外”撑”一点,让画面松快些。

    苹果在这个功能上出奇地克制。它不会像三星早期那样疯狂脑补画面外的内容,而是找对称性、延续纹理,能不加就不加。我试了几次,它会在边桌上”脑补”出一盆植物,看起来挺像那么回事,但我知道那张桌子原来没有盆栽。

    克制是好事。但如果我把这张照片发到朋友圈,我自己知道那是AI补的,别人不知道——这个问题,苹果也没给出答案。


    最野心也最让人困惑的:空间重新构图

    第三个功能叫”空间重新构图”,是我觉得最有意思也最”危险”的一个。它利用了照片中的深度信息,让你像移动相机一样,微调拍摄视角。比如你拍的时候站得偏了,主体被挡了一点,现在可以”虚拟移动”一下,换个角度看看能不能救回来。

    想法很好,但执行起来问题不少。AI需要脑补你没拍到的部分——就像你拍了一张侧面的合影,AI要帮你”猜”被挡住的那个人长什么样。离原拍摄位置越远,AI需要脑补的内容就越多,画面就越容易进入”恐怖谷”。

    我试了一张自拍,用空间重新构图微调角度,结果我自己的脸看起来有点歪,说不上来哪里不对,就是”不像真的”。这种感觉很微妙——照片里的人是你,但又不完全是你。

    有一个细节值得说:用这些AI工具编辑过的照片,会被打上一个”Synth ID”标签,标明这张照片被AI动过。但这个信息藏得很深,要在Instagram里点开照片的”AI信息”菜单才能看到。而且,大多数人刷朋友圈的时候,不会去点那个菜单。

    我们在失去什么

    iOS 27的这些AI编辑工具,单看每个都挺好用。但把它们放在一起看,有一个更大的问题浮出来了:我们以前默认”手机拍的照片是真的”,这个默认信任,正在被一点点吃掉。

    苹果不是最大胆的玩家,谷歌和三星走得更快。但苹果的用户基数太大了,一旦这些功能随着iPhone普及开来,”照片可以被AI随意改写”这件事,就会从”少数人的玩具”变成”所有人的日常”。到那时候,我们再看别人发的照片,第一反应会是”这是真的还是AI修过的”?

    这个问题没有简单答案。但至少,苹果给了你一个工具——那个藏得很深的”AI信息”标签。用不用,怎么用,是你自己的选择。