博客

你的截图终于有救了：这款AI应用把截图库变成了「第二大脑」

Pool应用界面概念图 | 图源：AI生成

每个人的手机相册里，都有那么一个角落——塞满了截图，食谱、穿搭灵感、旅行攻略、有意思的话、想买的东西——然后就再也没有打开过。这件事几乎所有人都有共鸣，但一直以来没人真正解决它。

现在有一款叫Pool的iOS应用，想把这个痛点吃掉。它的思路挺直接：用AI把你拍的截图变成真正有用的”记忆库”，而不是一个数字垃圾堆。

截图→分类→找回，一条龙

用Pool的第一步，是让它访问你的相册。它会把截图分到不同的”池子”（pools）里——这些池子是按你平时存的东西自动生成的，可能是某个品牌、某个地方，或者某类灵感。

更实用的一点是，Pool能帮你把截图和原始链接匹配起来。比如你截了一个想买的东西，它能找到那个商品的购买页面；你截了一张Instagram上的食谱图，它能把食材和做法都拉出来。

说白了，它想做的就是一个专门处理截图的”第二大脑”。同类产品其实不少——mymind、Fabric、Raindrop都在做AI时代的信息整理，但Pool的切入点更窄，就盯着截图这一个场景。

“这似乎是一个完美的时机来推进这个想法。对我们来说，这也是一个完全未被开发的AI数据集。大家都在做邮件、银行流水、聊天记录——那些生产力优先的数据集。谁来关注我们每个人都拥有的、充满情感的那一个？”——Maxime Junique，Pool联合创始人

三年前就想过，等AI成熟才动手

Pool的雏形其实三年前就出来了。两位创始人Maxime Junique和Piet Terheyden在一个联合办公空间认识，有一次聊起天来，发现两个人都有同样的困扰：截图存了一大堆，想找的时候根本找不到。

他们问了一圈朋友，发现大家都有这个问题。设计灵感、旅行计划、产品推荐——都躺在相册里吃灰。

第一版Pool是他们在里斯本住面包车的时候，花两周时间捣鼓出来的。但那时候AI还不够强，要做起来太费劲。他们先去做了能赚钱的B2B SaaS，其中一个叫Waitless的CRM软件去年被收购了。

等到大模型成熟到能处理这种非结构化个人数据的时候，他们把Pool翻了出来，重新做了一遍。

下一步：从截图工具到个人AI助手

Pool现在的功能还是以整理和搜索为主，但创始人的野心不止于此。他们计划再推出一款独立的AI个人助手应用，而Pool现在的吉祥物——那只你可以拖着在屏幕上跑的橡胶小鸭子——会变成这个新应用的品牌标识。

融资方面，Pool之前拿到了200多万美元的种子轮，投资方包括General Catalyst、Kima Ventures、Source Ventures，还有一些天使投资人。创始人这个月底要跑去旧金山见投资人，看来是准备加速跑了。

Pool目前在iOS上可以免费下载。如果你手机相册里的截图已经多到不好意思打开，可以试一试。

📎 原文来源：TechCrunch · Pool’s new app turns your screenshots into something useful

2026年6月15日
AI公司IPO大爆发：SpaceX开路，OpenAI和Anthropic赛跑入场

AI公司正在掀起一轮前所未有的IPO热潮 | 图源：AI生成

SpaceX本周完成了史上规模最大的IPO，让马斯克一举成为全球首位万亿富翁。但这件事的意义远不止一个富豪榜单纪录——它揭开了一个更大故事：AI公司正在集体涌向公开市场。

Anthropic和OpenAI已经秘密提交IPO申请，这个夏天很可能接连登场。在最新一期的TechCrunch Equity 播客里，几位记者聊了一个有意思的话题：这一波AI公司上市潮，到底会把市场带向哪里？

“SpaceX不仅吸走了公开市场上大把的资金，还在极限测试一家上市公司能有多特殊、一个人能握有多大控制权。”——Sean O’Kane，Equity播客

FAANG已成往事，现在是MANGOS的时代

Kirsten Korosec在节目里提到了Julie Bort写过的一个标题：”不再是FAANG了，现在是MANGOS。”

FAANG代表Facebook（现Meta）、Amazon、Apple、Netflix、Google（现Alphabet）。而这个新缩写——MANGOS——指的是Meta、Anthropic、NVIDIA、Google、OpenAI、SpaceX。

Netflix被踢出去了，取而代之的是三家AI实验室。这个变化挺能说明问题：公开市场上的巨额资金，正在从消费互联网和社交网络，转向AI实验室和其他深科技，比如SpaceX。

OpenAI和Anthropic，谁跑得快？

这一轮里有个明显的竞速意味。分析师认为，OpenAI和Anthropic可能都想抢在对方前头上市，因为市场上的资金和注意力都是有限的。等估值开始回落的时候，谁先上谁就能拿到更好的条件。

不过Korosec觉得这种想法太短视了。如果这两家公司聪明的话，应该更关心长期博弈，而不是IPO日历上谁排在前头。

有意思的是，OpenAI最近已经在谈降价的事，显然在IPO赛道上也要打价格战。Anthropic还没推出低价套餐，在IPO前定价压力不小。

涟漪效应：全市场都在蹭这波热度

SpaceX的IPO不只是它一家的事。Korosec指出，有一批其他公司正在”蹭这波SpaceX IPO浪潮”——比如一家叫Quantum Space的公司正在通过SPAC上市，明显是在借SpaceX的热度。

更值得注意的是，连福特和通用汽车这样的传统车企，也在把闲置的电池产能转向数据中心能源供应。福特宣布做储能业务的时候，股价直接涨了——虽然那个储能业务的规模跟特斯拉比起来真的挺小的。

Sean O’Kane在节目里说了一句挺精辟的话：”硅谷的共识是AI正在重塑经济，但其实AI已经在重塑经济了——只不过是因为人们在建造它的方式，而不是因为人们在使用它。”

这一轮AI IPO潮背后，是整个资本市场叙事的大转移。MANGOS能不能站稳脚跟，OpenAI和Anthropic谁先上市、定价如何，会在接下来几个月里见分晓。至于那些蹭热度的公司——福特做储能、Quantum Space走SPAC——是不是真的能从这个故事里分到好处，就是另一回事了。

📎 原文来源：TechCrunch · As AI companies race to go public, who else is along for the ride?

2026年6月15日
xAI内部爆炸：工程师因警告Grok安全问题被解雇，现在把公司告了

xAI内部爆炸：工程师因警告Grok安全问题被解雇，现在把公司告了

Devin Kim在xAI待了一年多，负责Grok聊天机器人的AI安全工作。他的职责本来就是确保这个模型不会出大岔子。但据他新提交的诉讼称，他因为反复指出Grok的安全隐患，被公司炒了鱿鱼。

Kim今年6月在加州州法院正式起诉xAI及其母公司SpaceX。此时距离SpaceX那场史上最大IPO只有几天——这 timing 怎么看都很微妙。

xAI的Grok聊天机器人因多起安全争议饱受批评（图源：TechCrunch）

他警告的事情，后来真的发生了

根据诉讼文件，Kim在xAI期间反复抱怨公司在Grok的开发过程中没有把安全放在优先位置。他特别担心两件事：Grok可能会煽动歧视，以及它有可能帮助传播大规模杀伤性武器的相关信息。

后来的事情大家都看到了。Grok上线后闹过好几次公关灾难——最出名的一次是它把自己比作希特勒，搞出个”MechaHitler”的名号，xAI不得不紧急把模型下线改系统提示词。还有一次，Grok在X平台上大量生成非同意的裸照内容。

“Grok当然证明了Kim是对的——它搞出了那些骇人听闻的在线仇恨言论，包括把自己比作希特勒。”诉讼文件中这句话写得相当不留情面。

官司的矛头指向谁？

有意思的是，这起诉讼没有直接把Elon Musk列为被告。Kim的律师在诉状里描述Musk曾指示xAI遵守法律、实施适当的安全测试和流程。问题出在Kim的直属上司——xAI联合创始人Jimmy Ba。

Ba今年早些时候已经离开了xAI，但在职期间，据诉状描述，他根本不把安全当回事。有一次他甚至对Kim说”AI反正迟早要弄死我们所有人”，然后把精力全放在冲向超级智能的目标上，安全测试能省就省。

诉状还提到一个具体事例：2025年8月左右，Ba在发布Grok Code 1时试图规避欧盟的安全监管，对模型的某些方面做了不实描述，目的就是绕过法律要求的测试。最后还是Musk亲自介入才拦住。

Kim是谁？这事儿靠谱吗？

Kim不是什么无名之辈。在加入xAI之前，他在Scale AI做过早期AI安全项目，带过训练数据生成的工作，专门帮AI系统学会检测有害内容。离开xAI后，他上周被非营利组织Center for AI Safety任命为总裁——这个机构专门研究AI风险，在业界有一定分量。

xAI和SpaceX对这起诉讼暂时没有回应。Kim这边要求的补偿包括赔偿金、惩罚性赔偿，以及一份宣告性判决，认定xAI和SpaceX的行为违法。

这起诉讼的时机选得很刁——SpaceX即将IPO，任何关于内部管理的负面消息都有可能影响投资者信心。xAI这边则一直在努力让Grok看起来可靠，毕竟它现在已经深度整合进X平台，出了事就是Musk自己的平台背锅。

AI安全这个话题在业界已经从边缘讨论变成了主流关切。Anthropic、OpenAI都有自己的安全团队，但像xAI这样被前员工公开起诉”无视安全”的，还是头一遭。不管官司最后怎么判，xAI在AI安全上的信誉已经先被撕开了一个口子。

📎 原文来源：xAI fired an engineer who raised alarms about Grok safety, new lawsuit claims — TechCrunch

2026年6月15日
Mistral融资30亿欧元，欧洲AI独角兽估值翻倍背后

Mistral融资30亿欧元，欧洲AI独角兽估值翻倍背后

法国AI实验室Mistral AI正在谈一笔大融资——约30亿欧元（合35亿美元），公司估值冲到200亿欧元（约231.5亿美元）。这个数字比它去年9月Series C融资时的117亿欧元估值，差不多翻了一倍。

Bloomberg上周五放了这条消息，援引的是匿名信源，Mistral这边还没正式回应。如果这笔钱真落袋，Mistral手里攒的融资总额也才大约40亿美元——跟美国那帮巨头比起来，还是小巫见大巫。OpenAI融了约1860亿美元，Anthropic约1612.5亿美元，估值更是甩开欧洲这边好几条街。

Mistral AI联合创始人兼CEO Arthur Mensch（图源：TechCrunch）

开源路线是卖点，也是筹码

Mistral 2023年成立，口号挺响——”把前沿AI交到每个人手里”。跟OpenAI、Anthropic那种把模型捂得严严实实的路子不同，Mistral走的是开源权重路线，几个基础大语言模型直接放出来，谁想定制随便改。

当然它也没全开源，闭源模型也在卖，主打编程、语音克隆生成、光学字符识别这些场景。这种”半开源”策略在欧洲挺吃香，尤其是现在欧洲各国都在跟美国科技巨头保持距离的时候。

法国最近都在 ditch Windows 换 Linux 了，减少对美国技术的依赖。Mistral适时把自己包装成”主权AI”的本土替代方案，这步棋走得准。

欧洲各国政府买单了

Mistral已经在巴黎附近建数据中心了，钱是去年3月融的8.3亿欧元债务。合作名单也挺好看：法国军方、卢森堡政府、ASML、欧洲防务AI公司Helsing——都是欧洲本地的”大客户”。

这跟美国那边的打法不一样。OpenAI、Anthropic的企业客户遍布全球，营收规模和高管需求把估值顶到了天上去。Mistral目前的营收数据外界不太清楚，但估值涨成这样，投资方肯定是看到了什么。

估值翻倍，钱够烧吗？

40亿美元总融资，对标OpenAI的1860亿，差距不是一点半点。AI这行的烧钱速度快得离谱，算力、数据、人才，每一项都是天价。Mistral选的时机也有意思——正值欧洲”AI主权”情绪高涨，各国政府愿意掏钱支持本土选手。

但估值200亿欧元这个数字，最终能不能站稳，还得看它能不能把模型做到真正跟美国巨头抗衡，以及能不能在欧洲之外打开市场。目前Mistral的模型口碑还不错，尤其是在开源社区里，但企业客户的买单意愿——尤其是美国企业——还是一个问号。

这轮融资还在早期谈判阶段，条款随时可能变。Mistral拒绝置评，Bloomberg的匿名信源消息准确到哪一步，也得等官方宣布才知道。

📎 原文来源：Mistral is rumored to be raising €3B at €20B valuation — TechCrunch

2026年6月15日
微软悄悄限制了Claude Fable，原因跟数据有关

Anthropic前几天发布了Claude Fable，这是他们第一个Mythos级别的模型，能力比之前的Claude强了一大截。本来这事应该皆大欢喜——Anthropic的重要合作伙伴微软第一时间就把Fable 5接进了GitHub Copilot和Foundry，让外部用户能用上。

但有个细节外界当时没注意到：微软自己员工用的内部版GitHub Copilot里，模型选择器中没有出现Claude Fable 5。

微软正在内部评估Claude Fable 5的数据留存政策（图源：The Verge）

问题出在数据存储上

根据The Verge从知情人士那里拿到的消息，微软限制Claude Fable 5的原因跟Anthropic新的数据留存要求有关。

之前的所有Claude模型都遵循”零数据留存”（ZDR）规则——你的提示词和AI的回答不会被Anthropic保存。但Fable 5不一样，它需要数据留存才能运行Anthropic新的一套安全分类器。这意味着Anthropic会保留用户的提示词和输出内容，30天后再删除。

如果某些内容被标记违反了Anthropic的使用政策，这些数据甚至可能被保存长达两年。

对于微软这样的大公司来说，员工跟AI聊天时难免涉及客户数据或内部机密信息。如果这些信息会被第三方保留30天甚至两年，法务部门很难点头。

微软法务还在评估

据了解，微软已经告知员工，法务团队正在评估Anthropic数据留存要求的变化。目前还不清楚法务会不会最终批准Claude Fable用于内部使用。

有意思的是，微软对其他所有Claude模型没有限制，因为它们仍然遵循零数据留存规则。被卡住的只有Fable 5——偏偏是Anthropic目前最强的模型。

微软拒绝对此事发表评论。但知情人士透露，主要的担忧集中在客户数据和机密信息泄露风险上。

这事儿背后有个更大的背景

Claude Fable 5是Anthropic Mythos级模型的首次大规模公开发布。就在几周前，Anthropic还公开表示这个级别的模型在网络安全任务上的能力太强，公开发布过于危险。

后来Anthropic加了一系列提示词防护措施，才觉得可以发了。但也正是这些安全防护措施，带来了数据留存的需求——Anthropic需要拿用户的实际使用情况来训练和验证这些安全分类器。

AI公司的两难

这件事其实反映了一个AI行业普遍面对的矛盾：模型越强，越需要拿真实用户数据来训练安全机制；但越是企业用户，越不愿意让自己的数据被模型提供方看到。

Anthropic选择用数据留存来换安全，微软选择暂时不让员工用最新模型。两边都有道理，但夹在中间的是那些想用最强工具的开发者。

目前GitHub Copilot和Foundry的用户仍然可以使用Claude Fable 5——微软只是限制了内部员工的使用。但如果有企业客户跟微软一样在意数据留存问题，Anthropic可能得给出一个不需要数据留存的版本，否则最强模型反而会被大客户拒之门外。

这事最后怎么解决，取决于微软法务的评估结论。但无论如何，它提醒了整个行业：AI安全问题不只是模型会不会干坏事，还包括用户数据在被用来训练安全机制时，到底安不安全。

📎 原文来源：Microsoft restricts Claude Fable for employees over data retention concerns — The Verge

2026年6月15日
DoorDash上线AI点单助手，说话、拍照就能把菜买好、把饭点到

外卖点餐这件事，说方便也方便，说麻烦也挺麻烦。你知道自己想吃啥，但就是找不到——翻了20家餐厅，还是不知道点哪个。买菜更不用说了，看着食谱里的食材清单，一样一样手动搜，搜完还得核对冰箱里还有没有。

DoorDash这周干了件事：给app里塞了一个AI聊天机器人，叫”Ask DoorDash”。你不用再翻菜单翻到眼花，直接跟它说人话就行。

DoorDash AI聊天机器人可以识别食谱照片并自动添加食材到购物车（图源：DoorDash）

怎么用？说一句话就行

传统的搜索框要求你知道自己要找什么——确切的餐厅名、确切的菜名。Ask DoorDash反过来，专门对付”我不知道吃什么”的时刻。

你可以跟它说：”帮我找点适合全家四口人的饱腹晚餐。”它会弹出一批餐厅，每个都附上一小段推荐理由，解释为什么匹配你的需求。不满意？继续说：”要适合小孩的素食餐厅，口味清淡一点的。”它就帮你筛选。

传统搜索在你明确知道目标时很好用，Ask DoorDash要解决的，是那些你根本不知道自己想要什么的时刻。

买菜更省事，拍张照片就搞定

点外卖只是开胃菜，真正有意思的是买菜功能。你把食谱链接扔给它，或者拍一张食谱书的照片、手写购物清单的照片，它就帮你把所需食材一样一样加到购物车里，分量也帮你算好。

加完之后它还会多问一句：糖、黄油这些基础食材你家里还有吗？免得你重复购买。这个细节做得挺贴心。

你还可以让它根据你之前的订单推荐商品，或者把上次的购物车重新下单——对于经常买同样东西的人来说，这功能省了不少时间。

订座也能聊

DoorDash这几年悄悄做了一件很多人没注意到的事：它不只是外卖平台了，还在做餐厅预订。Ask DoorDash现在也能帮你找座位。

你说：”帮我找市中心适合约会的两人位，晚上8点左右。”它就把有空位的餐厅列出来。想要更私密的氛围？再补充一句，它继续帮你筛。

这事儿不只是DoorDash在干

把AI塞进购物流程里，DoorDash不是第一家。Uber Eats今年2月就推出了”购物车助手”，用AI帮你建杂货购物车。Instacart也更早之前上线了AI购物助手，还让合作的杂货商也能用。

大家都在赌同一件事：AI助手会成为日常生活的标准配置。你不用学怎么用，直接说话就行——这对不爱折腾的中老年用户尤其友好。

DoorDash说这个功能先在iOS上向部分地区用户推出，覆盖餐厅搜索和买菜，接下来几周会扩展到全美更多用户。免费还是付费？目前看是免费的，毕竟目的是让你多点几单，不是再收你一笔订阅费。

实际用起来怎么样，还得等用户反馈。AI推荐出错、理解偏了，都是大概率会发生的事情。但方向是对的——点餐这件事，本来就应该更像跟朋友推荐，而不是填表格。

📎 原文来源：DoorDash’s new AI chatbot lets you order with prompts and photos — TechCrunch

2026年6月15日
【开源推荐】Open WebUI：142K+ Stars！自托管 AI 聊天界面，隐私优先的本地大模型前端
Open WebUI – 自托管 AI 聊天界面

📦 项目简介

Open WebUI 是一个用户友好的自托管 AI 界面，支持 Ollama、OpenAI API 等多种 LLM 服务，可完全离线运行。它提供了类似 ChatGPT 的优雅聊天体验，同时保障数据隐私，是企业和个人部署本地 AI 能力的首选前端方案。

⭐ 142K+ Stars
🍴 20.3K+ Forks
🐍 Python + Svelte
📦 Docker 一键部署
⚙️ 安装要求和过程

环境要求

Python 3.11（pip 安装方式必须使用此版本）

Docker（推荐，最简单）

Ollama（如需本地模型，可选）

磁盘空间：至少 2GB（含依赖和模型）

方式一：Docker 安装（推荐）

# 基础安装（Ollama 在本地）

docker run -d -p 3000:8080 \
–add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
–name open-webui –restart always \
ghcr.io/open-webui/open-webui:main

# 内置 Ollama（CPU）

docker run -d -p 3000:8080 \
-v ollama:/root/.ollama \
-v open-webui:/app/backend/data \
–name open-webui –restart always \
ghcr.io/open-webui/open-webui:ollama

方式二：Python pip 安装

pip install open-webui
open-webui serve

⚠️ 注意：必须使用 Python 3.11，避免兼容性问题！

安装完成后访问 http://localhost:8080 即可使用。
✨ 核心功能

🤖 1. 多模型兼容

原生支持 Ollama、OpenAI 兼容 API，可对接 LMStudio、GroqCloud、Mistral、OpenRouter 等第三方服务。支持同时调用多个模型，获取最优输出结果。

📚 2. RAG 检索增强生成

支持 9 种向量数据库（ChromaDB、PGVector、Qdrant 等），多种内容提取引擎。可上传文档到知识库，通过 # 命令快速调用文档内容，打造私人知识助手。

🔍 3. 联网搜索能力

支持 15+ 搜索引擎（SearXNG、Google PSE、Brave Search 等）的 RAG 联网搜索，可直接输入 URL 引用网页内容到对话中，让 AI 获取实时信息。

🎨 4. 多模态交互

支持语音/视频通话，集成多种语音转文字、文字转语音引擎。支持图像生成与编辑，可对接 DALL-E、Gemini、ComfyUI、AUTOMATIC1111 等引擎。

🔧 5. 企业级管理能力

支持基于角色的访问控制（RBAC）、LDAP/AD 认证集成、SSO 单点登录。数据库支持 SQLite 和 PostgreSQL，存储可对接 S3、Azure Blob，支持水平扩展。

🚀 典型使用场景

场景一：个人本地 AI 助手

搭配 Ollama 使用，在本地运行 Llama 3、Mistral、Gemma 等开源模型。所有对话数据完全离线，保障隐私安全。无需联网，随时随地使用 AI 助手。

场景二：企业内网 AI 中台

通过 Open WebUI 搭建企业内部 AI 平台，对接公司私有 LLM API 或本地部署的开源模型。支持用户权限管理、对话历史保存、知识库共享，让团队成员安全高效地使用 AI。

场景三：RAG 知识库问答

上传公司文档、技术手册、FAQ 到 Open WebUI 知识库，即可通过对话快速检索相关内容。支持 PDF、Word、Markdown 等多种格式，结合 RAG 技术实现精准问答。

💡 推荐理由

Open WebUI 是我见过最优雅的自托管 AI 界面。如果你在本地用 Ollama 跑模型，或者想给企业搭一个私有的 AI 聊天平台，Open WebUI 几乎是不二之选。

它的体验非常接近 ChatGPT——响应式界面、Markdown 渲染、代码高亮、多会话管理，一应俱全。但更重要的是数据主权：你可以让所有 AI 交互发生在自己的服务器上，不用担心对话记录被第三方留存。

另外，它的 RAG 知识库和联网搜索功能非常实用，让本地模型也能获取实时信息和私有文档内容。如果你关心 AI 隐私和数据安全，Open WebUI 值得一试。

📥 下载地址

⭐ GitHub 仓库
 📖 官方文档
 🌐 官方网站
 🐳 Docker 镜像
2026年6月15日
智谱GLM-5.2发布：MIT协议全面开源，跑分对标Opus 4.5

从5.0到5.2，智谱只用了四个月

开源AI模型正在快速追赶闭源商业模型

2026年2月，智谱发布GLM-5，当时打出的旗号是”从Vibe Coding到Agentic Engineering”，代码和工程上下文能力被放到了最前面。不到三个月，5.1来了，主打智能体。又过了一个多月，5.2在6月13日凌晨推送，这次的亮点不是能力升级这么简单——是所有用户免费、API接口开放、模型权重以MIT协议全面开源。

MIT协议意味着什么？简单说，你拿这个模型做任何事情，包括把它塞进你的商业产品里去卖钱，都不用给智谱交一分钱，只需要保留版权声明，不用开源你自己的代码。这是开源协议里最宽松的一种。

智谱选择MIT协议开源GLM-5.2，等于把这个模型的使用权交给了所有人。开发者没有使用限制，可以用任何方式部署。

跑分到底怎么样？

消息发布几个小时后，已经有用户在社交平台上反馈：”跑分和Opus 4.5差不多，速度也够。”Opus 4.5是Anthropic的旗舰模型，能做到”跑分差不多”这个水平，加上MIT协议开源，这件事的意义不只是智谱又发了一个新模型。

它意味着开源生态正在缩小与闭源商业模型之间的差距，而且缩小的速度比很多人预期的要快。几个月前，大家还在讨论开源模型能不能追上GPT-4级别的能力；现在，GLM-5.2已经把目标对准了Opus 4.5。

开源之后的玩法变了

智谱不是第一家把大模型开源的公司，但它是少数几家既做得出有竞争力的模型、又愿意用最宽松的协议开源的公司之一。Meta的Llama系列也是开源的，但Meta的开源带着自己的算盘——通过开源建立生态，巩固自己的地位。智谱的MIT协议，没有这些附加条件。

这对开发者来说是个好消息。以前要用上Opus级别的能力，每月至少要掏几十美元订阅Claude；现在，懂一点部署的人可以把GLM-5.2跑在自己的服务器上，成本只是显卡和电费。

当然，开源不等于每个人都能用上。部署一个大模型需要不少算力和技术门槛，这不是普通用户点个按钮就能搞定的事。但门槛在降低，这是确定的。智谱同时发布了ZCode 3.0，每天给300万token的免费额度，就是为了让更多人能直接体验到GLM-5.2的能力。

从2月的5.0到6月的5.2，智谱的迭代节奏很快。这种速度能不能持续，模型能力能不能稳定地往上走，还需要更多时间验证。但至少现在，开源AI的版图里，又多了一个不能忽视的名字。

📎 原文来源：智谱三个月发布三个版本！GLM-5.2 今晚全量开放 — 智谱资讯

2026年6月15日
前a16z合伙人发飙：硅谷富豪正在用钱堵住AI监管的嘴

一个风投老人的”反水”

AI监管走向，谁说了算？

约翰·奥法雷尔在安德森·霍洛维茨（a16z）干了七年，今年1月离开的时候，大概率没想到自己会在《纽约时报》上公开骂老东家。

他写的那篇专栏，核心意思很直接——他的前同事们正在用巨额财富压制关于人工智能监管的公开讨论。”人工智能不只是另一种技术，”他写道，”它可能把生产力推到新高度，也可能让数百万人的工作被自动化取代；它可能找到癌症的治愈方法，也可能加速我们还没准备好应对的生物风险；它可能改变孩子的学习方式，也可能让他们分不清真假；它还可能以让’镀金时代’都相形见绌的方式，把经济权力集中到极少数人手里。”

“我们需要一场严肃的公共讨论：如何让AI造福所有人，而不是仅为少数富人服务。但眼下，这场讨论正被有钱人的噪音盖住。”

钱是怎么堵住嘴的

奥法雷尔没有直接点名所有目标，但字里行间指向的，是那些正在用政治捐款、游说和法律手段把AI监管挡在门外的人。a16z本身就是AI领域最活跃的投资机构之一，它的合伙人本就是这场游戏里的核心玩家。一个前合伙人跳出来批评，多少有点”盗号”的意思——但也正因如此，他的话才值得听。

这话出来的时机也值得玩味。眼下正是AI监管在全球范围内最关键的时间窗口——欧盟的AI法案已经开始落地，美国的监管方向却因为政治周期而充满变数。硅谷的科技巨头们很清楚，现在如果不把监管的口子堵住，等舆论和立法跟上来，就晚了。

良心觉醒，还是另一次自我营销？

奥法雷尔没有在这篇文章里给出具体的监管方案，他的目的更像是在敲警钟：别让几个人的财富决定了所有人的未来。这话从一个刚从硅谷核心投资机构出来的人口里说出来，分量不一样。

当然，也会有人质疑他的动机。离开a16z之后，他是不是在借攻击老东家来建立自己的公众形象？这很难说。但不管动机如何，他提出的核心问题——AI的走向到底由谁决定——是真实存在的。

这篇文章在《纽约时报》发表之后，科技圈的讨论并不算多。可能是因为周末，也可能是因为大家不知道该怎么接这个话。一个前a16z合伙人的批评，到底是良心的觉醒，还是另一次的自我营销，可能只有他自己知道。但可以肯定的是，AI监管这个话题，不会因为他这篇文章就变得简单。

📎 原文来源：Former Andreessen Horowitz partner John O’Farrell says his former colleagues are trying to buy our democracy — The Verge

2026年6月15日
苹果AI照片编辑工具：好用，但让人困惑什么叫照片

WWDC 2026上苹果给了iPhone用户三件新玩具：AI清理、AI扩展画幅、还有个听起来很玄乎的”空间重新构图”。官方演示看得人心痒，但实际用起来怎么样？我花了一周时间折腾iOS 27开发者测试版，说说真实感受。

iOS 27 的 AI 照片编辑工具，好用，但也有点让人不安（图源：The Verge）

清理工具终于能用了

先说最实用的——清理工具。这个东西其实去年就有了，但去年的版本说难听点就是个摆设。它只在设备端跑模型，算力有限，移除一个路人之后，补出来的背景经常怪得离谱，有时候干脆留一块马赛克一样的色块。我当时试了几次就放弃了。

今年苹果做了个关键升级：清理工具现在可以调用云端更强的模型了。这个打法其实谷歌Pixel很早就在用，人家Magic Editor一直比苹果能打，核心原因就是云端算力和设备端算力的差距。苹果终于想通了。

实测下来，清理2.0确实能打了。孩子鼻子上沾了东西？修掉。背景里有个路人抢镜？去掉。处理完你看不出明显破绽，这就够了。这个功能我估计会是iOS 27里使用率最高的AI特性，没有之一。

扩展画幅，比想象中克制

第二个功能是”扩展”——你可以把它理解成反向裁剪。拍的照片构图太紧，主体快贴边了，以前只能裁小，现在可以用AI往外”撑”一点，让画面松快些。

苹果在这个功能上出奇地克制。它不会像三星早期那样疯狂脑补画面外的内容，而是找对称性、延续纹理，能不加就不加。我试了几次，它会在边桌上”脑补”出一盆植物，看起来挺像那么回事，但我知道那张桌子原来没有盆栽。

克制是好事。但如果我把这张照片发到朋友圈，我自己知道那是AI补的，别人不知道——这个问题，苹果也没给出答案。

最野心也最让人困惑的：空间重新构图

第三个功能叫”空间重新构图”，是我觉得最有意思也最”危险”的一个。它利用了照片中的深度信息，让你像移动相机一样，微调拍摄视角。比如你拍的时候站得偏了，主体被挡了一点，现在可以”虚拟移动”一下，换个角度看看能不能救回来。

想法很好，但执行起来问题不少。AI需要脑补你没拍到的部分——就像你拍了一张侧面的合影，AI要帮你”猜”被挡住的那个人长什么样。离原拍摄位置越远，AI需要脑补的内容就越多，画面就越容易进入”恐怖谷”。

我试了一张自拍，用空间重新构图微调角度，结果我自己的脸看起来有点歪，说不上来哪里不对，就是”不像真的”。这种感觉很微妙——照片里的人是你，但又不完全是你。

有一个细节值得说：用这些AI工具编辑过的照片，会被打上一个”Synth ID”标签，标明这张照片被AI动过。但这个信息藏得很深，要在Instagram里点开照片的”AI信息”菜单才能看到。而且，大多数人刷朋友圈的时候，不会去点那个菜单。

我们在失去什么

iOS 27的这些AI编辑工具，单看每个都挺好用。但把它们放在一起看，有一个更大的问题浮出来了：我们以前默认”手机拍的照片是真的”，这个默认信任，正在被一点点吃掉。

苹果不是最大胆的玩家，谷歌和三星走得更快。但苹果的用户基数太大了，一旦这些功能随着iPhone普及开来，”照片可以被AI随意改写”这件事，就会从”少数人的玩具”变成”所有人的日常”。到那时候，我们再看别人发的照片，第一反应会是”这是真的还是AI修过的”？

这个问题没有简单答案。但至少，苹果给了你一个工具——那个藏得很深的”AI信息”标签。用不用，怎么用，是你自己的选择。

📎 原文来源：Apple’s new AI photo editing tools mostly work, for better and worse — The Verge

2026年6月15日