博客

mattpocock/skills：95.5k Stars！让AI编码助手真正理解工程师需求的技能集合
📌 项目简介

mattpocock/skills 是TypeScript教学名家Matt Pocock开源的Claude Skills集合，专为”真实工程师”设计。这个项目源于作者多年的工程实践经验，提供了一套可组合、易定制、轻量级的AI编码助手技能集，帮助你远离无意义的”氛围编码”（vibe coding），让AI真正理解并辅助你的日常工程工作。

⚙️ 安装要求和过程

环境要求
- 运行环境：需要安装 Node.js（建议 v18+）
- 支持的AI编码工具：Claude Code、Cursor、Windsurf 等主流AI编码助手
- 包管理器：需要使用 npx（Node.js 自带）
快速安装步骤
1. 运行安装命令：npx skills@latest add mattpocock/skills
2. 选择配置：选择需要启用的技能、以及要安装的编码Agent，务必勾选 /setup-matt-pocock-skills
3. 完成初始化：在Agent中运行 /setup-matt-pocock-skills，根据提示完成配置（选择Issue跟踪工具、设置工单分类标签、设置文档存储路径）
🎯 核心功能

1. 需求对齐技能

使用 /grill-me（通用需求对齐）或 /grill-with-docs（工程场景，额外同步项目领域语言、更新文档）技能，通过问答方式让Agent准确理解你的需求，避免产出不符合预期的代码。

2. 测试驱动开发（TDD）支持

使用 /tdd 技能遵循红-绿-重构的测试驱动开发流程，搭配 /diagnose 技能封装调试最佳实践，确保产出代码可用、可维护。

3. 架构优化工具

使用 /improve-codebase-architecture 定期优化架构，/to-prd、/zoom-out 等技能辅助控制设计复杂度，让代码库始终保持健康。

4. Token优化

通过 grill-with-docs 同步项目领域语言，生成 CONTEXT.md 统一术语，减少沟通成本、显著降低Token消耗。还有 /caveman 技能可以压缩沟通内容，减少75% Token消耗。

5. 灵活可控的设计理念

对比GSD、BMAD、Spec-Kit等方案，mattpocock/skills的所有技能遵循小而轻量、易适配、可组合的原则，不接管你的开发流程，保持你的控制权，且流程中的bug易于修复。

💡 典型使用场景

场景1：需求不明确时对齐预期

当你向AI编码助手描述需求，但它总是理解偏差、产出不符合预期时，使用 /grill-me 或 /grill-with-docs 技能，通过结构化问答让Agent真正理解你的意图，大幅减少返工。

场景2：调试和测试驱动开发

在编写新功能时，使用 /tdd 技能遵循测试驱动开发流程，先写测试再实现功能；当遇到bug时，使用 /diagnose 技能系统性地诊断和修复问题。

场景3：团队协代码库管理

在团队项目中，使用 /to-issues 将需求拆分为具体工单，使用 /triage 对工单进行分类，使用 /improve-codebase-architecture 定期优化代码库架构，保持代码质量。

🌟 推荐理由

Matt Pocock是谁？他是TypeScript教学领域的顶级名家，他的TypeScript教程帮助了数十万开发者掌握TypeScript。现在，他把数十年的工程经验提炼成了这套Claude Skills集合。

我特别推荐这个项目的理由：
1. 真实工程经验沉淀：这不是纸上谈兵的理论，而是Matt Pocock在实际工程中总结出的最佳实践
2. 保持控制权：不像其他方案那样接管你的开发流程，mattpocock/skills让你始终掌控开发节奏
3. 显著降低Token消耗：通过统一术语、压缩沟通，可以减少75%的Token消耗，长期使用能节省大量API成本
4. 社区认可度高：本月新增72.5k Stars，总计95.5k Stars，增长速度在GitHub 5月Trending榜排名第一
如果你每天都在使用AI编码助手（Claude Code、Cursor、Windsurf等），这个项目绝对值得一试。它不会让你失望！

📥 下载地址
- GitHub仓库：https://github.com/mattpocock/skills
- Stars：95.5k+（持续增长中）
- Forks：8.4k+
- 主要语言：Shell（100%）
- Newsletter订阅：订阅获取技能更新（已有6万开发者订阅）
准备好让你的AI编码助手真正理解工程师需求了吗？赶紧去GitHub上给个Star，然后安装试试吧！
2026年5月20日
670亿美元买下竞争对手，AI数据中心把电力公司逼成了巨头

2026年5月19日，美国公用事业巨头NextEra Energy宣布以668亿美元收购Dominion Energy，这是美国电力行业有史以来规模最大的并购案之一。交易的背后推手不是别的，正是AI——更准确地说，是AI数据中心那永远喂不饱的电力需求。

一笔算得过来的账

换股方案是这样的：每持有1股Dominion Energy流通股，可以换取0.8138股NextEra Energy股票，对Dominion每股估值75.97美元，比公告前的收盘价溢价约13%。合并后企业整体价值约4200亿美元，市值约2490亿美元，沿用NextEra为主体品牌继续运营。

NextEra承诺，交易完成后的两年内，向Dominion在弗吉尼亚、北卡罗来纳、南卡罗来纳三州的电力用户发放合计22.5亿美元的电费补贴。这个举措很明显是为了减少监管阻力——这么大规模的并购，反垄断审查和州级公用事业监管机构那一关不好过。

NextEra Energy首席执行官约翰·凯彻姆在投资者电话会议上说得很直白：”美国如今比以往任何时候，都更需要更快、更高效、成本更低地建设能源基础设施。两家优质美国企业强强联合，能够更好地顺应时代需求，实现建设速度与产业规模的双重突破。”

AI到底多吃电

预测到2030年，AI数据中心将消耗美国总电力的15%到25%。现有的电网根本撑不住这个增长速度。美国能源信息署（EIA）的数据很说明问题：过去五年美国电价整体上涨了约40%，在弗吉尼亚、马里兰、宾夕法尼亚这些数据中心扎堆的地方，2025年的电价涨幅直接冲到了两位数。

Dominion手里握着将近510亿瓦已签约的数据中心供电产能，客户名单读起来像科技巨头点名：谷歌、亚马逊、微软、Meta，一个不落。它还拿下了两座由日本资本出资、布局在得克萨斯州和宾夕法尼亚州的数据中心园区开发项目，同时还跟谷歌母公司Alphabet达成协议，重启艾奥瓦州的一座核电站。

合并之后，新公司的供电覆盖范围将包括弗吉尼亚州北部的”数据中心走廊”——全球数据中心集聚度最高的区域，也是全美电力需求增长最快的市场之一。相关项目合计用电需求大约130兆瓦，换算下来，够一个中型城市的用电量了。

合并后的版图

合并后的新企业将在几个细分领域拿下全球或全美第一：可再生能源和电池储能领域全球第一，天然气发电美国第一，核电规模全球第二。总规模远超全美第二和第三大电力公司的总和。

但也别高兴得太早。参考之前的先例：康斯特拉申能源收购卡尔派恩电力的交易，遭遇了严格的监管审查，最终康斯特拉申被迫剥离了宾夕法尼亚州和得克萨斯州的三座天然气发电厂。这次NextEra和Dominion的合并，预计需要12到18个月才能完成全部审批程序，中间变数不少。

不管审批结果如何，这件事本身已经释放了一个很清晰的信号：AI的竞争，已经从算力和模型，蔓延到了电力这个最基础的层面。谁能搞定电，谁才能在这个游戏里留下来。

📎 原文来源：NextEra’s $67 billion Dominion takeover creates world’s biggest utility as AI data centers fuel power demand

2026年5月20日
谷歌Gemini要进Siri了，苹果的AI牌终于亮出来

苹果和谷歌这两个老对手，在AI这件事上居然握手了。2026年4月，谷歌云CEO Thomas Kurian在Google Cloud Next大会上亲口确认：谷歌正在作为苹果的首选云供应商，合作开发基于Gemini技术的下一代苹果基础模型，用来驱动未来的Apple Intelligence功能，包括那个大家都等了很久的新版Siri。

每年10亿美元，苹果买了个什么样的Gemini

2026年1月，苹果和谷歌签了一份多年协议，苹果每年支付大约10亿美元，授权使用1.2万亿参数的定制Gemini模型来支撑苹果自己的基础模型。这个价格不便宜，但苹果看重的是Gemini的多模态能力和谷歌在AI基础设施上的积累。

隐私规则没变——Apple Intelligence仍然在设备端或者苹果自己的私有云上运行，不会把用户数据送到谷歌的服务器去。苹果在这件事上很谨慎，引入Gemini的能力，但数据流自己掌控，相当于用谷歌的”大脑”，但”记忆”和”执行”还是苹果自己的地盘。

谷歌云CEO Thomas Kurian在大会上说得很直接：Gemini将驱动新一代Siri，带来更个性化的AI助手体验。预计2026年内上线。

新版Siri到底变了什么

WWDC 2026定于6月8日至12日在Apple Park举行，主题演讲在北京时间6月9日凌晨1点。苹果已经罕见地在3月就预告会带来”AI新进展”，外界普遍预期这届WWDC是苹果近年来战略意义最重大的一次。

新版Siri最大的变化是从”系统附件”变成了一款真正的独立App。以前Siri是依附在系统界面里的，现在用户可以像打开ChatGPT那样，随时随地一键开启Siri聊天界面。支持文字和语音两种交互方式，还能直接上传文件——这个在以前的Siri上是不可想象的。

对话记录的管理也更像一款正经的AI助手了：你可以选择类似ChatGPT的单次对话视图，也可以切换到类似iMessage的聊天列表视图，方便回溯和延续之前的对话线程。隐私设置里还可以自主决定聊天记录的存活周期——30天、一年或者永久保留，数据生命周期完全由用户自己掌控。

苹果的AI时间表

按照目前的节奏：2026年春季的iOS 26.4会先上线Gemini支撑的Siri上下文感知能力；9月iPhone 18发布时，推出支持多轮对话、复杂任务完成的全对话式Siri；6月8日的WWDC上，应该会展示iOS 27里相关的功能预览。

这个项目曾经延期了整整两年。苹果在AI上的节奏确实比竞争对手慢了一拍，但一旦决定押注，投入的资源也不小。每年10亿美元给谷歌，再加上自己的私有云基础设施，苹果显然是把AI助手这件事当成了下一个十年的核心战场。

6月9日凌晨1点，库克主题演讲见分晓。

📎 原文来源：WWDC 2026重磅前瞻：新版Siri蜕变独立App，拥抱Gemini模型与苹果私有云

2026年5月20日
Google AI Ultra大降价：从250美元砍到100美元，对标OpenAI

Google在I/O 2026上悄悄调整了AI Ultra订阅的价格体系——从原来的249.99美元/月，改成100美元/月起。这个降幅，说实话，挺狠的。

新的Ultra分两档：100美元/月是基础档，200美元/月的高档则包含Project Genie世界模型的访问权限。这个定价策略，明眼人一看就知道是冲着OpenAI去的——OpenAI的Pro订阅也是100美元和200美元两档，完全对标。

之前249.99美元/月的Ultra，说白了就是”劝退价”——贵到大多数人连试都不想试。Google这一刀砍下去，明显是想把那些在ChatGPT Plus和Gemini之间犹豫的用户拉过来。

为什么要降价？因为AI订阅这件事快卷不动了

过去一年，AI公司的订阅定价基本是”高位默契”——大家都不敢轻易降价，怕被市场认为”模型不值钱”。但实际情况是，大多数用户根本用不着每月100美元那么高端的功能。

Google这一降价，实际上是在重新定义”AI订阅的门槛”。如果100美元/月能用到Gemini 3.5 Flash、AI搜索增强、Gmail AI交互这些功能，那OpenAI的100美元Pro还剩多少差异化优势？

200美元档的杀手锏：Project Genie

200美元/月的高档Ultra，核心卖点是Project Genie世界模型的访问权限。这个东西我们在之前的文章里提到过——它能用Google街景的2800亿张图片生成可交互的3D世界，用来训练自动驾驶、机器人，或者做游戏开发。

这个功能的算力消耗非常大，所以Google把它放在高档订阅里作为差异化卖点，逻辑上说得通。问题就在于——有多少普通用户真的需要生成”可交互的3D世界”？这个项目更像是为开发者、研究机构、企业用户准备的。

OpenAI怎么跟？

Google降价之后，压力就转到OpenAI那边了。目前OpenAI的Pro订阅也是100/200美元两档，功能包括GPT-5.5访问、高级语音模式、代码解释器等。如果Google的Ultra在功能上追平甚至超过OpenAI Pro，那OpenAI可能也得考虑调整定价。

不过，AI订阅这件事最终的竞争点，可能不是价格，而是”用户到底信谁”。ChatGPT的品牌认知度目前还是领先Gemini不少，Google要想靠降价逆转局面，还得在产品体验上真正拉开差距。

降价是个开始，不是结束。接来下的几个月，AI订阅市场的价格战，估计会越打越激烈。

📎 原文来源：Google’s super expensive AI plan is getting cheaper – The Verge

2026年5月20日
Google推出Pics应用：AI设计工具赛道又多了一个重量级玩家

Google在今年的I/O大会上扔出了一个不太起眼、但挺有意思的新产品——Pics。这是一个跑在Google Workspace里的AI设计和图像生成应用，你可以直接把它理解成”Google版的Canva”，或者”AI版的Photoshop入门工具”。

这个说法可能有点过于简化了。Pics真正想做的，是让完全不懂设计的人也能用AI生成像样的视觉内容——社交媒体配图、活动邀请函、营销物料、产品原型图，这些都能通过简单的文字描述搞定。

为啥要做这个？因为改图太麻烦了

Google在发布Pics的时候说了一个很接地气的痛点：现在的AI图像生成工具，生成质量已经不错了，但如果你想改图中某一个细节，基本没戏——你得重新写一个提示词，然后祈祷这次AI别把其他部分也改掉。

Pics的思路是：生成图像只是第一步，关键是让图像里的每个元素都可以单独编辑。你可以用新的提示词改局部，也可以直接点击想改的地方写评论——就像在Google Docs里给同事提修改意见一样。

这个设计逻辑其实挺聪明的。它把AI图像生成从”抽奖式创作”变成了”可迭代设计”，降低了试错成本。底层驱动编辑功能的是Gemini，而图像生成本身则由Nano Banana 2支持——Google说这个模型在精确文本渲染、现实世界知识和细节输出上表现不错。

Google Pics应用界面，用户可通过文字提示生成并编辑设计

对手不只是Canva

Google做这个产品，明面上是冲着Canva去的，毕竟Canva这几年在AI设计赛道跑得挺快。但暗地里，Google可能更在意的是Anthropic最近推出的Claude Design——用Claude直接生成可编辑的设计稿，这个思路跟Pics有点像。

Google的优势在于生态整合。Pics原生嵌入Google Workspace，你可以在Docs、Slides、Sheets之间无缝协作，设计稿可以直接丢进幻灯片里用。对于已经离不开Google办公套件的企业和学校来说，这个整合黏性挺强的。

谁能用？什么时候能用？

目前Pics还在测试阶段，I/O期间有一小批测试者拿到了内测资格。Google说今年夏天会先向AI Ultra订阅用户开放，后续再逐步推给更广泛的用户。

这个节奏其实透露了Google的心思：AI设计工具不只是”做个好用的产品”那么简单，它是拉动高价AI订阅的重要手段。如果你能让用户觉得”每个月花100美元买Ultra，就为了用Pics做图”，那这个订阅就值了。

当然，最终Pics能不能打，还得看实际体验。AI生成设计这个赛道，嘴上说说都挺厉害，真要做到”生成即可用”的程度，还有不少坑要填。

📎 原文来源：Google just declared itself a contender in AI design at IO 2026 – TechCrunch

2026年5月20日
教皇要发AI通谕了，Anthropic联创受邀站台

5月25日，梵蒂冈要干一件135年来没干过的事。教皇良十四世（Pope Leo XIV）将发布其首封通谕《Magnifica Humanitas》（壮丽人性），主题只有一个：人工智能时代如何保存人的位格。签署日期特意选在5月15日，正好是135年前教皇利奥十三世签署《新事（Rerum Novarum）》的纪念日——那份文件是天主教回应工业革命、确立劳工权益保护的核心社会训导。

把这两件事放一起看，梵蒂冈的意图再明显不过：AI就是这一轮的”工业革命”，机器正在重新定义劳动价值、知识权威和组织管理逻辑，教会得说话。

让这件事真正有意思的是发布会嘉宾名单

Anthropic联合创始人、AI可解释性研究负责人Christopher Olah将出席并发言。梵蒂冈明确在找技术研究者，而不只是伦理学家或监管官员，来参与这场讨论。Olah的研究方向是理解神经网络内部运作机制——用教会的话说，这叫”理解灵魂”。

Anthropic曾被美国国防部列为”供应链风险”，原因是他们拒绝让Claude用于致命自主武器；这次和梵蒂冈同台，进一步凸显了他们在AI军事应用上的反对立场。

梵蒂冈想要什么

通谕不是监管规则，教皇没有执法权。它的作用是给技术秩序提供道德语言：当硅谷讨论的是”模型能力””商业化路径””用户增长”时，梵蒂冈把问题拉回到”人能不能被系统替代””自动决策的责任归谁””弱者在这场变革里有没有话语权”。

AI公司可以不在乎梵蒂冈说什么，但他们不能不在乎社会情绪。欧盟AI法案、美国CAISI预部署评估协议、各国对深伪内容的立法，这些硬规则背后都有软性的社会共识支撑——而宗教机构、哲学界、社会学界，正是塑造这种共识的重要力量。

技术研究者为什么愿意去

Olah去梵蒂冈，不是去接受祝福，而是去把”AI可解释性”这件事放进公共讨论。Anthropic一直主张，AI系统应该是可理解、可问责的，而不是黑箱。这个主张和天主教对”人格完整性”的强调，在底层逻辑上是通的：人都得搞清楚系统在做什么，才能不被系统异化。

这件事也给AI行业提了个醒：技术讨论的桌子，不只是模型公司、监管机构、资本方三方能坐，神学家、伦理学家、社会学家也可以坐上来。而且他们手里握着的，是几千年来关于”人是什么”这个问题的思考积累。

教会不写代码，但教会问的那句”这个系统里人还在吗”，可能是未来AI治理里最难绕过的问题。

📎 原文来源：教宗首封通谕谈AI：Anthropic联合创始人同场，真正的信号是什么

2026年5月20日
Cursor发布Composer 2.5：不换底座追上Opus 4.7，成本仅1/10

Cursor这次真的被我急了。过去几个月，Claude Code抢走了大量开发者注意力，Anthropic那帮人做的编程助手不仅能力强，还能以Cursor根本拿不到的价格直接服务用户。相当于Cursor一边和Claude Code竞争，一边还得向Anthropic付钱用他们的模型——这生意怎么算都别扭。

5月18日，Cursor扔出了Composer 2.5。有意思的是，他们没换底座模型，仍然用着月之暗面的Kimi K2.5，但把85%的计算预算全部砸进了后训练。训练数据量是上一代的25倍，强化学习轮次拉满。结果在SWE-Bench Multilingual上拿到79.8%，和Claude Opus 4.7的80.5%几乎贴着跑。

成本才是真正的杀手锏

Composer 2.5每百万输入token收费0.50美元，输出2.50美元。达到同样性能，OpenAI和Anthropic的竞品要花差不多10倍的钱。Cursor自己做的effort curve显示，用不到1美元的单任务成本就能在CursorBench v3.1上拿到63%的成绩，而Opus 4.7和GPT-5.5得花好几美元才能摸到这个线。

三个关键技术改进

Cursor搞了三个关键改进。第一个是带文本反馈的定向强化学习——模型跑长任务时，不是等整个任务结束才给奖励信号，而是在出错的地方直接插入提示（比如工具调用失败时提醒”Available tools…”），让模型立刻知道哪步做错了。

第二个是大规模合成数据，用”功能删除”法生成训练样本：从可运行代码库里删掉某个功能，让模型重新实现，用测试通过与否作为奖励信号。

第三个是Sharded Muon优化器，分布式跑Newton-Schulz正交化，1T参数模型单步优化只需0.2秒。

马斯克确认用Colossus 2训练

马斯克在推特上转发了Composer 2.5的发布，还透露这模型部分跑在Colossus 2超算上训练。Cursor已经宣布下一代模型要用Colossus 2的百万H100等效算力，计算量是现在的10倍。按照这个节奏，Anthropic和OpenAI在编程模型上的定价优势，可能撑不了太久。

AI编程工具市场正在分裂成两个阵营：一边是模型厂商自己做工具（Anthropic的Claude Code、OpenAI的Codex），另一边是独立工具厂商（Cursor、Warp、Zed）。独立厂商的命门是上游模型依赖，Cursor这次证明了一件事：你不一定要自研底座模型，后训练+合成数据+强化学习这套路，足以在垂直场景追平顶级模型。

📎 原文来源：不换 Kimi 底座，1/10 成本追平 Opus 4.7？Cursor 用 Composer 2.5 反击 Claude Code

2026年5月20日
LlamaIndex：49.5k Stars！领先的大模型数据框架，让AI理解你的私有数据
🦙 LlamaIndex

49.5k Stars！领先的大模型数据框架，让AI理解你的私有数据

⭐ 49.5k Stars
🔧 数据框架
📚 RAG引擎

💡 项目简介

LlamaIndex 是用于构建智能体（agentic）应用的开源框架，提供数据接入、结构化组织、检索增强接口等完整能力。它核心解决如何用私有数据增强LLM能力的问题——LLM本身基于公开数据预训练，无法直接获取用户私有数据，而LlamaIndex提供完整工具链，实现私有数据的接入、结构化、检索增强全流程。

目前LlamaIndex已在GitHub获得49,514 Stars，是构建RAG（检索增强生成）应用的首选框架之一。无论是新手还是高级开发者，都能找到适合自己的API层级。
⚙️ 安装要求和过程

环境要求

• Python版本：3.8+
• 依赖管理：pip
• 可选：OpenAI API Key（使用OpenAI模型时）

快速安装

# 新手快速上手（推荐） pip install llama-index # 高级用户自定义安装 pip install llama-index-core # 核心框架 pip install llama-index-llms-openai # OpenAI集成 pip install llama-index-llms-ollama # Ollama本地模型集成 pip install llama-index-embeddings-huggingface # HuggingFace嵌入模型
✨ 核心功能

📥 多源数据接入

提供数据连接器，支持接入API、PDF、文档、SQL等各类数据源和格式。无论是本地文件还是在线服务，都能轻松整合。

🗂️ 数据结构化组织

支持构建索引、知识图谱等结构，让数据可被LLM高效使用。提供多种索引类型：向量索引、树形索引、列表索引等。

🔍 高级检索与查询接口

输入LLM提示词，即可返回检索到的上下文和知识增强后的输出。支持多种检索策略：向量检索、关键词检索、混合检索等。

🔧 灵活扩展性

支持自定义所有核心模块，适配不同场景需求。提供300+集成包（LlamaHub），覆盖LLM、嵌入模型、向量存储等组件。

🤖 多模型兼容

支持OpenAI、本地Ollama、HuggingFace等各类LLM和嵌入模型。无需修改代码即可切换底层模型，真正实现解耦。

🚀 典型使用场景

1️⃣ 企业知识库问答系统

将公司文档、PDF、API文档等私有数据接入LlamaIndex，构建智能问答系统，让员工快速获取准确信息。支持多用户、权限管理、对话历史等高级功能。

2️⃣ 个人第二大脑

整合个人笔记、文章、代码注释等，构建个性化AI助手，实现智能检索和知识管理。配合LlamaParse，甚至能解析扫描版PDF和图片。

3️⃣ RAG应用快速原型

利用LlamaIndex的高阶API，仅需5行代码即可完成数据接入和查询，快速验证RAG应用想法。适合创业团队快速MVP验证。

💡 推荐理由

🎯 完美的平衡：LlamaIndex是我接触过的最优雅的RAG框架之一。它完美平衡了易用性和灵活性——新手可以用5行代码快速上手，高级用户又能深度定制每个组件。

🔌 强大的生态：特别是它对各类LLM和向量存储的广泛支持（300+集成包），让你可以轻松切换不同的技术栈而无需重写代码。LlamaHub让集成变得像pip install一样简单。

📖 优秀的文档：它的文档详尽、社区活跃，几乎能找到所有常见问题的解决方案。从入门教程到高级进阶，覆盖全链路。

🚀 企业级能力：配套的企业级文档智能处理平台LlamaParse，支持130+种文档格式解析，让非结构化文档的结构化处理变得轻而易举。

📥 下载地址

🔗 相关链接

• GitHub仓库：https://github.com/run-llama/llama_index
• 官方文档：https://developers.llamaindex.ai
• LlamaParse（企业文档OCR）：https://cloud.llamaindex.ai
• PyPI安装：pip install llama-index

📌 开源协议

LlamaIndex 使用 MIT License，允许商用、修改、分发，非常适合企业和个人开发者使用。

📌 本文属于「开源项目」系列，持续介绍GitHub上的优质AI开源项目，欢迎关注！

🔥 下期预告：更多精彩AI开源项目即将上线，敬请期待…
2026年5月20日
从少年黑客到铁穹研究员，他融了2800万美元教AI识别钓鱼邮件

Shay Shwartz少年时期靠黑客技术谋生，16岁那年失手被抓，在法庭上他意识到自己的网络安全才能可以用来防御攻击，而不是发起攻击。此后他一路打怪升级，在以色列精英国防和情报部门干了十年，参与了铁穹项目的相关研发工作。

Ocean AI创始团队（来源：Ocean / TechCrunch）

AI把钓鱼攻击的门槛踩碎了

过去只有高度成熟的黑客才能发起精准的鱼叉式钓鱼，因为要针对特定目标做大量调研，费时费力，能盯上的人很有限。AI出来之后，整个流程被自动化了——大语言模型可以批量采集公开信息，几秒钟生成针对某个人的高度定向钓鱼邮件，规模和精度都不是一个量级的。

“我可以指示大语言模型去了解你的具体信息，大量采集公开信息，生成针对你的高度定向钓鱼攻击。”Shwartz对TechCrunch说。

Ocean怎么做邮件安全

Shwartz认为，传统供应商（Proofpoint、Mimecast）和新兴玩家（Abnormal Security）能检测常规钓鱼攻击，但对付AI驱动的定向攻击需要不同的思路。

Ocean的做法是用小型语言模型去全面分析每封 incoming 邮件的上下文，识别欺诈和冒充行为，理解发件人的意图，再结合用户所属组织的具体场景做判断。Shwartz打了个比方：就像每个门口都有守卫，每封邮件进来都要被盘问一遍。

目前Ocean每月为Kayak、金士顿科技、Headspace等客户审查数十亿封邮件。模型体量小，速度快，能在邮件到达用户收件箱之前完成判断。

2800万美元，Lightspeed领投

这轮融资由Lightspeed Venture Partners领投，Picture Capital和Cerca Partners跟投。天使投资人阵容也很豪华：Wiz联合创始人兼CEO Assaf Rappaport，以及近期以77.5亿美元被ServiceNow收购的Armis联合创始人Yevgeny Dibrov和Nadir Izrael都参与了。

Ocean之前一直在隐身模式，现在正式亮相，时机挑得挺准——AI钓鱼攻击的量级正在指数级攀升，企业邮件安全是个真实且正在扩大的痛点。

📎 原文来源：From teen hacker to Iron Dome researcher, this founder raised $28M to fight AI phishing – TechCrunch

2026年5月20日
Google I/O 2026全记录：Gemini 3.5、AI搜索和智能眼镜全部到位

Google I/O 2026的主题只有一个：把Gemini塞进你数字生活的每一个角落。这场发布会5月19日开幕，整整两天的议程里，几乎没有哪个产品没被AI重新做一遍。

搜索的”十个蓝色链接”时代正式结束

搜索率先被改造。新搜索框支持长对话式查询，还能给出AI驱动的查询建议，你甚至可以往搜索框里直接拖文档、图片、视频和Chrome标签页。AI Overviews（AI概览）的月活已经摸到25亿，对话式搜索模式的月活也有10亿。

信息代理（information agents）会在后台7×24小时帮你跑任务，生成式UI即时生成交互式视觉内容，背后由Gemini Flash 3.5驱动。出版商的日子估计不太好过了——referral流量还会继续掉。

Gemini Flash 3.5驱动的搜索，已经不再是”搜完给你十个链接”的逻辑，而是直接帮你把事情做完。

Gmail现在能跟你对话了

Gmail Live语音交互模式在I/O上亮相，直接说话就能查邮件、提取行程、找学校通知。不用再盯着列表一页页翻。Workspace这边还有个AI图像生成应用叫Google Pics，支持点击图片局部标注修改需求，不用把提示词全部重写一遍，背后跑的是Gemini和Nano Banana 2模型。

Gemini Spark：常驻后台的AI代理

最值得一提的是Gemini Spark。这不是你叫它才动一下的聊天机器人，而是一个常驻后台的AI代理，能自动写完邮件、生成学习指南、监控订阅费用，还能对接Workspace、Canva、OpenTable这些第三方应用。

硬件：XR眼镜合作款全部亮相

Android XR眼镜的合作款全部亮相——三星、Gentle Monster、Warby Parker的版本都出来了，计划2026年年内发布。谷歌自研的Project Aura眼镜也更新了，计算单元更强，加了指纹解锁，还有新的充电盒设计。

Wear OS 7也有更新，加入了类似iPhone的”实时更新”功能，手表上能同步快递、赛事比分等动态信息，还能查看AI代理的自动化任务进度。

定价：Ultra订阅拆分两档

谷歌把AI订阅Ultra拆成了100美元/月和200美元/月两档，200美元那档包含Project Genie世界模型的访问权限。这个定价明显在对标OpenAI Pro，谷歌这次是真的在全栈铺开，而不只是做个 benchmark 冠军。

📎 原文来源：Google I/O 2026: All the news and announcements – The Verge

2026年5月20日

博客

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装步骤

🎯 核心功能

1. 需求对齐技能

2. 测试驱动开发（TDD）支持

3. 架构优化工具

4. Token优化

5. 灵活可控的设计理念

💡 典型使用场景

场景1：需求不明确时对齐预期

场景2：调试和测试驱动开发

场景3：团队协代码库管理

🌟 推荐理由

📥 下载地址

一笔算得过来的账

AI到底多吃电

合并后的版图

每年10亿美元，苹果买了个什么样的Gemini

新版Siri到底变了什么

苹果的AI时间表

为什么要降价？因为AI订阅这件事快卷不动了

200美元档的杀手锏：Project Genie

OpenAI怎么跟？

为啥要做这个？因为改图太麻烦了

对手不只是Canva

谁能用？什么时候能用？

让这件事真正有意思的是发布会嘉宾名单

梵蒂冈想要什么

技术研究者为什么愿意去

成本才是真正的杀手锏

三个关键技术改进

马斯克确认用Colossus 2训练

AI把钓鱼攻击的门槛踩碎了

Ocean怎么做邮件安全

2800万美元，Lightspeed领投

搜索的”十个蓝色链接”时代正式结束

Gmail现在能跟你对话了

Gemini Spark：常驻后台的AI代理

硬件：XR眼镜合作款全部亮相

定价：Ultra订阅拆分两档