博客

竖屏极简王昭君服饰页

🤖 ChatGPT

🇨🇳 中文提示词

竖屏 9:16，极简白色古典角色服饰信息页，顶部和底部保留充足白色留白，尤其底部要有明显呼吸感。纯白摄影棚背景，高亮柔光，真实商业棚拍质感，高级时尚杂志目录版式，干净、克制、艺术化。

人物脸部必须完全参考上传人物照片：严格保留上传人物的真实身份特征，不改变人物是谁，不改变五官比例、脸型基础、眼距、鼻型、嘴型、眉眼特征、面部轮廓和整体气质。生成结果必须一眼看出是上传照片中的同一个人。只允许进行轻微上镜优化，如均匀肤色、减轻暗沉、提升光线质感，但必须保留真实皮肤纹理、自然毛孔感、真实面部结构和原本神态，不要换脸，不要变成另一个人，不要变成网红脸，不要过度磨皮。

画面顶部，一个大号黑色粗体标题写着：“WANG ZHAOJUN”。标题下方加入一行非常小、精致的副标题：“SNOW FRONTIER BEAUTY STYLE”。

左侧是统一的黑色细线边框服饰与配饰清单，固定分为 3 个编号区块。每个区块正好包含 2 个产品抠图，共 6 个产品抠图：

Section 1：白玉琵琶发簪与银色流苏耳坠；
Section 2：雪白狐毛短披肩与冰蓝色改良汉式长裙；
Section 3：银线刺绣腰封与白色绒面短靴。

每个物品都以干净白底产品抠图形式展示，轮廓清晰、质感高级，每个产品下方都有一个小小的 “1x” 数量标签。左侧清单排版要整齐、留白充足、像高端服装目录页，不要拥挤。

自动将中国古代四大美人之一的王昭君重新诠释为更时尚、优雅、奢华的雪境边塞古典美人造型。保留角色识别度：清冷端庄的东方美感、冰蓝与雪白色系、边塞昭君气质、琵琶意象、银色配饰、柔和而坚韧的气场、远嫁边疆的静穆美感。整体不是传统戏服复刻，而是高级时装化、现代摄影棚风格的王昭君灵感造型。

右侧，一名明确成年的亚洲女性时尚博主全身站立，脸部完全参考上传人物照片，保持与上传人物一致的五官、脸型、神态和真实身份特征，穿着完整的王昭君灵感高级古典时装：冰蓝色改良汉式长裙，裙身修长流畅，带有轻盈丝绸层次与银线刺绣；肩部搭配雪白狐毛质感短披肩，显得清冷高贵；腰间佩戴银线刺绣腰封，脚穿白色绒面短靴；发型为柔顺黑发低盘发或半盘发，搭配白玉琵琶发簪与银色流苏耳坠。整体造型清冷、端庄、贵气，具有东方古典美人和高端时尚博主的双重气场。

她摆出王昭君灵感的优雅站姿：身体微微侧向镜头，肩颈线条舒展，一只手轻轻扶住披肩边缘，另一只手自然垂落或轻扶腰侧，姿态安静、坚韧、含蓄，像雪中远行的边塞美人，但画面仍保持现代棚拍时尚感。镜头采用轻微低机位时尚摄影视角，拉长身形与裙摆线条，但不要造成身体变形。她的表情平静、清冷、温柔、自信，带有王昭君式的沉静美感和高级东方气质。

人物必须真实、有生命力：自然皮肤纹理，真实黑发发丝，可信的丝绸、绒面与狐毛质感褶皱，细腻的银线刺绣边缘，轻微摄影棚地面阴影，真实人体比例，修长优雅但不夸张变形。整体要像高端时装品牌为“中国古典美人王昭君”设计的角色服饰目录页。

避免廉价影楼古装感，避免塑料质感服装，避免夸张网红滤镜，避免动漫脸，避免过度磨皮，避免换脸，避免改变上传人物脸部身份，避免五官漂移，避免脸型变窄或变宽，避免眼睛过度放大，避免鼻子和嘴型改变，避免杂乱背景，避免身体比例扭曲，避免错误文字，避免假 logo，避免元素拥挤，避免人物或清单太靠近底部边缘。

2026年6月6日

俯拍夏装美女满电状态穿搭

🤖 ChatGPT

🇨🇳 中文提示词

竖屏 9:16，从上方俯拍的近景构图，纯白摄影棚背景，高亮柔光，真实商业摄影质感。一名明确成年的中国超酷美女穿搭博主，深色顺滑长发自然披散，精致干净妆容，皮肤自然真实，五官清晰，整体气质冷感、利落、时髦。

她穿着潮流夏装：整体造型要轻盈、清爽、时尚、适合夏季，同时有明显的穿搭博主感。可以是短款修身上衣搭配高腰工装短裙或高腰阔腿短裤，也可以加入极简配饰，如细项链、小耳饰、时尚手链或简洁墨镜点缀。服装配色干净高级，突出夏日清爽感与潮流感，整体造型简洁但有层次，兼具酷感与时尚博主气场。

镜头从她上方略微俯视拍摄，近景到半身构图，人物位于画面中央，身体微微侧向镜头。她举起一只手，伸出食指，像是突然想到了一个好主意，眼神明亮自信，脸上带一点俏皮又很酷的笑意。姿势有“满电准备营业”的能量感，传达聪明、轻快、状态在线、随时开场的短视频博主气质。

画面上方有一个简洁的绿色满格电池图标，颜色为清晰明快的绿色，线条干净，极简风格，带一点轻微闪光感，象征状态满格、能量在线、准备开工。图标不要复杂，不要夸张，大小适中，和整体时尚极简画面保持统一。

整体画面干净时尚，真实摄影质感，皮肤自然，细节清晰，光线明亮柔和，白色背景纯净无杂物。不要科幻变身，不要粒子特效，不要夸张动漫滤镜，不要杂乱背景，不要多余装饰，不要低清晰度，不要过度修图。

2026年6月6日

AI读个剧本就说能预测票房，这事靠谱吗？

有一家叫Quilty的AI初创公司，今年早些时候出现在行业媒体上时，承诺他们的工具仅通过阅读剧本就能准确预测一部电影的成功率。听起来很厉害对不对？

但当人们真正有机会测试Quilty的产品时，却对此持怀疑态度。即便拥有世界上所有可用的数据，它预测票房扑街的《Christy》的剧本，表现会优于最终成为奥斯卡获奖大片的《罪人》（Sinners）的剧本。

正如许多AI高管此前所宣传的那样，Quilty的创始人认为，他们的产品可以通过让新兴创作者获得辅助工具来”民主化”他们的行业。一个很高的Quilty评分或许可以成为和制片人合作的机会，而低分可能意味着需要更多修改。

拼凑出来的”预测引擎”

Quilty由电影制片人Simon Horsman和Daniel Wood创立，使用AI分析剧本并生成关于项目成功概率的详细报告。在输入未制作的剧本后，Quilty的技术会给出0到100的评分，反映未来项目的叙事质量、商业可行性、是否能引起观众共鸣，以及制作可能需要的成本。

但就目前而言，Quilty不过是一堆现有AI系统的杂乱拼凑，该公司尚未证明其技术具备识别未来爆款（更不用说已证实的爆款）的品味或分析能力。

Quilty并没有为用户提供单一、定制的AI模型来反馈剧本意见，而是结合了多种广泛可用的AI工具，为流程带来不同类型的分析。用户要做的就是将文本剧本上传到平台，几分钟后，它就会生成一份报告，详细说明预估预算、重要故事节拍的概述、角色分析等内容。这项服务每次单独分析收费50美元。

Quilty声称可以通过分析剧本预测电影成功率（图源：The Verge）

创始人的”顿悟”来自一场法律纠纷

这种拼凑式分析工作流的想法最早是Wood想到的——他同时也是Quilty的CTO——几年前他卷入一场房地产纠纷时萌生了这个想法。Wood没有花钱请律师，而是打开了ChatGPT，后者立刻告诉他”我不是律师，去找别人帮你吧”。

“后来我用了Gemini，效果好了很多，因为有更大的上下文窗口，”Wood回忆道，”但后来我在X上看到埃隆·马斯克说Grok在律师评分上是AI模型里史上最高的，我就想’让我试试这个。’”

这段经历让Wood更好地理解了类似的消费级AI模型如何在不同的任务中表现出色。而Wood对AI的个人使用也影响了Quilty量化剧本潜在成功的方法。因为”Gemini在结构和模式方面非常出色”，Quilty用它来生成拆解文档。对于财务建模，公司信任托管在美国服务器上的DeepSeek实例。而对于叙事/角色分析，Quilty结合了Claude和ChatGPT。

问题在哪

尽管Quilty技术栈的模块化可能让它在整体更新方面更敏捷，但也让它更难完全理解平台是如何拿到一个剧本，然后得出一系列据称可以衡量无形事物的指标的——比如观众对一部还不存在的电影可能有什么反应。

自好莱坞诞生以来，预测一直是电影开发的关键部分，但这项工作传统上由对人类观众有细致了解的人类工作者完成。还没有AI公司能开发出真正复制人类思维过程，或者我们形成对艺术看法的模糊方式的模型。

Quilty的创始人认为，他们的”情感引擎”是评估剧本的次优选择，因为它整合了VADER（效价感知词典和情感推理器）等工具。但Quilty不可能预见所有可能影响电影接受度的因素。

当我问Horsman和Wood，为什么Quilty给最终票房仅约200万美元的《Christy》的评分高于最终票房3.7亿美元的《罪人》时，他们坚称平台的判断”归根结底是因为Sydney Sweeney真的、真的很受欢迎”。

这种情况凸显了Quilty的逻辑并不那么可靠。他们承认，在一些情况下，Quilty不可能预见可能影响电影财务表现或观众接受度的因素。例如，Quilty不可能预见到Elijah Bynum的《Magazine Dreams》（由Horsman制片）最终会因为演员Jonathan Majors 2023年声名狼藉而脱轨。

尽管宣传得天花乱坠，但Quilty兜售的不过是拼凑起来的一系列大语言模型的间接访问权限。如果这些AI工具真能像Quilty声称的那样工作，那确实会非常惊人。但大多数工具只是复杂模式识别/模仿机器，距离理解人类觉得什么有趣还有很长的路要走。

📎 原文来源：This AI startup says it can tell if a script will make a hit film — The Verge

2026年6月6日
AI的账单到期了：科技公司开始为Token烧的钱买单
Uber把2026全年的AI编程预算，4月份就烧完了。这事听起来像段子，但它是真的。

TechCrunch最近发了一篇深度报道，讲整个行业突然意识到一件事：AI不是免费的基础设施，它贵得离谱，而且账单来得比任何人准备的都要快。

AI公司们在2025年初疯狂使用AI，所有人都开着”放开用”的订阅模式，没人真正盯着花了多少钱。等到年底一算账，才发现Token消耗已经完全失控。

从”能不能用”到”花了多少钱”

OpenAI的企业业务负责人Alexander Embiricos说，半年前他和客户聊天，对方问的都是”这个模型能做什么？够不够好？”现在完全不一样了，所有人都在问：”我们花了多少钱？你们有可见性吗？有审计能力吗？有Token管控吗？你们模型的效率到底怎么样？”

微软几个月前给开发人员开通了Claude Code的许可，结果没过多久就收回去了。Priceline的一个员工告诉TechCrunch，他们续签Cursor合同时，价格直接翻了4到5倍。

这还不是最夸张的。有一家公司忘了给员工设置使用限额，结果一个月下来收到了5亿美元的Claude账单。

Token经济学浮出水面

Linux基金会本周宣布了一个新计划，叫Tokenomics Foundation，目的是给AI Token的花费建立一套类似FinOps之于云计算的成本纪律标准。

FinOps Foundation的负责人J.R. Storment说，今年4、5月份开始，不断有公司跑来说：”我的天，我们2026年的Token预算已经超了3倍，但现在才4月。”

Priceline的IT财务总监Chris Reed说了一句话很形象：”这就像可卡因流行病，他们让你先试试，把你勾住，然后你就被绑住了。”

企业开始认真审视AI的账单了（图源：Getty Images）

新市场正在形成

这波焦虑催生了一个全新的市场。初创公司、老牌厂商，都在争相推出帮助企业管理AI支出的工具。
- Pay-i：专门追踪、测量和优化生成式AI投资的成本与性能
- Paid：让开发者按实际价值而不是订阅费来追踪成本和向用户收费
- Jellyfish、Waydev、Faros AI：提供AI代理监控，证明开发工具的投资回报率
- Ramp、Datadog、New Relic：在传统产品线上加装AI成本管理和可观测性功能
但问题也很明显。所有这些工具都在没有通用语言或共享定义的情况下各自为战。没有人真正知道一个Token到底该花多少钱、它产出了什么、怎么跨厂商比较支出。这正是Tokenomics Foundation想要解决的问题。

Goldman Sachs预测，到2030年全球Token使用量将增长24倍。那些已经超预算的公司现在就需要解决方案，但基金会的第一份交付成果还要几个月才能出来。

Faros AI的CEO Vitaly Gordon说了一句很形象的话：”也许我们造出了蒸汽机，但还没有搞清楚装配线怎么搭。”

这篇文章折射出一个很真实的现状：AI的”免费午餐”时代正在结束，接下来是所有人都必须学会算账的时代。

📎 原文来源：The token bill comes due: Inside the industry scramble to manage AI’s runaway costs — TechCrunch
2026年6月6日
LiteLLM：49.4K Stars！统一100+ LLM API网关，让多模型调用不再碎片化
📌 项目简介

LiteLLM 是 BerriAI 团队维护的开源 AI 网关，为 100+ 大语言模型提供统一访问接口，支持 OpenAI 格式调用，内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目，Stripe、Netflix、Google ADK 等大厂均在用。
🔧 安装要求和过程

环境要求

Python 3.8+ 环境

推荐使用 uv 包管理器（也可使用 pip）

本地开发额外依赖：docker-compose（用于启动数据库、Prometheus 等依赖服务）

快速安装步骤

# 1. 克隆仓库 git clone https://github.com/BerriAI/litellm.git && cd litellm # 2. 安装开发依赖 make install-dev # 3. 初始化虚拟环境 python -m venv .venv # Linux/Mac: source .venv/bin/activate # Windows: .venv\Scripts\activate uv sync --all-extras --group proxy-dev # 4. 生成 Prisma 客户端 uv run prisma generate && prisma generate # 5. 启动本地服务（后端） python litellm/proxy/proxy_cli.py # 6. 启动前端（另开终端） cd ui/litellm-dashboard && npm install && npm run dev

💡 Docker 快速启动：

docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest
🚀 核心功能

🌐 统一 LLM 调用

支持 100+ LLM 厂商（OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等），所有调用兼容 OpenAI API 格式，切换模型无需修改业务代码。

🛡️ AI 网关能力

虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志，并提供 管理后台 UI可视化监控。

🤖 智能体（A2A）支持

支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体，提供 A2A 协议适配，可统一接入各类智能体服务。

🔗 MCP 工具桥接

可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义，直接对接任意 LLM；支持通过网关统一代理 MCP 工具调用。

🏢 企业级特性

单点登录（SSO）、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能：1k RPS 场景下 P95 延迟仅 8ms。
💡 典型使用场景

场景一：多模型切换，代码零改动

开发阶段使用 GPT-4o 快速验证，生产环境切换到 Claude Sonnet，只需修改 model 参数，业务代码无需任何改动：

# 同一套代码，切换不同模型 from litellm import completion response = completion( model="openai/gpt-4o", messages=[{"role": "user", "content": "Hello!"}] ) response = completion( model="anthropic/claude-sonnet-4-20250514", messages=[{"role": "user", "content": "Hello!"}] )

场景二：企业 LLM 调用管理与成本跟踪

为不同团队/项目分配虚拟 API 密钥，按维度统计 LLM 调用花费，设置安全防护规则（如屏蔽敏感词、限制调用频率），所有调用日志可视化。

知名用户包括：Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

场景三：MCP 工具无缝对接 LLM

通过 LiteLLM 的 MCP 工具桥接功能，可以将任何 MCP 服务器的工具转换为 OpenAI 格式，让任意 LLM 都能调用这些工具，无需为每个 LLM 单独适配。
💬 推荐理由

LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码，现在只需一套 OpenAI 格式代码，通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

对于需要调用多个 LLM 的应用（比如 AI Agent 系统），LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用，说明其稳定性和性能已经过生产验证。

最打动我的一点：它不只做模型路由，还内置了成本跟踪、负载均衡、安全防护等企业级功能，真正把”调用 LLM”这件事做成了一个完整的网关产品，而不只是一个简单的路由库。

📦 下载地址

GitHub 仓库

github.com/BerriAI/litellm

⭐ 49.4k+ Stars | 8.6k+ Forks

官方文档

docs.litellm.ai

📚 完整使用指南

PyPI 安装

pip install litellm

📦 Python 包

企业版

Enterprise Edition

🏢 SSO / 专属支持

LiteLLM – 让100+ LLM 调用，从此只有一种方式。
2026年6月5日
前OpenAI CTO Murati时隔18个月露面，说AI行业治理缺位比个人品格更值得担心

Mira Murati又出现在镜头前了。这位前OpenAI CTO、现在Thinking Machines Lab的创始人，在过去18个月里几乎没怎么公开说过话。这次接受TechCrunch采访，她选得很谨慎，没有把公司底牌全亮出来。

为什么现在出来讲话

Thinking Machines Lab成立快一年半了，这段时间一直在低调干活：融资、招人、做了一个开源AI模型微调的API产品叫Tinker。但同行没闲着，OpenAI、Anthropic、xAI这些实验室一直在刷存在感，长期低调的收益在递减。

她需要一个时机，让市场和人才记得Thinking Machines还在牌桌上。这次采访，就是这一步。

她预告了一个新产品方向

Murati透露，他们正在研发一种她称之为”交互模型”的东西。这类模型会打破现在AI产品”你问一句、它答一句”的轮次模式，改为以200毫秒为间隔，持续处理音频、文本、视频的流输入。

这样做的目标是捕捉人类交流里的那些细节：打断、中途修正、思考时的停顿。它更接近实时交互，而不是现在的”问答机”模式。Murati强调这只是第一步，没有给出具体上线时间。

Mira Murati接受采访（图片来源：TechCrunch）

2023年那场”换帅风波”，她这么看

当被问到2023年11月OpenAI董事会突然开除Sam Altman、后又让他回归的那场风波时，Murati把它称为”小插曲”。她说当时做决策的核心逻辑是保护公司使命和团队，如果没有她的参与，公司很可能会”分崩离析”。

但她也承认，当时应该更积极推动信息公开、制定更好的过渡方案、提升透明度。当被直接问及是否还信任前老板Sam Altman时，她没有接话，转而去谈一个更结构性的话题。

她真正担心的事：治理，而不是人品

Murati回避了关于Altman个人信任的问题，转而强调：整个AI行业都存在重要决策集中在少数人手中的问题。相比个人品格，她更担心的是治理结构缺乏制衡机制。

这个观点值得琢磨。行业里很多人盯着Altman、Musk、Zuckerberg这些人的性格和诚信说事，但Murati指向的是制度层面：如果决策权本身就过度集中，换谁来坐那个位置，风险都还在。

她认为行业过于关注”道德正确性”，却在制度建设上走得不够快。这句话某种程度上也是在为自己的创业方向背书：Thinking Machines要做的事情里，治理和安全是核心议题。

对AI的未来，她没有走极端

Murati明确表示，她既不认同”AI必然带来反乌托邦”的悲观论调，也不认同”AI必然带来乌托邦”的乐观版本。她认为当前阶段的发展走向将决定最终结果。

她多次强调一个观点：如果人类过早放弃对AI的主导权，未来会变得完全不同，且不会更好。这个说法不极端，但立场很清楚：AI应该被人类主导，而不是反过来。

Murati这次露面，更像一个精心设计的重新开始，而不是一次全盘托出。她没有公布新产品发布日期，没有透露Thinking Machines的具体技术路线图，也没有深度评价前东家的现状。但她释放了一个信号：Thinking Machines还活着，而且在认真做东西。至于做的东西能不能打过OpenAI和Anthropic，那是下一阶段的问题了。

📎 原文来源：TechCrunch – Mira Murati steps back into the spotlight, carefully

2026年6月5日
黑石旗下的AirTrunk砸300亿美元在印度建AI数据中心，目标5GW容量

数据中心这事儿，最近几年一直是AI行业背后那条看不见的主线。大家都盯着模型参数、聊天能力，但真正卡脖子的，往往是那些耗电、耗水、占地儿的大铁皮房子。6月5日，背靠黑石的澳洲数据中心运营商AirTrunk扔出一颗重磅消息：要在2030年前向印度投资300亿美元，建设总容量5GW的AI数据中心。

为什么是印度

这个决定不是拍脑袋做的。印度这几年的AI基础设施吸引力一直在往上走，研究公司Bernstein预测，印度数据中心容量将从当前的约1.5GW增长到2030年的8GW。这个数字背后，是印度政府真金白银的政策支持。

2026年早些时候，印度宣布对运行在印度数据中心、面向海外销售的算力服务，给予免税政策，一直持续到2047年。这条政策基本上把”在印度建、向全球卖”的商业逻辑给打通了。

AirTrunk不是拍脑袋进印度的。他们2026年早些时候通过收购Lumina CloudInfra正式进入印度市场，已经在孟买、钦奈、海得拉巴储备了约600MW的开发用地。这次300亿美元的投资，是在这个基础上放的一个大卫星。

钱花在哪、谁能分到一杯羹

马哈拉施特拉邦已经和AirTrunk交换了意向书，在Raigad Pen Growth Center划拨土地，用于建设3GW的数据中心，投资额约210亿美元。剩下的部分，会分散到其他邦和地区。

数据中心建设现场（图片来源：TechCrunch）

这个投资计划是在AirTrunk CEO Robin Khuda与印度总理莫迪会面后宣布的。莫迪对此的评价是，这将助力印度成为全球云计算和人工智能枢纽。这句话不是客套，印度确实有这个野心，也正在铺路。

不是只有AirTrunk在押注印度

亚马逊、谷歌、微软、OpenAI、Uber这些国际企业，加上信实工业、阿达尼集团、塔塔咨询服务这些印度本土巨头，都已经宣布了各自在印度的数据中心或AI基础设施投资计划。AirTrunk的300亿是其中金额最大的之一，但不是唯一的。

这里有个细节值得琢磨：为什么是黑石旗下的公司来扛这个旗？黑石是全球最大的另类资产管理公司，它控股AirTrunk，说明机构投资者把数据中心当成长期、稳定、抗通胀的基础设施资产来配置。这个逻辑和买港口、买电网、买高速公路是一样的。

真正的问题：电从哪来

行业高管和分析师说得直白：数据中心建设最大的瓶颈不是土地、不是资金，是电。德勤估计，到2030年，亚太地区的数据中心建设可能需要额外数十太瓦时的电力。这个数字什么概念？相当于好几个中等国家的全年用电量。

印度的优势是有可再生能源资源，太阳能和风能的潜力不小。但电网基础设施的薄弱是另一个问题。建数据中心容易，保证20年后还能稳定供电，这是另一个层面的挑战。

AirTrunk这个300亿美元的投资，表面上是商业决策，底层其实是全球AI竞赛在基础设施层面的投射。谁先把算力铺够、铺便宜、铺稳定，谁就在下一轮AI竞争里占了先机。印度想当这个枢纽，AirTrunk想当这个铺路人，钱已经摆上桌了，接下来看能不能真的落地。

📎 原文来源：TechCrunch – AirTrunk commits 0B to build 5GW of AI data centers in India

2026年6月5日
苹果给Messages开了个口子，第一个进来的AI助手叫Poke

苹果的Messages（信息）应用，在大多数人的认知里就是发短信的地方。绿泡泡蓝泡泡，吵架传照片，就这么点用途。但苹果最近做了一个不太像它会做的决定——给一个第三方AI助手开了绿灯，让它正式进驻Messages for Business平台。

Poke是什么来头

Poke这家公司的名字你可能没听过，它的产品逻辑倒是很直白：不用下载任何App，不用注册账号，就发短信，AI助手在那头帮你干活。

你给它发条消息，说”帮我订个餐厅，今晚7点，两个人”，Poke就去帮你查、帮你订、帮你发确认短信。整个过程你只管发短信就行，不用切到别的应用。

这种”用短信界面做任何事”的思路，其实和这两年大家都在说的”AI助手应该无处不在”是一回事，只是Poke选的入口是每个人手机里都有的短信应用。

Messages for Business是苹果2017年就推出的企业消息平台，之前进驻的都是航空公司、银行、零售商——都是大公司。Poke是第一个以AI助手身份进来的。

苹果为什么现在开这个口子

苹果对自己的生态一向管得很紧。一个第三方AI助手能拿到Messages for Business的入场券，这件事本身就值得留意。

一种解读是，苹果在找新的服务收入来源。Messages for Business对商家是收费的，每增加一个能在这个平台上提供服务的AI助手，就意味着更多的企业客户和更多的使用费。

另一种解读更偏向产品策略。Siri这些年一直被人骂”不好用”，苹果在WWDC 2026前夕批准Poke进来，可能是想先让第三方AI助手证明这个场景成立，自己后面再跟。

Poke能干的事确实挺全：发邮件、设提醒、生成图片，都在Messages对话框里完成。这对Siri来说是不小的竞争压力——人家不用你喊”Hey Siri”，直接发短信就行。

对普通用户意味着什么

目前Poke通过Messages for Business提供的功能还在早期。苹果对这个平台的审核一向严格，Poke能拿到批准，说明它的隐私和安全标准过了苹果的关。

对普通用户来说，最直观的变化是：以后收到企业的Messages消息时，那边接话的可能不只有人工客服，也有AI助手，而且这个AI助手能帮你做的事不止于回答问题，还能真正去执行任务。

这个变化在国内可能感受不深，因为大家用微信。但在欧美，短信和企业消息还是大量用户在用的沟通方式，Messages for Business的月活用户数以亿计。

下一步会怎样

Poke拿到这个”首个”身份，先发优势是明显的。其他AI助手公司现在肯定也在排队申请，苹果会不会批、批多少家，这会决定这个平台未来的生态走向。

对苹果来说，这是在AI助手赛道上借力打力的一招。自己家的Siri还在憋大招（WWDC 2026据说会有大改版），先让第三方进来把场景跑通，用户习惯养成了，后面再推自己的方案，接受度会高很多。

至于Poke能不能真的把这个入口用好，取决于它能不能持续证明：用短信界面跟AI打交道，确实比打开一个专属App更方便。这件事到目前为止，还没有人被真正说服过。

📎 原文来源：TechCrunch — Apple approves Poke as the first AI agent on its Messages for Business platform（2026-06-04）

2026年6月5日
英伟达发了颗PC芯片，黄仁勋想重新发明你的笔记本电脑

英伟达这家公司，大多数人想到它的时候，脑子里浮现的还是显卡。游戏显卡、挖矿显卡、AI训练卡，反正都是插在主板上、负责算图的那个东西。但就在2026年6月1日的台北电脑展上，黄仁勋站上台，发布了一颗完全不同的产品——RTX Spark，一颗英伟达自己品牌的PC处理器。

从显卡厂变成芯片厂

这件事的意义比乍一听要大。此前英伟达也做过计算卡、做过超算模块，但那些产品说到底还是”加速卡”，主机跑什么CPU跟英伟达没关系。RTX Spark不一样，它是一颗完整的PC主芯片——CPU和GPU合在一起，直接决定了一台电脑能干什么、跑多快。

按照英伟达产品管理高级总监Mark Aevermann的说法，这块芯片是”有史以来最高效的PC芯片”。他没拿出任何数据或图表来支撑这个说法，但参数本身确实挺吓人的。

RTX Spark超级芯片，CPU和GPU合封在同一颗芯片上（图源：The Verge）

参数到底有多猛

RTX Spark本质上就是去年英伟达发布的”个人AI超算”DGX Spark里那颗GB10芯片的消费级版本。旗舰规格是这样的：20个CPU核心、6144个GPU核心、128GB LPDDR5X统一内存。

这套配置能干嘛？英伟达给出的参考场景包括：渲染一张90GB的3D场景、剪辑12K分辨率的视频、在1440p分辨率下以100帧流畅运行《印第安纳·琼斯与大圆圈》——而且是在一台14毫米厚的笔记本上、不插电的情况下。

RTX Spark本地可运行1200亿参数的AI智能体。这意味着很多原本需要联网调用云端模型才能做的事，以后在你的笔记本上就能跑。

Arm架构，Windows on Arm生态终于成熟了

RTX Spark基于Arm架构，这和苹果M系列、高通骁龙X Elite是同一路线。缺点是那些为英特尔/AMD x86架构编译的旧软件，得通过模拟层才能跑，性能会有损耗。

但微软这几年没闲着。Prism模拟器已经折腾了好几年，从高通骁龙笔记本开始就在打磨，现在轮到英伟达进场，适配工作已经有底子了。Adobe也已经把Photoshop和Premiere Pro改成了原生支持Arm架构的版本。

连游戏这边都在跟进。Riot Games正在把《英雄联盟》和《无畏契约》搬到Windows on Arm上；Krafton的《绝地求生》也在路上。之前那些用Easy Anti-Cheat、BattlEye做反作弊的游戏，英伟达说他们正在和开发商逐个谈。

英伟达的野心：”AI就是用户界面”

黄仁勋想要的不只是一块更快的芯片。英伟达在宣传材料里写的话很直白：”这是一个新的个人计算范式，AI就是用户界面。”意思是以后你跟电脑说话就行，不用再去记哪个功能藏在哪级菜单里。

他们举了几个例子：电竞主播说一声”我去吃个饭”，电脑自动关灯、闭麦、切换直播模式；设计师画个草图，AI直接生成完整图像、建好3D模型、再配上一段视频；程序员让AI盯着GitHub项目，有QA问题就自己动手修，还能接管键盘鼠标去做那些”重复且无聊”的活。

这些场景听起来有点远，但英伟达这次是真的拉了一帮合作伙伴来落地的。微软已经在Build大会上展示了基于RTX Spark的”新Windows安全和容器原语”，让个人AI智能体能在受控环境下运行。

微软Surface Laptop Ultra，搭载RTX Spark，号称”我们做过的最强机器”（图源：The Verge）

有多少厂商跟进？

Aevermann说，英伟达的合作伙伴已经在开发超过30款笔记本和10款桌面主机。首批确认搭载RTX Spark的笔记本厂商包括宏碁、华硕、戴尔、技嘉、惠普、微星和联想。微软也自己做了一台，叫Surface Laptop Ultra。

价格目前完全没有公布。英伟达只说首批产品”瞄准市场中的较高价位段”，秋季上市。这个”秋季”指的是2026年9-11月之间。

有几个问题英伟达这次没回答：这颗芯片是在美国生产还是海外？会不会出Linux驱动？能不能和外置独立显卡搭配使用？这些答案可能要等到产品真正上市前后才会揭晓。

这事为什么重要

英伟达的市值已经是全球前列，它的每一步动作都会影响整个产业链。这次亲自下场做PC主芯片，直接竞争对手就是英特尔、AMD和高通。对消费者来说，选择变多总是好事；对英伟达来说，这是把AI算力的控制权和利润都揽到自己手里的一步大棋。

2020年苹果发布M1的时候，也没人拿出”证明”来。但M1一上市，整个笔记本行业隔天就变天了。RTX Spark会不会是下一个M1时刻，今年秋季见分晓。

📎 原文来源：The Verge — Nvidia announces RTX Spark as ‘the most efficient PC chip ever built’（作者：Sean Hollister，2026-06-01）

2026年6月5日

supermemory：25.6K Stars！AI时代记忆引擎，让AI真正记住你

配图

项目简介

supermemory 是一个专为AI时代设计的记忆引擎，解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索（RAG+记忆），在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。

安装要求和过程

环境要求

环境	要求
Node.js	v18+
Python	3.9+
API Key	supermemory.ai 控制台获取

快速安装

方式一：MCP服务器（推荐，无需写代码）

# Claude/Cursor/Windsurf 一键安装
npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes

方式二：API调用（开发者）

# Node.js/TypeScript
npm install supermemory

# Python
pip install supermemory

方式三：官方应用（零代码）

访问 app.supermemory.ai 直接使用，支持浏览器扩展、Discord机器人等多种接入方式。

核心功能

功能	说明
自动记忆管理	从对话中自动提取事实，处理信息矛盾（如”搬到旧金山”覆盖”住在纽约”），自动遗忘过期内容，单次调用约50ms
用户画像维护	自动维护稳定事实（偏好、习惯）+ 近期活动上下文，两大维度合并，让AI真正”认识你”
混合搜索	单条查询同时支持RAG（知识库检索）+ 记忆检索，一次性返回文档结果和个性化上下文
多平台连接器	支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步，支持实时webhook更新
多模态内容提取	支持PDF、图片（OCR）、视频（转录）、代码（AST感知分块）等内容的上传和解析

典型使用场景

场景一：给Claude/Cursor加上”永久记忆”

通过MCP服务器接入后，AI助手会自动调用 memory 工具保存重要信息，调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”，AI下次写代码时会自动遵循这个偏好，不再需要每次重复背景。

场景二：为AI产品构建上下文栈

通过单个API调用获得完整的上下文能力，无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入，几行代码完成集成。

场景三：企业知识库+个人记忆融合

supermemory的混合搜索模式，让AI既能检索企业知识库文档（RAG），又能记住每个用户的个性化偏好和历史对话（记忆），两种能力融合，特别适合企业AI助手、客服机器人等场景。

下载地址

来源	链接
GitHub仓库	github.com/supermemoryai/supermemory（25.6K ⭐）
官方网站	supermemory.ai
文档中心	supermemory.ai/docs
控制台	console.supermemory.ai
npm包	npmjs.com/package/supermemory
PyPI包	pypi.org/project/supermemory

开源协议：MIT | 主要语言：TypeScript | 最后更新：2026年6月

2026年6月5日

博客

竖屏极简王昭君服饰页

🇨🇳 中文提示词

俯拍夏装美女满电状态穿搭

🇨🇳 中文提示词

拼凑出来的”预测引擎”

创始人的”顿悟”来自一场法律纠纷

问题在哪

从”能不能用”到”花了多少钱”

Token经济学浮出水面

新市场正在形成

📌 项目简介

🔧 安装要求和过程

环境要求

快速安装步骤

🚀 核心功能

🌐 统一 LLM 调用

🛡️ AI 网关能力

🤖 智能体（A2A）支持

🔗 MCP 工具桥接

🏢 企业级特性

💡 典型使用场景

场景一：多模型切换，代码零改动

场景二：企业 LLM 调用管理与成本跟踪

场景三：MCP 工具无缝对接 LLM

💬 推荐理由

📦 下载地址

为什么现在出来讲话

她预告了一个新产品方向

2023年那场”换帅风波”，她这么看

她真正担心的事：治理，而不是人品

对AI的未来，她没有走极端

为什么是印度

钱花在哪、谁能分到一杯羹

不是只有AirTrunk在押注印度

真正的问题：电从哪来

Poke是什么来头

苹果为什么现在开这个口子

对普通用户意味着什么

下一步会怎样

从显卡厂变成芯片厂

参数到底有多猛

Arm架构，Windows on Arm生态终于成熟了

英伟达的野心：”AI就是用户界面”

有多少厂商跟进？

这事为什么重要

配图

项目简介

安装要求和过程

环境要求

快速安装

核心功能

典型使用场景

场景一：给Claude/Cursor加上”永久记忆”

场景二：为AI产品构建上下文栈

场景三：企业知识库+个人记忆融合

推荐理由

下载地址