博客

  • 竖屏极简王昭君服饰页

    竖屏极简王昭君服饰页

    竖屏极简王昭君服饰页



    🤖 ChatGPT

    🇨🇳 中文提示词

    竖屏 9:16,极简白色古典角色服饰信息页,顶部和底部保留充足白色留白,尤其底部要有明显呼吸感。纯白摄影棚背景,高亮柔光,真实商业棚拍质感,高级时尚杂志目录版式,干净、克制、艺术化。
    
    人物脸部必须完全参考上传人物照片:严格保留上传人物的真实身份特征,不改变人物是谁,不改变五官比例、脸型基础、眼距、鼻型、嘴型、眉眼特征、面部轮廓和整体气质。生成结果必须一眼看出是上传照片中的同一个人。只允许进行轻微上镜优化,如均匀肤色、减轻暗沉、提升光线质感,但必须保留真实皮肤纹理、自然毛孔感、真实面部结构和原本神态,不要换脸,不要变成另一个人,不要变成网红脸,不要过度磨皮。
    
    画面顶部,一个大号黑色粗体标题写着:“WANG ZHAOJUN”。标题下方加入一行非常小、精致的副标题:“SNOW FRONTIER BEAUTY STYLE”。
    
    左侧是统一的黑色细线边框服饰与配饰清单,固定分为 3 个编号区块。每个区块正好包含 2 个产品抠图,共 6 个产品抠图:
    
    Section 1:白玉琵琶发簪与银色流苏耳坠;
    Section 2:雪白狐毛短披肩与冰蓝色改良汉式长裙;
    Section 3:银线刺绣腰封与白色绒面短靴。
    
    每个物品都以干净白底产品抠图形式展示,轮廓清晰、质感高级,每个产品下方都有一个小小的 “1x” 数量标签。左侧清单排版要整齐、留白充足、像高端服装目录页,不要拥挤。
    
    自动将中国古代四大美人之一的王昭君重新诠释为更时尚、优雅、奢华的雪境边塞古典美人造型。保留角色识别度:清冷端庄的东方美感、冰蓝与雪白色系、边塞昭君气质、琵琶意象、银色配饰、柔和而坚韧的气场、远嫁边疆的静穆美感。整体不是传统戏服复刻,而是高级时装化、现代摄影棚风格的王昭君灵感造型。
    
    右侧,一名明确成年的亚洲女性时尚博主全身站立,脸部完全参考上传人物照片,保持与上传人物一致的五官、脸型、神态和真实身份特征,穿着完整的王昭君灵感高级古典时装:冰蓝色改良汉式长裙,裙身修长流畅,带有轻盈丝绸层次与银线刺绣;肩部搭配雪白狐毛质感短披肩,显得清冷高贵;腰间佩戴银线刺绣腰封,脚穿白色绒面短靴;发型为柔顺黑发低盘发或半盘发,搭配白玉琵琶发簪与银色流苏耳坠。整体造型清冷、端庄、贵气,具有东方古典美人和高端时尚博主的双重气场。
    
    她摆出王昭君灵感的优雅站姿:身体微微侧向镜头,肩颈线条舒展,一只手轻轻扶住披肩边缘,另一只手自然垂落或轻扶腰侧,姿态安静、坚韧、含蓄,像雪中远行的边塞美人,但画面仍保持现代棚拍时尚感。镜头采用轻微低机位时尚摄影视角,拉长身形与裙摆线条,但不要造成身体变形。她的表情平静、清冷、温柔、自信,带有王昭君式的沉静美感和高级东方气质。
    
    人物必须真实、有生命力:自然皮肤纹理,真实黑发发丝,可信的丝绸、绒面与狐毛质感褶皱,细腻的银线刺绣边缘,轻微摄影棚地面阴影,真实人体比例,修长优雅但不夸张变形。整体要像高端时装品牌为“中国古典美人王昭君”设计的角色服饰目录页。
    
    避免廉价影楼古装感,避免塑料质感服装,避免夸张网红滤镜,避免动漫脸,避免过度磨皮,避免换脸,避免改变上传人物脸部身份,避免五官漂移,避免脸型变窄或变宽,避免眼睛过度放大,避免鼻子和嘴型改变,避免杂乱背景,避免身体比例扭曲,避免错误文字,避免假 logo,避免元素拥挤,避免人物或清单太靠近底部边缘。
  • 俯拍夏装美女满电状态穿搭

    俯拍夏装美女满电状态穿搭

    俯拍夏装美女满电状态穿搭



    🤖 ChatGPT

    🇨🇳 中文提示词

    竖屏 9:16,从上方俯拍的近景构图,纯白摄影棚背景,高亮柔光,真实商业摄影质感。一名明确成年的中国超酷美女穿搭博主,深色顺滑长发自然披散,精致干净妆容,皮肤自然真实,五官清晰,整体气质冷感、利落、时髦。
    
    她穿着潮流夏装:整体造型要轻盈、清爽、时尚、适合夏季,同时有明显的穿搭博主感。可以是短款修身上衣搭配高腰工装短裙或高腰阔腿短裤,也可以加入极简配饰,如细项链、小耳饰、时尚手链或简洁墨镜点缀。服装配色干净高级,突出夏日清爽感与潮流感,整体造型简洁但有层次,兼具酷感与时尚博主气场。
    
    镜头从她上方略微俯视拍摄,近景到半身构图,人物位于画面中央,身体微微侧向镜头。她举起一只手,伸出食指,像是突然想到了一个好主意,眼神明亮自信,脸上带一点俏皮又很酷的笑意。姿势有“满电准备营业”的能量感,传达聪明、轻快、状态在线、随时开场的短视频博主气质。
    
    画面上方有一个简洁的绿色满格电池图标,颜色为清晰明快的绿色,线条干净,极简风格,带一点轻微闪光感,象征状态满格、能量在线、准备开工。图标不要复杂,不要夸张,大小适中,和整体时尚极简画面保持统一。
    
    整体画面干净时尚,真实摄影质感,皮肤自然,细节清晰,光线明亮柔和,白色背景纯净无杂物。不要科幻变身,不要粒子特效,不要夸张动漫滤镜,不要杂乱背景,不要多余装饰,不要低清晰度,不要过度修图。
  • AI读个剧本就说能预测票房,这事靠谱吗?

    有一家叫Quilty的AI初创公司,今年早些时候出现在行业媒体上时,承诺他们的工具仅通过阅读剧本就能准确预测一部电影的成功率。听起来很厉害对不对?

    但当人们真正有机会测试Quilty的产品时,却对此持怀疑态度。即便拥有世界上所有可用的数据,它预测票房扑街的《Christy》的剧本,表现会优于最终成为奥斯卡获奖大片的《罪人》(Sinners)的剧本。

    正如许多AI高管此前所宣传的那样,Quilty的创始人认为,他们的产品可以通过让新兴创作者获得辅助工具来”民主化”他们的行业。一个很高的Quilty评分或许可以成为和制片人合作的机会,而低分可能意味着需要更多修改。

    拼凑出来的”预测引擎”

    Quilty由电影制片人Simon Horsman和Daniel Wood创立,使用AI分析剧本并生成关于项目成功概率的详细报告。在输入未制作的剧本后,Quilty的技术会给出0到100的评分,反映未来项目的叙事质量、商业可行性、是否能引起观众共鸣,以及制作可能需要的成本。

    但就目前而言,Quilty不过是一堆现有AI系统的杂乱拼凑,该公司尚未证明其技术具备识别未来爆款(更不用说已证实的爆款)的品味或分析能力。

    Quilty并没有为用户提供单一、定制的AI模型来反馈剧本意见,而是结合了多种广泛可用的AI工具,为流程带来不同类型的分析。用户要做的就是将文本剧本上传到平台,几分钟后,它就会生成一份报告,详细说明预估预算、重要故事节拍的概述、角色分析等内容。这项服务每次单独分析收费50美元。

    AI预测电影剧本
    Quilty声称可以通过分析剧本预测电影成功率(图源:The Verge)

    创始人的”顿悟”来自一场法律纠纷

    这种拼凑式分析工作流的想法最早是Wood想到的——他同时也是Quilty的CTO——几年前他卷入一场房地产纠纷时萌生了这个想法。Wood没有花钱请律师,而是打开了ChatGPT,后者立刻告诉他”我不是律师,去找别人帮你吧”。

    “后来我用了Gemini,效果好了很多,因为有更大的上下文窗口,”Wood回忆道,”但后来我在X上看到埃隆·马斯克说Grok在律师评分上是AI模型里史上最高的,我就想’让我试试这个。’”

    这段经历让Wood更好地理解了类似的消费级AI模型如何在不同的任务中表现出色。而Wood对AI的个人使用也影响了Quilty量化剧本潜在成功的方法。因为”Gemini在结构和模式方面非常出色”,Quilty用它来生成拆解文档。对于财务建模,公司信任托管在美国服务器上的DeepSeek实例。而对于叙事/角色分析,Quilty结合了Claude和ChatGPT。

    问题在哪

    尽管Quilty技术栈的模块化可能让它在整体更新方面更敏捷,但也让它更难完全理解平台是如何拿到一个剧本,然后得出一系列据称可以衡量无形事物的指标的——比如观众对一部还不存在的电影可能有什么反应。

    自好莱坞诞生以来,预测一直是电影开发的关键部分,但这项工作传统上由对人类观众有细致了解的人类工作者完成。还没有AI公司能开发出真正复制人类思维过程,或者我们形成对艺术看法的模糊方式的模型。

    Quilty的创始人认为,他们的”情感引擎”是评估剧本的次优选择,因为它整合了VADER(效价感知词典和情感推理器)等工具。但Quilty不可能预见所有可能影响电影接受度的因素。


    当我问Horsman和Wood,为什么Quilty给最终票房仅约200万美元的《Christy》的评分高于最终票房3.7亿美元的《罪人》时,他们坚称平台的判断”归根结底是因为Sydney Sweeney真的、真的很受欢迎”。

    这种情况凸显了Quilty的逻辑并不那么可靠。他们承认,在一些情况下,Quilty不可能预见可能影响电影财务表现或观众接受度的因素。例如,Quilty不可能预见到Elijah Bynum的《Magazine Dreams》(由Horsman制片)最终会因为演员Jonathan Majors 2023年声名狼藉而脱轨。

    尽管宣传得天花乱坠,但Quilty兜售的不过是拼凑起来的一系列大语言模型的间接访问权限。如果这些AI工具真能像Quilty声称的那样工作,那确实会非常惊人。但大多数工具只是复杂模式识别/模仿机器,距离理解人类觉得什么有趣还有很长的路要走。

  • AI的账单到期了:科技公司开始为Token烧的钱买单

    Uber把2026全年的AI编程预算,4月份就烧完了。这事听起来像段子,但它是真的。

    TechCrunch最近发了一篇深度报道,讲整个行业突然意识到一件事:AI不是免费的基础设施,它贵得离谱,而且账单来得比任何人准备的都要快。

    AI公司们在2025年初疯狂使用AI,所有人都开着”放开用”的订阅模式,没人真正盯着花了多少钱。等到年底一算账,才发现Token消耗已经完全失控。

    从”能不能用”到”花了多少钱”

    OpenAI的企业业务负责人Alexander Embiricos说,半年前他和客户聊天,对方问的都是”这个模型能做什么?够不够好?”现在完全不一样了,所有人都在问:”我们花了多少钱?你们有可见性吗?有审计能力吗?有Token管控吗?你们模型的效率到底怎么样?”

    微软几个月前给开发人员开通了Claude Code的许可,结果没过多久就收回去了。Priceline的一个员工告诉TechCrunch,他们续签Cursor合同时,价格直接翻了4到5倍。

    这还不是最夸张的。有一家公司忘了给员工设置使用限额,结果一个月下来收到了5亿美元的Claude账单。

    Token经济学浮出水面

    Linux基金会本周宣布了一个新计划,叫Tokenomics Foundation,目的是给AI Token的花费建立一套类似FinOps之于云计算的成本纪律标准。

    FinOps Foundation的负责人J.R. Storment说,今年4、5月份开始,不断有公司跑来说:”我的天,我们2026年的Token预算已经超了3倍,但现在才4月。”

    Priceline的IT财务总监Chris Reed说了一句话很形象:”这就像可卡因流行病,他们让你先试试,把你勾住,然后你就被绑住了。”

    AI成本压力
    企业开始认真审视AI的账单了(图源:Getty Images)

    新市场正在形成

    这波焦虑催生了一个全新的市场。初创公司、老牌厂商,都在争相推出帮助企业管理AI支出的工具。

    • Pay-i:专门追踪、测量和优化生成式AI投资的成本与性能
    • Paid:让开发者按实际价值而不是订阅费来追踪成本和向用户收费
    • Jellyfish、Waydev、Faros AI:提供AI代理监控,证明开发工具的投资回报率
    • Ramp、Datadog、New Relic:在传统产品线上加装AI成本管理和可观测性功能

    但问题也很明显。所有这些工具都在没有通用语言或共享定义的情况下各自为战。没有人真正知道一个Token到底该花多少钱、它产出了什么、怎么跨厂商比较支出。这正是Tokenomics Foundation想要解决的问题。


    Goldman Sachs预测,到2030年全球Token使用量将增长24倍。那些已经超预算的公司现在就需要解决方案,但基金会的第一份交付成果还要几个月才能出来。

    Faros AI的CEO Vitaly Gordon说了一句很形象的话:”也许我们造出了蒸汽机,但还没有搞清楚装配线怎么搭。”

    这篇文章折射出一个很真实的现状:AI的”免费午餐”时代正在结束,接下来是所有人都必须学会算账的时代。

  • LiteLLM:49.4K Stars!统一100+ LLM API网关,让多模型调用不再碎片化

    LiteLLM:49.4K Stars!统一100+ LLM API网关,让多模型调用不再碎片化

    LiteLLM

    📌 项目简介

    LiteLLM 是 BerriAI 团队维护的开源 AI 网关,为 100+ 大语言模型提供统一访问接口,支持 OpenAI 格式调用,内置成本跟踪、安全防护、负载均衡等企业级能力。Y Combinator W23 孵化项目,Stripe、Netflix、Google ADK 等大厂均在用。

    🔧 安装要求和过程

    环境要求

    • Python 3.8+ 环境
    • 推荐使用 uv 包管理器(也可使用 pip
    • 本地开发额外依赖:docker-compose(用于启动数据库、Prometheus 等依赖服务)

    快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/BerriAI/litellm.git && cd litellm
    
    # 2. 安装开发依赖
    make install-dev
    
    # 3. 初始化虚拟环境
    python -m venv .venv
    # Linux/Mac:
    source .venv/bin/activate
    # Windows:
    .venv\Scripts\activate
    uv sync --all-extras --group proxy-dev
    
    # 4. 生成 Prisma 客户端
    uv run prisma generate && prisma generate
    
    # 5. 启动本地服务(后端)
    python litellm/proxy/proxy_cli.py
    
    # 6. 启动前端(另开终端)
    cd ui/litellm-dashboard && npm install && npm run dev

    💡 Docker 快速启动:

    docker run -v $(pwd)/litellm_config.yaml:/app/config.yaml -p 4000:4000 berriai/litellm:latest

    🚀 核心功能

    🌐 统一 LLM 调用

    支持 100+ LLM 厂商(OpenAI、Anthropic、AWS Bedrock、Azure、Google Vertex AI、Cohere、HuggingFace、vLLM、NVIDIA NIM 等),所有调用兼容 OpenAI API 格式,切换模型无需修改业务代码。

    🛡️ AI 网关能力

    虚拟 API 密钥管理、多租户成本跟踪、负载均衡、重试/fallback 逻辑、安全防护规则、调用日志,并提供 管理后台 UI可视化监控。

    🤖 智能体(A2A)支持

    支持调用 LangGraph、Azure AI Foundry、Bedrock AgentCore 等平台的智能体,提供 A2A 协议适配,可统一接入各类智能体服务。

    🔗 MCP 工具桥接

    可将 MCP 服务器的工具转换为 OpenAI 格式 tool 定义,直接对接任意 LLM;支持通过网关统一代理 MCP 工具调用。

    🏢 企业级特性

    单点登录(SSO)、自定义集成、专属支持、SLA 保障、功能优先级定制。高性能:1k RPS 场景下 P95 延迟仅 8ms

    💡 典型使用场景

    场景一:多模型切换,代码零改动

    开发阶段使用 GPT-4o 快速验证,生产环境切换到 Claude Sonnet,只需修改 model 参数,业务代码无需任何改动:

    # 同一套代码,切换不同模型
    from litellm import completion
    
    response = completion(
        model="openai/gpt-4o",
        messages=[{"role": "user", "content": "Hello!"}]
    )
    
    response = completion(
        model="anthropic/claude-sonnet-4-20250514",
        messages=[{"role": "user", "content": "Hello!"}]
    )

    场景二:企业 LLM 调用管理与成本跟踪

    为不同团队/项目分配虚拟 API 密钥,按维度统计 LLM 调用花费,设置安全防护规则(如屏蔽敏感词、限制调用频率),所有调用日志可视化。

    知名用户包括:Stripe、Netflix、Google ADK、Grepile、OpenHands、OpenAI Agents SDK。

    场景三:MCP 工具无缝对接 LLM

    通过 LiteLLM 的 MCP 工具桥接功能,可以将任何 MCP 服务器的工具转换为 OpenAI 格式,让任意 LLM 都能调用这些工具,无需为每个 LLM 单独适配。

    💬 推荐理由

    LiteLLM 解决了 AI 应用开发中最痛点的问题之一——多厂商 LLM 接口不统一。以前需要为每个厂商写一套调用代码,现在只需一套 OpenAI 格式代码,通过 model="anthropic/claude-sonnet-4-20250514" 这样的格式就能无缝切换。

    对于需要调用多个 LLM 的应用(比如 AI Agent 系统),LiteLLM 几乎是标配组件。Stripe、Netflix、Google ADK 等大厂都在用,说明其稳定性和性能已经过生产验证。

    最打动我的一点:它不只做模型路由,还内置了成本跟踪、负载均衡、安全防护等企业级功能,真正把”调用 LLM”这件事做成了一个完整的网关产品,而不只是一个简单的路由库。

    LiteLLM – 让100+ LLM 调用,从此只有一种方式。

  • 前OpenAI CTO Murati时隔18个月露面,说AI行业治理缺位比个人品格更值得担心

    Mira Murati又出现在镜头前了。这位前OpenAI CTO、现在Thinking Machines Lab的创始人,在过去18个月里几乎没怎么公开说过话。这次接受TechCrunch采访,她选得很谨慎,没有把公司底牌全亮出来。

    为什么现在出来讲话

    Thinking Machines Lab成立快一年半了,这段时间一直在低调干活:融资、招人、做了一个开源AI模型微调的API产品叫Tinker。但同行没闲着,OpenAI、Anthropic、xAI这些实验室一直在刷存在感,长期低调的收益在递减。

    她需要一个时机,让市场和人才记得Thinking Machines还在牌桌上。这次采访,就是这一步。

    她预告了一个新产品方向

    Murati透露,他们正在研发一种她称之为”交互模型”的东西。这类模型会打破现在AI产品”你问一句、它答一句”的轮次模式,改为以200毫秒为间隔,持续处理音频、文本、视频的流输入。

    这样做的目标是捕捉人类交流里的那些细节:打断、中途修正、思考时的停顿。它更接近实时交互,而不是现在的”问答机”模式。Murati强调这只是第一步,没有给出具体上线时间。

    Mira Murati采访
    Mira Murati接受采访(图片来源:TechCrunch)

    2023年那场”换帅风波”,她这么看

    当被问到2023年11月OpenAI董事会突然开除Sam Altman、后又让他回归的那场风波时,Murati把它称为”小插曲”。她说当时做决策的核心逻辑是保护公司使命和团队,如果没有她的参与,公司很可能会”分崩离析”。

    但她也承认,当时应该更积极推动信息公开、制定更好的过渡方案、提升透明度。当被直接问及是否还信任前老板Sam Altman时,她没有接话,转而去谈一个更结构性的话题。

    她真正担心的事:治理,而不是人品

    Murati回避了关于Altman个人信任的问题,转而强调:整个AI行业都存在重要决策集中在少数人手中的问题。相比个人品格,她更担心的是治理结构缺乏制衡机制。

    这个观点值得琢磨。行业里很多人盯着Altman、Musk、Zuckerberg这些人的性格和诚信说事,但Murati指向的是制度层面:如果决策权本身就过度集中,换谁来坐那个位置,风险都还在。

    她认为行业过于关注”道德正确性”,却在制度建设上走得不够快。这句话某种程度上也是在为自己的创业方向背书:Thinking Machines要做的事情里,治理和安全是核心议题。

    对AI的未来,她没有走极端

    Murati明确表示,她既不认同”AI必然带来反乌托邦”的悲观论调,也不认同”AI必然带来乌托邦”的乐观版本。她认为当前阶段的发展走向将决定最终结果。

    她多次强调一个观点:如果人类过早放弃对AI的主导权,未来会变得完全不同,且不会更好。这个说法不极端,但立场很清楚:AI应该被人类主导,而不是反过来。


    Murati这次露面,更像一个精心设计的重新开始,而不是一次全盘托出。她没有公布新产品发布日期,没有透露Thinking Machines的具体技术路线图,也没有深度评价前东家的现状。但她释放了一个信号:Thinking Machines还活着,而且在认真做东西。至于做的东西能不能打过OpenAI和Anthropic,那是下一阶段的问题了。

  • 黑石旗下的AirTrunk砸300亿美元在印度建AI数据中心,目标5GW容量

    数据中心这事儿,最近几年一直是AI行业背后那条看不见的主线。大家都盯着模型参数、聊天能力,但真正卡脖子的,往往是那些耗电、耗水、占地儿的大铁皮房子。6月5日,背靠黑石的澳洲数据中心运营商AirTrunk扔出一颗重磅消息:要在2030年前向印度投资300亿美元,建设总容量5GW的AI数据中心。

    为什么是印度

    这个决定不是拍脑袋做的。印度这几年的AI基础设施吸引力一直在往上走,研究公司Bernstein预测,印度数据中心容量将从当前的约1.5GW增长到2030年的8GW。这个数字背后,是印度政府真金白银的政策支持。

    2026年早些时候,印度宣布对运行在印度数据中心、面向海外销售的算力服务,给予免税政策,一直持续到2047年。这条政策基本上把”在印度建、向全球卖”的商业逻辑给打通了。

    AirTrunk不是拍脑袋进印度的。他们2026年早些时候通过收购Lumina CloudInfra正式进入印度市场,已经在孟买、钦奈、海得拉巴储备了约600MW的开发用地。这次300亿美元的投资,是在这个基础上放的一个大卫星。

    钱花在哪、谁能分到一杯羹

    马哈拉施特拉邦已经和AirTrunk交换了意向书,在Raigad Pen Growth Center划拨土地,用于建设3GW的数据中心,投资额约210亿美元。剩下的部分,会分散到其他邦和地区。

    AI数据中心建设
    数据中心建设现场(图片来源:TechCrunch)

    这个投资计划是在AirTrunk CEO Robin Khuda与印度总理莫迪会面后宣布的。莫迪对此的评价是,这将助力印度成为全球云计算和人工智能枢纽。这句话不是客套,印度确实有这个野心,也正在铺路。

    不是只有AirTrunk在押注印度

    亚马逊、谷歌、微软、OpenAI、Uber这些国际企业,加上信实工业、阿达尼集团、塔塔咨询服务这些印度本土巨头,都已经宣布了各自在印度的数据中心或AI基础设施投资计划。AirTrunk的300亿是其中金额最大的之一,但不是唯一的。

    这里有个细节值得琢磨:为什么是黑石旗下的公司来扛这个旗?黑石是全球最大的另类资产管理公司,它控股AirTrunk,说明机构投资者把数据中心当成长期、稳定、抗通胀的基础设施资产来配置。这个逻辑和买港口、买电网、买高速公路是一样的。

    真正的问题:电从哪来

    行业高管和分析师说得直白:数据中心建设最大的瓶颈不是土地、不是资金,是电。德勤估计,到2030年,亚太地区的数据中心建设可能需要额外数十太瓦时的电力。这个数字什么概念?相当于好几个中等国家的全年用电量。

    印度的优势是有可再生能源资源,太阳能和风能的潜力不小。但电网基础设施的薄弱是另一个问题。建数据中心容易,保证20年后还能稳定供电,这是另一个层面的挑战。


    AirTrunk这个300亿美元的投资,表面上是商业决策,底层其实是全球AI竞赛在基础设施层面的投射。谁先把算力铺够、铺便宜、铺稳定,谁就在下一轮AI竞争里占了先机。印度想当这个枢纽,AirTrunk想当这个铺路人,钱已经摆上桌了,接下来看能不能真的落地。

  • 苹果给Messages开了个口子,第一个进来的AI助手叫Poke

    苹果的Messages(信息)应用,在大多数人的认知里就是发短信的地方。绿泡泡蓝泡泡,吵架传照片,就这么点用途。但苹果最近做了一个不太像它会做的决定——给一个第三方AI助手开了绿灯,让它正式进驻Messages for Business平台。

    Poke是什么来头

    Poke这家公司的名字你可能没听过,它的产品逻辑倒是很直白:不用下载任何App,不用注册账号,就发短信,AI助手在那头帮你干活。

    你给它发条消息,说”帮我订个餐厅,今晚7点,两个人”,Poke就去帮你查、帮你订、帮你发确认短信。整个过程你只管发短信就行,不用切到别的应用。

    这种”用短信界面做任何事”的思路,其实和这两年大家都在说的”AI助手应该无处不在”是一回事,只是Poke选的入口是每个人手机里都有的短信应用。

    Messages for Business是苹果2017年就推出的企业消息平台,之前进驻的都是航空公司、银行、零售商——都是大公司。Poke是第一个以AI助手身份进来的。

    苹果为什么现在开这个口子

    苹果对自己的生态一向管得很紧。一个第三方AI助手能拿到Messages for Business的入场券,这件事本身就值得留意。

    一种解读是,苹果在找新的服务收入来源。Messages for Business对商家是收费的,每增加一个能在这个平台上提供服务的AI助手,就意味着更多的企业客户和更多的使用费。

    另一种解读更偏向产品策略。Siri这些年一直被人骂”不好用”,苹果在WWDC 2026前夕批准Poke进来,可能是想先让第三方AI助手证明这个场景成立,自己后面再跟。

    Poke能干的事确实挺全:发邮件、设提醒、生成图片,都在Messages对话框里完成。这对Siri来说是不小的竞争压力——人家不用你喊”Hey Siri”,直接发短信就行。


    对普通用户意味着什么

    目前Poke通过Messages for Business提供的功能还在早期。苹果对这个平台的审核一向严格,Poke能拿到批准,说明它的隐私和安全标准过了苹果的关。

    对普通用户来说,最直观的变化是:以后收到企业的Messages消息时,那边接话的可能不只有人工客服,也有AI助手,而且这个AI助手能帮你做的事不止于回答问题,还能真正去执行任务。

    这个变化在国内可能感受不深,因为大家用微信。但在欧美,短信和企业消息还是大量用户在用的沟通方式,Messages for Business的月活用户数以亿计。

    下一步会怎样

    Poke拿到这个”首个”身份,先发优势是明显的。其他AI助手公司现在肯定也在排队申请,苹果会不会批、批多少家,这会决定这个平台未来的生态走向。

    对苹果来说,这是在AI助手赛道上借力打力的一招。自己家的Siri还在憋大招(WWDC 2026据说会有大改版),先让第三方进来把场景跑通,用户习惯养成了,后面再推自己的方案,接受度会高很多。

    至于Poke能不能真的把这个入口用好,取决于它能不能持续证明:用短信界面跟AI打交道,确实比打开一个专属App更方便。这件事到目前为止,还没有人被真正说服过。

  • 英伟达发了颗PC芯片,黄仁勋想重新发明你的笔记本电脑

    英伟达这家公司,大多数人想到它的时候,脑子里浮现的还是显卡。游戏显卡、挖矿显卡、AI训练卡,反正都是插在主板上、负责算图的那个东西。但就在2026年6月1日的台北电脑展上,黄仁勋站上台,发布了一颗完全不同的产品——RTX Spark,一颗英伟达自己品牌的PC处理器。

    从显卡厂变成芯片厂

    这件事的意义比乍一听要大。此前英伟达也做过计算卡、做过超算模块,但那些产品说到底还是”加速卡”,主机跑什么CPU跟英伟达没关系。RTX Spark不一样,它是一颗完整的PC主芯片——CPU和GPU合在一起,直接决定了一台电脑能干什么、跑多快。

    按照英伟达产品管理高级总监Mark Aevermann的说法,这块芯片是”有史以来最高效的PC芯片”。他没拿出任何数据或图表来支撑这个说法,但参数本身确实挺吓人的。

    NVIDIA RTX Spark芯片概念图
    RTX Spark超级芯片,CPU和GPU合封在同一颗芯片上(图源:The Verge)

    参数到底有多猛

    RTX Spark本质上就是去年英伟达发布的”个人AI超算”DGX Spark里那颗GB10芯片的消费级版本。旗舰规格是这样的:20个CPU核心、6144个GPU核心、128GB LPDDR5X统一内存。

    这套配置能干嘛?英伟达给出的参考场景包括:渲染一张90GB的3D场景、剪辑12K分辨率的视频、在1440p分辨率下以100帧流畅运行《印第安纳·琼斯与大圆圈》——而且是在一台14毫米厚的笔记本上、不插电的情况下。

    RTX Spark本地可运行1200亿参数的AI智能体。这意味着很多原本需要联网调用云端模型才能做的事,以后在你的笔记本上就能跑。

    Arm架构,Windows on Arm生态终于成熟了

    RTX Spark基于Arm架构,这和苹果M系列、高通骁龙X Elite是同一路线。缺点是那些为英特尔/AMD x86架构编译的旧软件,得通过模拟层才能跑,性能会有损耗。

    但微软这几年没闲着。Prism模拟器已经折腾了好几年,从高通骁龙笔记本开始就在打磨,现在轮到英伟达进场,适配工作已经有底子了。Adobe也已经把Photoshop和Premiere Pro改成了原生支持Arm架构的版本。

    连游戏这边都在跟进。Riot Games正在把《英雄联盟》和《无畏契约》搬到Windows on Arm上;Krafton的《绝地求生》也在路上。之前那些用Easy Anti-Cheat、BattlEye做反作弊的游戏,英伟达说他们正在和开发商逐个谈。


    英伟达的野心:”AI就是用户界面”

    黄仁勋想要的不只是一块更快的芯片。英伟达在宣传材料里写的话很直白:”这是一个新的个人计算范式,AI就是用户界面。”意思是以后你跟电脑说话就行,不用再去记哪个功能藏在哪级菜单里。

    他们举了几个例子:电竞主播说一声”我去吃个饭”,电脑自动关灯、闭麦、切换直播模式;设计师画个草图,AI直接生成完整图像、建好3D模型、再配上一段视频;程序员让AI盯着GitHub项目,有QA问题就自己动手修,还能接管键盘鼠标去做那些”重复且无聊”的活。

    这些场景听起来有点远,但英伟达这次是真的拉了一帮合作伙伴来落地的。微软已经在Build大会上展示了基于RTX Spark的”新Windows安全和容器原语”,让个人AI智能体能在受控环境下运行。

    微软Surface Laptop Ultra
    微软Surface Laptop Ultra,搭载RTX Spark,号称”我们做过的最强机器”(图源:The Verge)

    有多少厂商跟进?

    Aevermann说,英伟达的合作伙伴已经在开发超过30款笔记本和10款桌面主机。首批确认搭载RTX Spark的笔记本厂商包括宏碁、华硕、戴尔、技嘉、惠普、微星和联想。微软也自己做了一台,叫Surface Laptop Ultra。

    价格目前完全没有公布。英伟达只说首批产品”瞄准市场中的较高价位段”,秋季上市。这个”秋季”指的是2026年9-11月之间。

    有几个问题英伟达这次没回答:这颗芯片是在美国生产还是海外?会不会出Linux驱动?能不能和外置独立显卡搭配使用?这些答案可能要等到产品真正上市前后才会揭晓。


    这事为什么重要

    英伟达的市值已经是全球前列,它的每一步动作都会影响整个产业链。这次亲自下场做PC主芯片,直接竞争对手就是英特尔、AMD和高通。对消费者来说,选择变多总是好事;对英伟达来说,这是把AI算力的控制权和利润都揽到自己手里的一步大棋。

    2020年苹果发布M1的时候,也没人拿出”证明”来。但M1一上市,整个笔记本行业隔天就变天了。RTX Spark会不会是下一个M1时刻,今年秋季见分晓。

    📎 原文来源:The Verge — Nvidia announces RTX Spark as ‘the most efficient PC chip ever built’(作者:Sean Hollister,2026-06-01)
  • supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    配图

    supermemory


    项目简介

    supermemory 是一个专为AI时代设计的记忆引擎,解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索(RAG+记忆),在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。


    安装要求和过程

    环境要求

    环境 要求
    Node.js v18+
    Python 3.9+
    API Key supermemory.ai 控制台获取

    快速安装

    方式一:MCP服务器(推荐,无需写代码)

    # Claude/Cursor/Windsurf 一键安装
    npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes
    

    方式二:API调用(开发者)

    # Node.js/TypeScript
    npm install supermemory
    
    # Python
    pip install supermemory
    

    方式三:官方应用(零代码)

    访问 app.supermemory.ai 直接使用,支持浏览器扩展、Discord机器人等多种接入方式。


    核心功能

    功能 说明
    自动记忆管理 从对话中自动提取事实,处理信息矛盾(如”搬到旧金山”覆盖”住在纽约”),自动遗忘过期内容,单次调用约50ms
    用户画像维护 自动维护稳定事实(偏好、习惯)+ 近期活动上下文,两大维度合并,让AI真正”认识你”
    混合搜索 单条查询同时支持RAG(知识库检索)+ 记忆检索,一次性返回文档结果和个性化上下文
    多平台连接器 支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步,支持实时webhook更新
    多模态内容提取 支持PDF、图片(OCR)、视频(转录)、代码(AST感知分块)等内容的上传和解析

    典型使用场景

    场景一:给Claude/Cursor加上”永久记忆”

    通过MCP服务器接入后,AI助手会自动调用 memory 工具保存重要信息,调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”,AI下次写代码时会自动遵循这个偏好,不再需要每次重复背景。

    场景二:为AI产品构建上下文栈

    通过单个API调用获得完整的上下文能力,无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入,几行代码完成集成。

    场景三:企业知识库+个人记忆融合

    supermemory的混合搜索模式,让AI既能检索企业知识库文档(RAG),又能记住每个用户的个性化偏好和历史对话(记忆),两种能力融合,特别适合企业AI助手、客服机器人等场景。


    推荐理由

    AI助手的”失忆症”是 currently 最大的体验短板——每次新对话都要重新介绍背景,让人疲惫。supermemory 把这个痛点打穿了。

    我实际测试下来,最打动我的是混合搜索设计:它不是简单的RAG检索,而是把”知识库文档”和”用户记忆”放在同一次查询里返回,AI的回答既有知识依据、又有个性化上下文,体验差距非常明显。

    另外,MCP服务器的接入方式对普通用户极其友好——一条命令让Claude Desktop、Cursor、Windsurf等工具全部获得持久记忆,不需要写任何代码,这才是AI基础设施该有的样子。

    三大基准测试全部排名第一,说明这个方向的技术路线是扎实的,不是噱头。


    下载地址

    来源 链接
    GitHub仓库 github.com/supermemoryai/supermemory(25.6K ⭐)
    官方网站 supermemory.ai
    文档中心 supermemory.ai/docs
    控制台 console.supermemory.ai
    npm包 npmjs.com/package/supermemory
    PyPI包 pypi.org/project/supermemory

    开源协议:MIT | 主要语言:TypeScript | 最后更新:2026年6月