标签: AI

  • ChatGPT升级记忆系统,向所有用户推送

    OpenAI这几天悄悄做了一个看似不起眼的更新——ChatGPT的”记忆”功能全面升级,而且开始向所有用户推送。Plus和Pro付费用户现在已经可以用上了,免费用户几周内也会收到推送。

    这事听起来不怎么震撼,但你真用起来会发现,这是ChatGPT发布以来最贴近”私人助手”体验的一次升级。

    以前的ChatGPT,每次对话都是”失忆症患者”

    用过ChatGPT的人都有这个体验:你上次跟它聊了半天你的写作风格、你公司的业务背景、你喜欢的代码规范,下次开新对话,它又把你怎么着来着给忘了。你得重新介绍一遍。

    旧版本的”记忆”功能其实已经存在了一段时间,但它是被动的——你得手动去开启,而且记住的内容比较零散,很多时候它并没把你认为重要的信息存下来。

    新版本的核心改进是:ChatGPT会自动从你的对话中提取关键信息,而且优先记住那些”反复出现”的信息,而不是把你随口一提的内容都存下来。

    举个例子,你就能感觉到差别

    假设你是个用ChatGPT辅助写代码的用户。旧版记忆可能记住了你说过的”我喜欢用Python”,但三周后它就忘了,或者它记住了你的猫叫”毛毛”,但这个信息对你的工作效率毫无帮助。

    新版记忆系统会观察你在多次对话中持续提到的信息。如果你在五次对话里都提到自己在做数据分析、用的是Pandas和Matplotlib,ChatGPT会把这个记下来,下次你问”帮我写个脚本”的时候,它直接就能给出符合你习惯的代码,不用你每次解释背景。

    • 你在三次对话里提到自己用Python写数据分析脚本 → ChatGPT记住这个偏好
    • 你某次偶然提到喜欢某个小众乐队 → 它通常不会把这个加入长期记忆
    • 你反复要求”回答要简洁,不要解释太多” → 它会记住你的表达风格偏好

    为什么这事重要?因为对手也在做

    记忆系统这东西,表面上看是个”便利功能”,实际上它是AI助手能不能让你”离不开”的核心抓手。

    Google的Gemini、Anthropic的Claude都在强化个性化能力。如果ChatGPT能记住你的使用习惯,你就很难换去别的产品——因为换一个,又要从零开始”调教”。这对OpenAI来说是最稳固的护城河。

    从另一个角度看,这也是大模型产品演进的必经之路:从”强大的通用工具”走向”懂你的专属助手”。这一步看似简单,实际上对模型的长上下文处理、信息提取精度、以及隐私边界判断,都提出了极高的要求。

    隐私问题,用户还是得自己盯着

    OpenAI表示,用户可以随时查看、编辑或删除记忆内容,也可以完全关闭这个功能。但说实话,大多数用户并不会主动去管理这些设置。

    这对OpenAI的默认隐私保护提出了很高要求。记忆系统记下了什么、存在哪里、会不会被用于模型训练,这些都是用户关心的,但很少有人真的去读隐私条款。


  • Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic上周发了一篇博客,标题叫“When AI builds itself”(当AI开始建造自己),讨论的是一个在AI圈内被反复议论、但很少有公司愿意公开正面回答的问题:AI系统最终会不会进化到可以完全自主地设计和改进自己的下一代?

    这个能力有个正式的名字,叫递归自我改进(Recursive Self-Improvement),简称RSI。用大白话讲就是:一个AI模型训练出了下一代模型,下一代模型又训练出下下一代,每一代都比上一代更强,而且这个过程里人类逐渐退出核心环节。

    递归自我改进指的是AI系统具备完全自主设计和开发自身后继版本的能力:AI系统可以优化自身的架构、训练方法、代码等,生成能力比自己更强的新版本AI,而新版本又可以继续优化生成下一代,形成”自我改进”的递归循环。

    Anthropic拿出了实锤数据

    这篇博客最有价值的部分,不是它对RSI下什么结论,而是它首次公开了大量来自Anthropic内部的真实数据,讲清楚了”AI到底在多大程度上已经在加速AI开发本身”这个问题。

    一个很惊人的数字是:截至2026年5月,Anthropic代码库里超过80%的代码是由Claude编写的。而在2025年2月Claude Code推出之前,这个比例还只是个位数。每个工程师每天合并的代码行数,2026年第二季度已经是2024年的8倍

    Anthropic自己也很谨慎地说,代码行数不是衡量生产力的完美指标,但这个8倍的数字至少说明了一件事:AI辅助开发已经不是”有帮助”的程度了,它在实实在在改变一家AI公司的开发节奏。

    差距在缩小,但还没到那一步

    他们把目前的差距描述得很具体。今天的Claude可以在别人明确指定目标的情况下运行实验、优化代码、甚至修复bug。但在”选择值得研究的问题”这件事上,Claude和人类之间还有很大的性能差距。

    用Anthropic自己的话说:目前人类的比较优势仍然在于”看到更大的图景”,以及超越即时任务的局限进行思考。

    问题是,这个差距也在缩小。Anthropic做了一个实验:让不同版本的Claude只看一段研究对话中”跑偏之前”的部分,然后问它”接下来你会怎么做”。2025年11月的最佳模型(Opus 4.5)在人类的选择更好的比例上只赢了51%,到2026年4月(Mythos Preview),这个比例涨到了64%

    这件事为什么重要

    把上面的线索放在一起,Anthropic描绘了一幅有点微妙的图像:RSI不会明天就到来,但那些曾经被认为是”只有人类才能做”的判断力工作,正在一点一点地被AI系统蚕食。

    这篇博客没有给出一个明确的结论说”RSI会在某年某月到来”,但它做了一件更重要的事:把这个问题从抽象的哲学讨论,拉到了可以用数据衡量的实证层面。


    接下来会怎样

    Anthropic在文末说,接下来几个月他们会组织政策制定者、研究人员和公民社会之间的对话,讨论怎么为RSI的可能性做准备。这件事值得关注的原因很简单:如果RSI真的到来了,人类怎么保证自己还有能力理解和控制这些系统,会是一个完全不同的问题。

    而Anthropic这篇博客,是目前一线AI公司在这个问题上给出的最坦诚、数据最扎实的公开表态。


  • ChatGPT记忆功能大升级,它现在真的认识了你

    ChatGPT记忆功能大升级,它现在真的”认识”你了

    OpenAI这两天悄悄推了一个挺重要的更新,ChatGPT的记忆功能升级了。说”悄悄”是因为它看起来只是个产品小迭代,但如果你用过一段时间ChatGPT,就会明白这件事的意义——它终于开始真正记住你是谁了。

    这事得从两年前说起。2024年4月,ChatGPT第一次推出了”记忆”功能,当时叫”已保存记忆”。原理很简单,就是你明确告诉它”记住我喜欢吃辣”,它就把这句话存进一个列表里,下次聊天的时候调出来用。这个设计的问题也很明显——太被动了,你不主动说”记住”,它就什么都不记。

    记忆的演进历程

    去年4月,OpenAI搞出了一个叫”dreaming(梦境)”的东西,算是记忆功能的1.5版本。这个词的字面意思挺玄乎,实际做的事其实很实在:让ChatGPT在后台自动翻你之前的聊天记录,把有用的信息整理出来,存进记忆里。你不用再刻意说”记住这个”,它自己就能从对话里提炼出你的偏好和习惯。

    这次的更新,OpenAI把它叫做Dreaming V3,是这套记忆架构的一次大幅升级。根据OpenAI自己发布的评估数据,新版本在三个核心维度上都有明显提升:能不能正确调用之前的上下文、能不能记住你的偏好和限制、以及记忆会不会随时间自动更新。

    记忆的作用本来帮助ChatGPT了解你的偏好、项目和个人限制,让后续对话可以从已有的共享上下文开始,无需每次都从头介绍。

    三个核心改进

    第一个改进:传递上下文。当你开始和ChatGPT进行新对话时,不需要从头介绍自己。ChatGPT可以帮你节省时间,基于之前的上下文继续推进,尤其是对于复杂的、长期运行的项目。

    举个例子,假设你正在用ChatGPT选购和你现有相机兼容的新相机设备。如果你之前和ChatGPT讨论过你的相机配置,你可以直接要求推荐”和我的摄影设备兼容”的产品,就能得到符合你需求的定制化推荐。

    第二个改进:遵循偏好。记忆还可以帮助ChatGPT以更符合你的偏好和限制的方式回复。假设你正在计划去新加坡旅行,在旅行前两个月,你让ChatGPT帮忙制定行程。

    第三个改进:随时间保持更新。你的聊天结束时,时间不会停止。传统记忆系统会变得过时。比如,你告诉ChatGPT”我在新加坡,需要今晚的晚餐推荐”。然后时间过去,你的旅行结束,你会奇怪为什么ChatGPT仍然认为你在新加坡。


    面向未来更具可扩展性的基础

    虽然基于dreaming的记忆已经向Plus和Pro用户开放了一段时间,但OpenAI现在才能向免费用户提供达到他们质量标准的版本,并且可以大规模服务。最近的改进让为免费用户提供dreaming所需的计算资源减少了约5倍。

    展望未来,dreaming现在为所有用户提供了共享的记忆基础。本次更新代表了OpenAI迄今为止能力最强的记忆系统,他们也将继续改进它。


  • agency-agents:107K Stars!203个即插即用AI专家角色,让一人公司成为现实

    agency-agents:107K Stars!203个即插即用AI专家角色,让一人公司成为现实

    🤖 项目简介

    agency-agents 是一个开源的AI智能体集合项目,本质上是一套即插即用的AI专家角色库。每个智能体都有明确的身份定义、关键规则、工作流程和交付标准,安装到Claude Code、Cursor、Aider等AI编程工具后,用自然语言即可激活对应专家角色。

    项目包含203个覆盖14个专业领域的AI智能体,从前端开发、UI设计到营销运营、游戏开发,几乎涵盖了数字产品构建的全链路。它不是一个Agent框架,而是一套经过实战验证的”岗位说明书”集合。

    ⚙️ 安装要求和过程

    环境要求:

    • 已安装任意支持的AI编程工具(Claude Code、Cursor、Aider、Windsurf等)
    • 本地有Git环境(用于克隆项目)
    • Shell环境(Bash/PowerShell)用于运行安装脚本

    快速安装步骤:

    1. 克隆项目到本地:git clone https://github.com/msitarzewski/agency-agents.git
    2. 进入项目目录:cd agency-agents
    3. 一键安装到Claude Code(推荐):./scripts/install.sh --tool claude-code
    4. 或生成多工具适配格式:./scripts/convert.sh && ./scripts/install.sh
    5. 在AI工具中直接激活:激活前端开发专家模式,帮我开发一个React组件

    中文用户可使用汉化版:git clone https://github.com/blackpinkman/agency-agents-zh.git

    ✨ 核心功能

    • 高度专业化:每个智能体深耕单一领域,不是通用Prompt模板。比如”前端开发专家”知道如何做组件拆解、类型安全、无障碍访问,”Reddit社区运营专家”知道如何自然植入、避免营销感。
    • 人格化设计:每个智能体都有独特沟通风格。比如”证据收集员”默认会找出3-5个代码问题、要求所有结论提供视觉证明;”趣味注入者”会在UI设计中加入符合产品调性的趣味交互。
    • 交付物明确:每个智能体都有标准化的输出要求——代码、方案文档、测试报告、运营策略,而非模糊的建议。这让AI的输出真正可落地。
    • 多工具兼容:原生支持Claude Code,同时提供转换脚本,可适配Cursor、Aider、Windsurf、GitHub Copilot、Gemini CLI等12种主流AI编程工具,无需重新编写智能体规则。
    • 可定制扩展:支持用户修改现有智能体的性格、工作流程,也可以按照模板新增自定义智能体,提交PR贡献到社区。目前已有超过200个专业智能体。

    🚀 典型使用场景

    场景一:一人公司MVP开发

    组合调用”前端开发专家”+”后端架构师”+”增长黑客”+”快速原型开发师”+”质量校验员”,全链路覆盖从架构设计、代码开发、用户增长到上线质量校验的流程。一个开发者配上这套智能体团队,可以在极短时间内完成过去需要5-8人的工作量。

    场景二:全渠道营销活动上线

    组合调用”内容创作者”+”Twitter运营专家”+”Instagram内容策划”+”Reddit社区运营”+”数据报表分析师”,多平台协同运营,每个平台都有对应的专业策略。避免了用一套话术通发所有平台导致的效果不佳问题。

    场景三:企业级功能迭代

    组合调用”高级项目经理”+”资深开发工程师”+”UI设计师”+”A/B测试跟踪员”+”质量校验员”,符合企业级交付标准,有完整的流程管控和质量门禁,保证交付稳定性。

    💡 推荐理由

    这个项目最打动我的一点是:它把”如何让AI更好地工作”这个问题,转化成了”如何给AI写一份好的岗位说明书”。我们平时用AI编程工具,最大的痛点不是模型能力不足,而是不知道怎么让AI按照专业标准交付

    agency-agents 的价值在于,它把各个领域专家的工作方式、思考逻辑、交付标准都结构化了,然后打包成可以直接给AI读取的Markdown文件。你不需要懂Prompt工程,只需要”激活前端开发专家”,AI就会自动按照前端专家的工作流来帮你。

    另一个亮点是它的人格化设计。很多AI角色定义都是冷冰冰的指令,但这里的每个智能体都有独特的性格。比如”证据收集员”会主动找茬,”趣味注入者”会在合适的地方加彩蛋。这让AI的回复不再是机器式的套话,而是有个人风格的专业输出。

    对于独立开发者或者小团队来说,这个项目基本上等于免费雇了一整个专家团队。前端、后端、设计、营销、项目管理——只要你能想到的角色,这里都有。而且因为是开源的,你还可以根据自己的需求定制每个角色的性格和工作方式。

    📥 下载地址

    支持Claude Code、Cursor、Aider、Windsurf、GitHub Copilot、Gemini CLI等17种AI工具,开箱即用。

  • Suno又拿了4亿美元,估值54亿,音乐AI赛道还在狂奔

    AI音乐生成工具Suno刚刚完成了新一轮4亿美元融资,投后估值直接翻倍到54亿美元。距离上一轮2.5亿美元融资(当时估值24.5亿)才过去6个多月,这个增速在当前的AI投资市场里也算相当激进。投资者用真金白银表态:哪怕版权诉讼还没打完,音乐AI的价值他们依然信。

    6个月,估值从24亿涨到54亿

    把时间线拉清楚:2024年Suno的估值大约5亿美元;2025年11月完成2.5亿美元融资,估值涨到24.5亿;现在2026年6月,D轮4亿美元进来,估值直接跳到54亿。不到两年时间,估值翻了10倍还多。

    这种增长曲线背后有一个核心逻辑:Suno做的不是”帮音乐家制作工具”,而是让完全不懂乐理的普通人,用几句话就能生成一段听起来像模像样的音乐。这个产品方向的市场天花板,比专业音乐制作工具高得多——它吃的是全球几十亿普通用户表达欲的这个市场。

    版权诉讼这块乌云还没散

    但Suno的日子并不是高枕无忧。美国唱片业协会(RIAA)发起的版权诉讼至今没有结论,Suno和另一家AI音乐公司Udio被指控侵犯环球音乐、索尼、华纳等唱片公司的版权。指控的内容很具体:从YouTube抓取音频用于训练模型,以及生成内容实质上模仿了受版权保护的音乐作品。

    “我们相信,音乐AI的未来不需要踩着艺术家的肩膀往上爬。”——Suno在融资公告中暗示将持续推进与版权方的对话

    这个诉讼的走向,很大程度上会影响整个AI生成内容领域的版权规则走向。如果法院认定AI训练使用受版权保护的内容属于”合理使用”,那会打开一扇很大的门;如果认定侵权,Suno们可能要重新思考整个训练数据获取的方式。

    54亿估值贵不贵?

    投资人愿意给出54亿美元的估值,说明他们认为Suno的收入增速和未来市场规模能够支撑这个价位。但横向对比一下:Spotify的估值大约600亿美元,而Spotify有全球几亿付费用户和完整的音乐版权授权体系。Suno要在商业规模上追平Spotify显然还有很长的路要走。

    不过AI音乐生成是一个Spotify时代不存在的新市场——不是”听别人唱”,而是”自己生成自己想要的音乐”。如果这个习惯真的被培养起来,市场空间未必一定要用Spotify的逻辑来框定。投资人们赌的,大概就是这个习惯能不能成真。


    • Suno完成D轮4亿美元融资,投后估值54亿美元(6个月前为24.5亿)
    • 版权诉讼仍在进行,RIAA指控其侵犯主要唱片公司版权
    • 产品核心:零音乐基础用户可用自然语言生成完整音乐
    • 同期竞争对手Udio也面临类似版权挑战
  • 台积电CEO说真话了:AI芯片需求太猛,我们真的供不过来

    全球最大芯片制造商台积电,在刚结束的股东大会上给火热的AI市场泼了一盆冷水。CEO魏哲家直言:客户需求太高,我们只能支持到有限的程度,台积电不会成为行业瓶颈,但现实是——真的供不过来。

    AI热潮把整个供应链逼到了墙角

    这已经不是台积电一家的问题。AI应用的爆发性增长,先把内存行业冲垮了。RAM和NAND闪存的产能缺口摆在那里,业内普遍认为要持续至少好几年。德勤的研究报告给出的预测更夸张:到2027年,整个半导体行业的规模有望冲到1万亿美元。

    换句话说,AI这场仗才刚开打,弹药就已经不够用了。台积电作为整个AI算力链条里最上游、也最卡脖子的那道关,压力大到什么程度,外界其实很难完全感知。

    TSMC半导体工厂内部
    台积电的产能扩张速度跟不上AI需求的爆发式增长(图源:The Verge)

    涨价?魏哲家说会涨,但不会猛涨

    路透社在报道中特意提了一个细节:魏哲家表示他”愿意”提高台积电的产品价格,但不会像DRAM和SSD厂商那样突然大幅涨价。这个表态很有意思——一方面承认了供需失衡需要价格机制来调节,另一方面又刻意和内存厂商的激进涨价拉开距离。

    “我们正在尽最大努力确保台积电不会成为行业瓶颈。”——台积电CEO 魏哲家,2026年6月股东大会

    美国工厂救不了近渴

    魏哲家在会上还补了一句:依靠美国本土的产能满足客户需求,可能需要”非常长的时间”。这话听着客气,意思其实很直接——亚利桑那州的工厂确实已经开了,3座芯片厂、2座先进封装设施、1个研发中心的1650亿美元投资计划也摆在台面上,但这些产能真正释放出来,那是好几年后的事情。

    眼下的局面是:AI公司们都在抢产能,英伟达的订单排到了天边,而台积电的产线已经逼近极限。内存短缺又让整个消费电子行业跟着涨价,手机、笔记本的成本压力一层层往下传导。这个局什么时候能解开,目前看没有人能给一个确切的时间表。


    • 台积电CEO公开承认AI芯片需求超过供应能力
    • 内存(RAM/NAND)短缺预计持续数年,消费电子产品已涨价
    • 台积电美国亚利桑那工厂已投产,但全面产能释放仍需数年
    • 魏哲家表示会涨价,但不会像内存厂商那样大幅突涨
  • OpenAI谷歌Meta罕见联手,就为了拦住AI生物武器

    AI行业里这几个老对手难得站在了一起。Anthropic的Dario Amodei、OpenAI的Sam Altman、微软的Mustafa Suleyman,还有Meta的Alexandr Wang和谷歌DeepMind的Demis Hassabis,一起签了一封致美国国会的公开信,核心诉求只有一条:管一管那些能用来造生物武器的AI工具。

    他们担心的是什么

    信里说的事情听起来有点科幻,但已经离现实不远了。现在有人可以在网上订购合成DNA和RNA——就是构成生命的基本材料,然后在实验室里组装。以前要做这种事,得是受过严格训练的专业人士,手里要有昂贵的设备和大把经费。但合成生物学的工具越来越便宜、越来越容易获取,再加上AI的能力在往上走,门槛正在快速降低。

    AI可以让不具备专业知识的人也能设计出危险的生物序列,然后通过在线订购拿到实物——这道原本存在的门槛,正在被技术碾碎。

    他们真正担心的场景是:有人用AI辅助设计出危险的病原体序列,然后从合成DNA供应商那里下单订购,拿到材料后在实验室里组装出危险的生物制剂。这种事情以前只有国家级实验室或者顶尖研究机构才做得出来,未来可能一个有一定化学基础的人就能尝试。

    具体要管什么

    这封信提了一个很具体的政策建议:要求所有出售合成DNA和RNA的公司,在接单的时候必须筛查订单序列,看有没有可能被用来制造危险病原体。现在美国有一些大供应商其实已经在做类似筛查了,但问题是——这是自愿的,不是强制的。

    信里要求把这个变成强制规定,同时还要保留详细的订单记录,万一有漏网之鱼闯过了筛查,事后还能追查。这封信据悉是由两个智库——Foundation for American Innovation和Institute for Progress——牵头组织的。

    AI生物武器安全防护
    多位AI行业领袖联合致信国会,呼吁加强生物武器防护

    不只是生物武器

    信里还提到,AI同样可能被用来辅助开发化学武器。这个担心不是空穴来风——过去几年里,已经有不少研究表明大语言模型在适当的提示词下,能够输出相当专业的化学合成信息,其中一些可能被滥用。

    签这封信的不只是AI公司的老板。里面还有不少从事合成生物学研究的科学家、国家安全和政策专家,以及Twist Bioscience和Ansa Biotechnologies这两家主要合成遗传物质供应商的高管。后两者其实是最前线的——如果他们不被强制要求筛查订单,靠AI公司自己给模型加安全护栏,效果是有限的。


    为什么是现在

    这封信的措辞里有一句很直白的话:”鉴于底层技术变化的速度,我们认为这件事很紧迫。”AI能力在最近两年里提升得太快,而相应的防护措施基本上还在原地踏步。这些公司在信里说,这是”利益相关方难得达成一致的一次”,希望政策制定者能抓住这个窗口期,拿出果断的行动。

    这里有个微妙的背景:这些公司彼此之间在商业上打得不可开交,但在”AI安全”这个话题上,他们有共同的利益——如果他们家的模型出了问题、被用来做了坏事,监管的铁锤落下来是不会分敌我的。所以与其等出事之后再被动应对,不如主动推一套他们能接受的监管框架。

    这封信能不能真的推动国会立法,现在还不好说。类似的AI监管提案在美国国会里已经堆了不少,但真正落地的不多。不过这么多竞争对手愿意一起署名,至少说明了一件事:在他们眼里,这个风险已经真实到值得放下成见去推动改变了。

  • 硅谷有人把机器人卖进了家里,3万美元的那台长得不怎么酷

    硅谷的机器人公司们还在比谁的机器人更像人、谁能做后空翻的时候,有一家叫Hello Robot的小公司已经悄悄把机器人卖进了普通人家里。他们出的Stretch 4上个月刚发布,定价3万美元——对机器人来说不算贵,但也不是普通消费者随手就能掏的钱。

    不是人形,但能干活

    Stretch 4长得不太像科幻电影里的机器人。它有个粗略的人形躯干和装满了传感器的”脑袋”,伸出来一条可以伸缩的机械臂,末端是一对夹爪,底座是重型全向轮。创始人Aaron Edsinger之前是谷歌的机器人总监,另一名联合创始人Charlie Kemp在佐治亚理工学院教了多年书,他们从2017年创办Hello Robot开始就没打算做那种能参加跑酷比赛的人形机器人。

    机器人进家的真正障碍不是能不能做后空翻,而是能不能在真实家庭里安全地跟人一起生活。——Hello Robot团队

    他们选择了一条更务实的路:先做能用的,再做能炫技的。Stretch 4出厂时自主能力很有限,设计上就是让人全程参与的。公司工程师Blaine Matulevich说,这种设计是刻意的——”能控制机器人,这件事本身就是价值所在。”

    Hello Robot Stretch 4家用机器人
    Hello Robot的Stretch 4,已经在真实家庭里测试使用

    一位四肢瘫痪用户的真实体验

    Keith Platt是佐治亚州的投资人,2021年一场意外让他成了四肢瘫痪,只有肩膀、脖子和头还能动。他通过iPhone上的一个语音控制App来操作Stretch,可以让机器人自己走到屋里某个位置,然后接手直接控制机械臂去拿东西、做事情。

    他跟TechCrunch讲了一个听起来简单但实现起来很不容易的事情:用Stretch给自己倒一杯蛋白奶昔当早餐。这件事正常情况下需要另一个人帮忙,但他想自己做。刚开始的时候,光是完成这一件事就花了他将近两个小时,一个人对着机器人慢慢调试。后来练熟了,几分钟就能喝上奶昔,杯子还能自己放回到台面上。

    Platt说,能自己把眼镜戴上或摘下来、能自己刷牙,这些事情对恢复独立性来说”意义重大”——对他自己是这样,对关心他的人也是。他预测,如果这种机器人助手能让行动不便的人在家里安全待上一整天,家人就能放心去上班或者出门,不用专门请护工,这对很多家庭来说会是真正改变生活的事情。

    硬件这条路为什么这么难走

    就在Hello Robot慢慢打磨产品的同时,整个行业的硬件水平其实还挺让人头疼的。UC伯克利的博士后Mahi Shafiullah专门研究机器人手,他说站在”想把我爸妈家的机器人”这个角度看,现在市面上的硬件”简直惨不忍睹”。物理不骗人,机械臂和手比人的肢体重得多,出了错就是实打实地砸东西。

    有个叫the Bot Company的初创公司最近就摊上事了,旧金山一个Airbnb房东把他们告了,说他们租了房子在里头测机器人,结果把家具划了、家电弄坏了、浴室瓷砖也磕掉了。这类事情提醒整个行业:机器人进了真实家庭,出错的代价不再是实验室里换个零件那么简单。


    先把价格打下来

    Stretch 4卖3万美元,比中国厂商出的同类机器人贵一些,但Edsinger强调那些低价产品通常不含传感器和软件,真要把这些配齐,总价反而更高。他们打算在Martinez的总部生产200到300台,第一批已经售罄。

    有个细节挺有意思:Stretch的设计标准里有一条是必须能装进UPS或DHL的纸箱寄送。一旦需要用木箱运输、需要专业团队上门安装,成本和门槛就都上去了。Edsinger想让预算有限的研究者和黑客也能买到这台机器。

    现在的客户有几类:用Stretch测试最新AI大脑的研究者、在数据中心这类场景测实用性的企业客户、以及为残障人士开发家庭辅助工具的开发团队。Shafiullah说得直白:算法也许已经准备好了,但数据还没有,而数据才是真正重要的那80%。有一台能在真实家庭里安全运行的机器人去收集这些数据,是整个行业往前走的关键一步。

  • 平台明明能让你屏蔽AI垃圾内容,但它们就是不肯

    现在上网,AI生成的内容已经到了躲都没处躲的地步。但这件事本不必如此。

    过去一年,YouTube、Instagram、TikTok都在大力推内容认证,不少平台已经会自动给AI生成的图片、视频、音乐打标签,跟真人创作的内容做区分。问题是——这些标签只能让你刷到的时候心里有数,却没法让你直接把这类内容过滤掉。

    一个简单的过滤器就能解决这个问题,我们只需要一个”AI”勾选框来切换就行。我联系了Meta、谷歌、TikTok和Spotify,询问他们是否计划让用户过滤AI标签系统认证过的各类内容。结果没有一个给出肯定答复。

    现有的标签体系根本没用

    TikTok或YouTube的信息流里,你可能会注意到有些视频描述里有AI披露标识,或者视频画面上叠了个信息标签。Meta也是类似操作,给Facebook和Instagram上携带AI识别元数据、或者创作者主动披露的内容打上”AI信息”标签。

    但如果你想主动避开所有带这类标签的内容——这完全合情合理,毕竟AI生成内容除了伦理和环境问题,本身质量也堪忧——实际操作起来非常困难。

    少数有过滤功能的平台,做得也很敷衍

    目前见过有AI内容过滤功能的平台里,DeviantArt算一个,但它的设置藏得极深——你得先注册账号,然后把鼠标悬停在页面右上角的用户图标上,才能找到”AI内容设置”菜单。两个选项:默认”显示AI内容”,或者”抑制AI内容”。我试了,没看出明显区别。

    Pinterest也有类似系统,藏在设置里的”优化你的推荐”下面,可以切换特定类别的AI内容显示。据我的经验,效果远称不上完美,就算把过滤器开到最大,还是能看到大量有可疑AI痕迹的图片。


    平台为什么不乐意

    原因其实不复杂。平台本身也在制造用来生成这些内容的工具。Meta、Spotify、谷歌不光托管AI生成的图片、广告和音乐,他们还在推销创造这些内容的工具。如果允许用户一键过滤所有AI内容,等于直接打击他们从AI产业获利的所有努力。

    还有一个更尴尬的原因:他们知道现有的标签系统有多不靠谱。C2PA和SynthID这类基于溯源的系统,在内容创作时嵌入元数据或隐形水印,但很多开源AI模型根本不会这么做,而且元数据太容易被剥离。基于检测的方法分析数字内容模式来评估AI生成的可能性,但误报率很高,目前这些方案都无法在大规模场景下有效工作。

    平台推出标签功能,很大程度上是为了应付监管机构和批评者,至于实际能不能帮用户区分真假内容,那是另一回事。

    一个更实际的替代方案

    与其费力给所有AI内容打标签,不如反过来——给经过验证的真人创作者打标签。这不一定能识别这些创作者发布的合成内容,但至少能帮你少看到那些炮制低质量垃圾内容的未验证内容农场。

    Instagram的负责人Adam Mosseri曾经提过这个方向,Spotify也已经在做”已验证艺人”功能。如果YouTube和Instagram愿意推,这比现在这套形同虚设的AI标签体系要实用得多。

    AI垃圾内容过滤示意图
    平台有能力做AI内容过滤,但它们选择不做
  • AI行业对手罕见联手,向国会喊话:别让技术变成生物武器

    本来互相撕得不可开交的AI巨头们,这回居然坐在了一张桌子上。Anthropic的Dario Amodei、OpenAI的Sam Altman、微软的Mustafa Suleyman,还有Meta的Alexandr Wang、谷歌DeepMind的Demis Hassabis——这些平时恨不得把对方踩进地里的竞争对手,一起签了一封给美国国会的公开信。

    他们担心的只有一件事:自家的技术被人拿去开发生物武器。

    鉴于底层技术变化的速度,我们认为需求是紧迫的。这是经常对立的利益相关者之间罕见的共识时刻。我们希望政策制定者能采取果断行动来应对。

    具体要干什么

    信里的核心诉求很直接:立法强制所有销售合成DNA和RNA的公司,在接单的时候筛查序列,看有没有可能被用来制造危险病原体。同时还要保留所有订单的详细记录,万一有漏网之鱼,至少能追查来源。

    现在的状况是,很多大型供应商其实已经在做筛查了,但全是自愿的,没有法律强制力。这封信就是要把这个漏洞堵上。

    为什么现在提这个

    科学家们很早就警告过,合成生物学的进步可能让改造危险生物变得容易,甚至有可能复活已经灭绝的病原体。只不过过去这套东西门槛很高,得有先进的实验室、昂贵的设备和够专业的科研人员才能玩得转。

    问题就出在,现在生物工具越来越便宜、越来越容易获得,AI模型的能力又在飞速提升,原来那道”得有专业知识”的墙正在塌掉。专家还提到,AI不光能用来设计危险生物序列,还可能被用来开发化学武器。


    谁签了这封信

    除了那几位AI圈最响亮的名字,这封信还有不少”重量级”签署方:

    • 顶尖科学家和国家安全政策专家
    • Twist Bioscience和Ansa Biotechnologies的高管——这两家正是合成遗传物质的主要销售商
    • 由两个智库——美国创新基金会和进步研究所——牵头组织

    有意思的是,本来应该是被监管对象的那些公司,自己跳出来要求被管。某种程度上说明,行业内部也清楚这东西一旦出事,谁都跑不了。

    AI生物武器防护示意图
    AI行业领袖联名致信国会,呼吁防范技术滥用