标签: AI

  • 只有16%美国人对AI的社会影响感到乐观,年轻人最悲观

    只有16%美国人对AI的社会影响感到乐观,年轻人最悲观

    皮尤研究中心刚发布了一份让AI行业尴尬的调查报告。他们问美国人:你觉得AI未来20年对社会的影响是正面还是负面?结果只有16%的人说”正面”,40%的人直接说”负面”。剩下的人勉强算中立或者没想好。

    这个数字比很多人预期的更悲观。要知道,AI现在可是经济里的热门话题,科技公司砸了上千亿美元,IPO一个接一个,新闻里天天说”AI改变世界”。但普通人似乎并不买账。

    年轻人反而更悲观

    最让人意外的是年龄分布。30岁以下的人对AI最不看好,只有14%认为AI会有正面社会影响。按理说年轻人应该是最拥抱新技术的群体,结果他们对AI的态度比老一辈还消极。

    一个可能的解释是年轻人最先感受到AI对就业的冲击。实习岗位被AI替代、入门级工作消失、招聘要求莫名其妙地”升级”——这些都直接发生在年轻人身上。你让他们怎么乐观?

    三分之二的人说AI发展太快了

    除了对长期影响悲观,大部分美国人还觉得AI发展速度失控。近三分之二的受访者表示AI”发展太快”。这个数字和之前几次调查的趋势一致,说明公众的担忧不是一时兴起。

    67%的美国人压根不相信美国政府会对AI做有效监管。59%的人不信任企业能安全地开发AI。

    这两个数字值得玩味。它说明公众对美国治理AI的能力几乎失去信心,无论是对政府还是对企业。在AI监管这件事上,信任已经透支得差不多了。

    每天都在用,但心里打鼓

    矛盾的地方来了:尽管态度悲观,美国人用AI的频率却在上升。约四分之一的美国人说他们每天都会用AI聊天机器人。用途主要是研究和工作相关任务。

    ChatGPT的用户覆盖率涨得最快,现在44%的美国成年人说他们用过ChatGPT,比2023年翻了一倍还多。排在第二的是Gemini(24%),然后是Copilot(17%)和Meta AI(14%)。Grok、Claude和Character.ai还在个位数徘徊。

    男性比女性更常用AI,也更有热情。27%的男性说每天用AI聊天机器人,女性只有20%。不过双方在用ChatGPT这件事上差不多,差异出现在Copilot和Grok这些相对小众的产品上。

    一半人坚决不用AI

    调查还发现约一半的美国人明确表示不用AI。这部分人年龄偏大,65岁以上的人里有近75%说他们从来不用AI聊天机器人。他们给出的理由也很直接:不感兴趣,也没打算以后用。

    这其实是个信号。AI的普及率可能已经接近某类用户群体的天花板,剩下那一半人可能不是靠产品迭代就能转化的。他们需要的也许是更根本的信任重建。


    AI行业现在面临一个尴尬局面:产品用的人越来越多,但公众对这项技术的长期看法却在走下坡路。这有点像社交媒体在2010年代后期的处境——大家都在用,但没人觉得它在让世界变好。AI会不会走同样的路,接下来几年就能看出来。

  • claude-mem —— 82.9K+ Stars,让 AI 智能体拥有跨会话持久记忆的开源工具

    🔥 GitHub 热门 AI 开源项目 · 第 21 期

    📌 项目简介

    claude-mem 是为所有 AI 智能体提供跨会话持久化记忆的开源工具。它能自动捕获 AI 代理在会话中的所有操作行为,通过 AI 压缩生成结构化记忆条目,并在后续会话中自动注入相关历史上下文。支持 Claude Code、OpenClaw、Codex、Gemini、Copilot 等主流 AI 编程工具,让无状态的 AI 代理拥有真正的”长期记忆”。

    🖼️ 项目预览

    claude-mem 项目预览
    claude-mem – AI 智能体跨会话记忆引擎

    ⚙️ 安装要求与过程

    环境要求

    • Node.js ≥ 18.0.0(核心运行环境)
    • ✅ 支持的操作系统:macOSLinuxWindows(WSL2 推荐)
    • ✅ 已安装任意支持的 AI 工具:Claude Code / OpenClaw / Codex / Gemini CLI / Copilot 等
    • ✅ 网络畅通(需访问 AI 供应商 API)

    快速安装

    # 交互式安装(推荐)
    npx claude-mem install
    
    # 指定参数安装
    npx claude-mem install --provider gemini --model gemini-pro
    
    # 安装后修复(如遇问题)
    npx claude-mem repair
    
    # 查看版本
    npx claude-mem --version

    Server Beta 模式(团队协作)

    # 配置环境变量
    export CLAUDE_MEM_RUNTIME=server-beta
    export CLAUDE_MEM_SERVER_DATABASE_URL=postgres://user:pass@localhost:5432/claudemem
    
    # 启动 API 服务
    claude-mem server start
    
    # 启动生成 Worker
    claude-mem server worker start

    ✨ 核心功能

    1. 全自动上下文捕获与注入

    无需任何手动标注,claude-mem 自动捕获会话中的所有工具调用、文件读写、代码编辑等行为,通过 AI 压缩生成结构化记忆条目。新会话启动时,自动注入最相关的历史上下文,让 AI 代理”记得”之前做过的工作。

    2. 多工具统一支持

    原生支持 Claude CodeOpenClawCodexGeminiHermesGitHub CopilotOpenCode 等主流 AI 编程工具。同时支持通过 MCP 协议接入 Cursor、Windsurf 等更多 IDE,真正实现”一次安装,处处可用”。

    3. 可视化记忆管理

    内置 Web 查看器(默认 localhost),可实时查看 AI 代理的操作记录、生成的记忆条目、会话统计等信息。支持按项目筛选记忆内容,可手动触发项目全量学习(/learn-codebase),帮助 AI 快速理解代码库。

    4. 企业级多租户支持(Server Beta)

    支持基于 Postgres 的独立服务端部署,无需依赖本地 Worker 进程。提供团队/项目级别的权限隔离、API Key 管理、操作审计链路,支持 Docker 容器化部署和水平扩展,满足企业协作场景需求。

    5. 成本优化遥测

    采用 5 分钟滚动窗口聚合遥测事件,可降低 99.9% 的 PostHog 使用成本。支持历史遥测数据匿名化回填,AI 生成任务幂等性设计避免重复计费,用户可自主选择是否开启遥测。

    💡 典型使用场景

    场景一:多日开发项目的上下文延续

    你正在用 Claude Code 开发一个复杂功能,工作日结束时会话上下文已达到上限。第二天开始新会话时,claude-mem 自动注入昨天的设计决策、修改的文件、遇到的问题等关键上下文,让你无需重新解释项目背景,直接继续开发。

    场景二:团队协作中的知识共享

    在团队项目中,开发者 A 用 Claude Code 完成了某个模块的开发。通过 claude-mem 的 Server Beta 模式,团队成员 B 在新会话中也能获取到 A 的开发上下文,包括设计思路、踩过的坑、未完成的 TODO 等,实现 AI 辅助开发的”知识传承”。

    场景三:跨工具开发体验统一

    你白天用 Claude Code 开发,晚上用 Gemini CLI 做代码 Review。claude-mem 作为统一的记忆层,让不同 AI 工具之间共享上下文,无论在哪个工具中操作,AI 都能”记得”你之前做过什么。

    🌟 推荐理由

    AI 编程工具的最大痛点之一就是会话结束后上下文丢失——你花了半小时给 AI 解释项目背景,新会话又要重新来一遍。claude-mem 从根本上解决了这个问题。

    我特别欣赏它的零摩擦设计:安装后无需任何手动操作,AI 代理的所有行为都会被自动捕获和压缩。当你开始新会话时,相关记忆会自动注入,就像 AI “自然记得”之前的工作一样。

    另一个亮点是多工具统一支持。如果你像我一样同时使用多个 AI 编程工具,claude-mem 提供了一个统一的记忆层,让不同工具之间可以共享上下文。这比每个工具各自维护记忆要高效得多。

    项目的活跃度也很高,截至目前已有 82,991 个 Stars,最近更新在 2026 年 6 月,说明维护团队在持续迭代。Apache-2.0 许可也让它可以放心用于商业项目。


    📥 下载地址

    💡 小贴士:安装完成后,在 AI 工具中输入 /learn-codebase 可触发项目全量学习,让 AI 更快理解你的代码库。查看记忆内容可访问安装时显示的 Web 查看器地址(默认 http://localhost:<端口>)。

  • 世界模型公司Odyssey冲到145亿美元估值,Amazon、AMD都来了

    世界模型公司Odyssey冲到145亿美元估值,Amazon、AMD都来了

    大语言模型之后,AI的下一个战场在哪里?越来越多人的答案是:世界模型(World Model)。而这家叫做Odyssey的公司,刚刚用一份融资成绩单告诉市场:资本已经用真金白银投了票。

    Odyssey完成3.1亿美元B轮融资,投后估值145亿美元。这轮由Natural Capital领投,Amazon、AMD Ventures、GV等跟投。加上这笔,公司成立以来总共融了3.37亿美元——对于一个2023年才成立的初创公司来说,这个速度相当惊人。

    AI世界模型概念图
    世界模型试图让AI理解物理世界的运行规律 | 概念图

    创始人背景:自动驾驶的老兵

    Odyssey的两位创始人,CEO Oliver Cameron和CTO Jeff Hawke,都是从自动驾驶行业出来的。Cameron之前是自动驾驶初创公司Voyage的联合创始人兼CEO,后来Voyage被GM的Cruise收购,他就在Cruise做产品VP。Hawke则在另一家英国自动驾驶公司Wayve当工程师。

    这个背景其实解释了Odyssey在做什么。世界模型的核心是:让AI理解物理世界的运行规律——重力、碰撞、光线、物体之间的相互作用。这正是自动驾驶公司一直在攻克的问题,只不过Odyssey把它做成了一个通用平台,可以应用到游戏、机器人、虚拟现实等多个领域。

    怎么采集数据?背上摄像头走遍全世界

    要训练世界模型,得先有海量真实世界的视频数据。Odyssey的做法相当”物理”:派人背上摄像头,走街串巷地拍。这个思路其实和Google Earth有点像,只不过Google是开车拍,Odyssey是让人背着设备步行采集,能覆盖到车辆到不了的地方。

    世界模型不只是生成视频,它要模拟物理规律。这意味着AI生成的画面里,一个杯子掉到地上会碎,一个球踢出去会按照抛物线飞行——而不是每一帧都”猜”接下来发生什么。

    应用场景:从游戏到机器人

    目前Odyssey的世界模型已经有几个明确的方向。游戏是最直接的——用文字提示词生成可交互的3D视频内容,理论上可以大幅降低游戏场景的制作成本。机器人是另一个大方向:用世界模型做仿真训练,让机器人在虚拟环境里”摔”几千次,再放到现实里。

    和Amazon的合作也值得注意。Odyssey宣布AWS成为其首选云服务商,并且会优化模型以运行在AWS的Trainium芯片上——这是Amazon自家开发的AI训练芯片,直接对标Nvidia的GPU。有了Amazon的投资和云资源,Odyssey在算力成本上可能比竞争对手更有优势。

    天使投资人名单:硅谷半壁江山

    除了机构投资人,Odyssey这轮还拉来了一批重量级天使:Google传奇工程师Jeff Dean、知名天使Elad Gil、YC现任CEO Garry Tan、Vercel CEO Guillermo Rauch,还有Cruise创始人Kyle Vogt。这个阵容基本上把硅谷AI圈最有话语权的那批人都聚齐了。

    世界模型是不是下一个大机会,现在下结论还为时过早。但资本已经在用行动表态:这个方向,值得押注。

  • Google终于认真做智能音箱了,这次靠Gemini能不能翻身

    Google终于认真做智能音箱了,这次靠Gemini能不能翻身

    智能音箱这个品类,已经沉寂太久了。自从2020年Google发布Nest Audio之后,这个品类就进入了某种休眠状态——功能年年小修小补,但没人真正重新想一想:有了大模型之后,音箱到底应该是什么样子。

    Google本周给出了它的答案:一台叫做Google Home Speaker的新设备,售价99.99美元。这是Google六年来第一款真正意义上的新音箱,也是第一款”为Gemini而生”的音频设备。

    Google Home Speaker智能音箱
    Google Home Speaker,底部有一圈环形灯 | 图片来源:Google

    自然语言,终于能用了

    老一代智能音箱最大的问题,是你得”学它的语言”。想关灯,得说”关掉客厅的灯”;说错了用词,它就听不懂。Gemini进来之后,这个逻辑被打破了。

    新音箱支持完全自然的多步骤指令。你可以说:”把厨房灯调暗,放点轻松的音乐,再设个20分钟的定时器。”一句话,三个动作,不需要分三次说,也不需要记住特定的唤醒词格式。

    更实用的一点是:它支持中途纠正。说到一半改主意了?直接改就行。”把咖啡机关掉……哦不对,是打开。”Gemini能理解这种日常对话里的反复,而不是让你重新来过。

    10种新声音,能聊也能问

    除了控制智能家居,这台音箱还被设计为可以和你对聊。它内置10种新声音,支持”持续对话”模式——不用说”OK Google”就能接着问。你可以拿它学东西、查资料、聊想法,基本就是把Gemini的对话能力,从手机屏幕搬到了客厅里。

    音箱的麦克风会在”持续对话”模式下短暂保持开启,让你能自然追问,而不必每次都重新唤醒。

    外观上,新音箱延续了Google一贯的织物包裹设计,圆形身材,3.4 x 4.2英寸大小。美国市场有Jade和Berry两种颜色,全球版本则提供Hazel和Porcelain。底部新增一圈环形灯,用不同光效表示”在听”、”在想”和”在回答”三种状态。

    订阅制来了:高级功能月费10美元

    不是所有新功能都免费。Google推出了Google Home Premium订阅计划,月费10美元(或年费100美元),解锁更强大的AI能力:

    • Gemini Live自由对话(更高级的多轮语音聊天)
    • Nest摄像头活动解读——你不在家时,AI帮你总结发生了什么
    • 更深度的智能家居场景联动

    好消息是,Google会在前六个月免费提供这些高级功能,让你先试试再看值不值得续费。这套路和手机厂商差不多——先让你用上,再决定要不要交钱。

    问题是,消费者愿意为智能音箱的AI能力每月交10美元吗?Google在这个时间点推订阅制,勇气可嘉,但市场买不买账,还得看实际体验。


    这台设备目前已经开放预购,本月晚些时候发货。Google显然希望Gemini能成为下一个时代的”音箱灵魂”,就像Siri定义了上一代设备一样。只是,六年过去了,人们的注意力早就从音箱转移到了手机、耳机、甚至眼镜上。Google这次能不能翻盘,答案可能要等到年底假期销售季才能揭晓。

  • Snap 发布 2195 美元智能眼镜:戴着它能不能看起来不傻,这是个问题

    Snap 发布 2195 美元智能眼镜:戴着它能不能看起来不傻,这是个问题

    昨天 Snap 正式发布了 Specs 智能眼镜,定价 2195 美元。CEO Evan Spiegel 在接受 CNBC 采访时说,这款产品他们做了12年以上,目标是”把计算带进现实世界”,让人不再低头看手机屏幕。

    Snap Specs 智能眼镜
    Snap Specs 的粗框设计在时尚与科技之间走钢丝

    Spiegel 戴着它上镜,然后大家都分心了

    Spiegel 在采访里侃侃而谈的时候,作者 Victoria Song 注意到一个细节:他每动一下头,光线就会照在镜片上,隐约露出里面显示屏的轮廓。这个人正在讲”屏幕疲劳”和”想要更真实地连接世界”,而他脸上正架着一台把屏幕摆在眼睛前面的设备。

    但更多人注意到的是——这副眼镜戴在他脸上,看起来挺滑稽的。

    时尚是很主观的事,但 Specs 的设计客观来说很大胆。粗框、棱角分明的飞行员风格、巨型镜腿——如果里面没有任何科技,这副眼镜也会被当成”宣言单品”,大概只有 Iris Apfel 或者《超人总动员》里的 Edna Mode 才会日常戴着出门。

    2195 美元,本来也没想让普通人买

    Snap 把这副眼镜定位成” aspirational 级”时尚科技单品,不是卖给大众的日常消费品。这一点从他们的全球广告 campaign 就能看出来——拍摄者是时尚摄影师 Steven Meisel,这人在 Vogue 和 Versace、Valentino、Balenciaga 这些高定品牌里都是常客。

    所以这个逻辑大概是:先让时尚圈和科技圈的人戴上,做出一种”未来已来”的意象,然后再慢慢往大众市场渗透。当年 Snap 的太阳镜相机 Spectacles 也是这个路数,只不过那次渗透率比预期低了不少。

    和 Meta Ray-Ban 走的是两条路

    目前市面上最成功的 AI 智能眼镜是 Meta 和 Ray-Ban 合作的款,走的是”看起来像普通眼镜”的路线,价格也控制在普通人能接受的范围。Snap Specs 完全反着来——它长得就是要让你注意到,价格也直接拉到 2000 美元以上。

    • Meta 的路数:先让大众习惯戴着眼镜听歌、拍照、调 AI,悄悄把市场做起来
    • Snap 的路数:先做品牌调性,再谈销量,宁可让大多数人觉得”酷但买不起”
    • 两种策略各有道理,但 Snap 的前几代眼镜产品并没有证明这条路能走通

    说到底,眼镜这件事比手机难多了

    手机你可以做得很酷,因为没人看你的手机长什么样。眼镜不一样——它架在你脸上,每个人跟你说话的时候都在盯着它看。Meta 选了 Ray-Ban 这个本身就代表”经典好看”的框型,很聪明。Snap 选了一条更难的路:要让大家觉得这副看起来很怪的眼镜是”酷”的。

    这件事不是完全不可能。早期戴 Apple Watch 的人也被嘲笑过,现在它已经是全球销量最大的手表了。只是 Snap 需要回答一个问题:除了”这是 Snap 做的”和”这是智能眼镜”,普通人为什么要花 2195 美元买这副看起来有点怪的眼镜?

    Spiegel 说人们已经受够了屏幕。他说得也许对。但如果解决方案是换一种方式把屏幕摆在面前,这件事到底算不算”减少屏幕”,可能每个人都有自己的答案。

  • Claude Design 新编辑器上线:AI设计工具开始认真和 Figma、Canva 抢饭碗了

    Claude Design 新编辑器上线:AI设计工具开始认真和 Figma、Canva 抢饭碗了

    Anthropic 这周给 Claude Design 推了一波大更新,说白了就是要把”AI生成设计”这件事从玩具变成真正能干活的工具。最显眼的变化是一个新编辑器——现在你可以直接在画布上拖拽、缩放、对齐元素,不用再靠文字描述让AI猜你想要什么布局。

    Claude Design 新编辑器界面
    Claude Design 新编辑器支持直接拖拽和对齐元素

    一周破百万用户,然后呢?

    Claude Design 上线第一周就有超过100万人用过。这个数字挺吓人的,但也说明一个问题:想用AI帮忙做设计的人真的很多,只是之前的工具还不够顺手。

    新编辑器的逻辑其实很直接——之前你用Claude Design,基本上是用文字描述你想要什么,然后AI给你出图。现在多了一步:AI出图之后,你可以直接在画布上微调,拖动某个按钮的位置、调整间距、对齐元素。听起来不算什么大突破,但实际用起来差别很大,因为之前每次想改个小地方都要重新生成,很浪费时间。

    和设计系统打通,这才是企业级功能

    这次更新里最值得企业用户关注的功能,是设计系统导入。你可以把公司已有的设计系统(从GitHub仓库、设计文件或者直接上传)喂给Claude Design,之后它生成的所有内容都会自动对齐你们的设计规范。大公司里还能设置一个管理员角色,锁定标准设计系统,防止有人乱改。

    Claude 会把输出和你的设计系统做比对,在你看结果之前就先自己纠正一遍。这对需要保持品牌一致性的团队来说,省了不少事后返工的功夫。

    和 Claude Code 打通,设计到代码不用截图

    这次更新还有一个挺实用的功能:Claude Design 和 Claude Code 之间可以无缝接力。你在Design里把设计定稿了,可以直接交给Claude Code接着做开发,Code会接着你之前的设计继续,而不是从头开始重新理解一遍(或者靠截图来猜)。

    反过来也行——如果你习惯先在终端里干活,现在可以在Claude Code里直接用 /design 命令创建和编辑设计项目,不用切来切去。

    出口通向一堆常用工具

    生成好的设计现在可以导出到不少地方:PDF、PowerPoint是基本的,还能直接推送到Adobe、Canva、Gamma、Lovable、Miro、Replit、Vercel、Wix等工具里。Anthropic和Replit、Lovable都有合作表态,说要让”从想法到上线”整个流程更顺畅。

    • 对独立开发者来说,在Claude Design里画完界面,直接推去Replit改改就能跑,这个流程确实诱人
    • 对企业设计师来说,导出到Canva或Adobe继续精修,比重新在那些工具里从零开始效率高
    • 目前支持的出口还在增加,Anthropic说”更多目的地即将到来”

    Figma和Canva肯定注意到了这个动向。Claude Design的打法和它们不一样——它不是要做一个更好的设计工具,而是把”设计生成”这件事嵌进整个开发流程里,从想法到设计到代码,尽量不让你重复描述同一件事。

    这种做法的风险在于:如果AI生成的设计不够好,后面所有接力都是在浪费时间。Anthropic说这版的错误率已经大幅下降,生成同样质量的结果用的token也更少了。实际用起来怎么样,还得看用户自己的反馈。

  • vLLM —— 83K+ Stars 的 LLM 高性能推理引擎,PagedAttention 颠覆内存管理

    vLLM Logo

    vLLM — 高性能 LLM 推理与服务引擎

    ⚡ vLLM

    83K+ Stars · 面向大模型的高吞吐量、内存高效推理与服务引擎

    📌 项目简介

    vLLM 是由加州大学伯克利分校 Sky Computing Lab 发起、现由 2800+ 贡献者共同维护的开源 LLM 推理与服务引擎。其核心竞争力在于首创的 PagedAttention 技术,通过智能管理注意力键值内存,大幅降低内存碎片,将 GPU 利用率推向极限。无论是本地开发调试,还是生产级大规模部署,vLLM 都是当前最热门的推理加速选择。

    83K+
    GitHub Stars

    2.8K+
    贡献者

    200+
    支持模型架构

    🛠️ 安装要求与过程

    环境要求:

    • Python 3.10+(推荐 3.12+)
    • NVIDIA GPU(CUDA 12.9/13.x)或 AMD GPU(ROCm)
    • 也支持 CPU、Google TPU、Apple Silicon 等多种硬件
    # 推荐用 uv 安装(更快更可靠)

    uv pip install vllm

    # 或用 pip

    pip install vllm

    # 快速启动 OpenAI 兼容 API 服务

    python -m vllm.entrypoints.openai.api_server \
    –model Qwen/Qwen3-8B –port 8000

    🚀 核心功能

    ⚡ PagedAttention 内存管理

    将注意力键值内存分页管理,类似操作系统的虚拟内存机制,大幅减少内存碎片和冗余复制,内存利用率提升 2-4 倍。

    🔄 持续批处理 + 前缀缓存

    动态合并正在处理的请求,并复用相同前缀(如 system prompt)的计算结果,吞吐量提升 3-5 倍。

    🧩 200+ 模型架构原生支持

    无缝兼容 Hugging Face 主流模型,涵盖 Llama、Qwen、DeepSeek-V3、Gemma、Mixtral、LLaVA 等,开箱即用。

    🔧 丰富量化方案

    支持 FP8、INT8、INT4、AWQ、GPTQ、GGUF 等主流量化格式,在保持精度的同时大幅降低显存占用和推理延迟。

    🌐 OpenAI 兼容 API

    提供与 OpenAI API 完全兼容的接口,只需改一行代码即可从 OpenAI 切换到自托管 vLLM,零迁移成本。

    💡 典型使用场景

    场景一:私有化部署大模型 API 服务

    企业希望在内部环境部署 Qwen 或 Llama 大模型,提供类似 OpenAI 的 API 供业务系统调用。vLLM 可在单张 H100 上实现远超传统方案的吞吐量,显著降低推理成本。

    场景二:本地开发与环境调试

    开发者在本地机器上调试 Prompt 或测试 Agent 工作流,需要快速启动一个兼容 OpenAI SDK 的本地服务。vLLM 一条命令即可启动,支持流式输出和工具调用。

    场景三:多模态模型推理服务

    需要部署 LLaVA、Qwen-VL 等多模态模型,同时处理文本和图像输入。vLLM 对多模态模型提供原生支持,统一的 API 接口让多模态应用开发更加便捷。

    ✨ 推荐理由

    vLLM 是目前 LLM 推理领域最炙手可热的开源项目,没有之一。它的核心竞争力在于 PagedAttention——这项技术直接解决了 LLM 推理中内存管理效率低下的痛点,是业界首个将操作系统虚拟内存思想引入注意力机制的工作,还发表了 SOSP 2023 学术论文。

    实际使用下来,vLLM 最让人省心的是「开箱即用」——Hugging Face 模型直接加载,OpenAI API 直接兼容,量化方案直接配置。对于想把大模型「跑起来」的团队,vLLM 是目前最成熟、社区最活跃的选择。

    值得一提的是,vLLM 的社区生态极其繁荣,AWS、NVIDIA、AMD、Google Cloud 等巨头均在赞助其开发。这意味着 vLLM 不仅是一个开源项目,更正在成为 AI 推理层的事实标准

    📥 下载地址

    License: Apache 2.0 | 语言: Python | 最初开发: UC Berkeley Sky Computing Lab

  • 三星手机将推出宠物健康AI检测,拍张照片就知道猫咪狗狗有没有病

    三星手机将推出宠物健康AI检测,拍张照片就知道猫咪狗狗有没有病

    三星在巴黎VivaTech 2026大会上亮了个新功能,挺有意思的——用手机拍一张猫狗的照片,AI就能帮你判断宠物有没有牙周病或者肥胖问题。这个功能是与宠物健康管理平台Lifet合作开发的,预计会整合到Galaxy手机的SmartThings应用和宠物护理生态里。

    给宠物看病的AI来了

    养宠物的人大概都有过这种经历:猫狗有点不对劲,但你不确定是不是该去看兽医,或者你拍了照片发给朋友,大家也都是凭经验猜。三星这个功能的思路是直接用AI分析照片,给出健康风险提示。

    三星宠物健康AI检测
    用Galaxy手机拍摄宠物照片,AI分析健康状况

    Lifet的平台本来就有网页版和App,这次和三星合作以后,相当于把宠物健康筛查直接搬到了手机上。你拍张照,几秒钟就能知道你的猫是不是可能超重了,或者狗狗的牙龈有没有发炎的迹象。

    三星的AI健康布局

    这不是三星第一次往健康领域押注。他们的Galaxy Watch已经能测心电图、血氧、睡眠质量,现在又把宠物健康拉进了生态。三星在VivaTech上说的”连接式护理解决方案”,其实就是想把人的健康和宠物的健康都整合到SmartThings里,一站式的健康管理。

    全球宠物经济一直在涨,但宠物医疗的信息不对称一直没怎么被科技解决。三星这个方向选得挺聪明的。

    当然,这种AI检测肯定不能替代真正的兽医诊断。三星应该也会在功能上线时加免责声明。但它的价值在于”提醒”——很多问题如果发现得早,治疗成本和宠物遭的罪都会少很多。AI做不了兽医,但做个早期预警还是可以的。

    这个功能目前还在开发阶段,三星没有公布具体的上线时间。不过从VivaTech的演示来看,基本思路已经跑通了。等正式推出以后,Galaxy用户随手拍张照片就能给宠物做个简易体检,这体验还是挺有吸引力的。


  • 三分之二美国人认为AI发展太快,年轻人最悲观

    三分之二美国人认为AI发展太快,年轻人最悲观

    皮尤研究中心刚发布了一份挺有意思的调查报告,他们问了几千个美国人怎么看AI。结果出来以后,估计硅谷那帮人会觉得有点扎心——63%的受访者说AI发展太快了,只有16%的人觉得AI对社会会有正面影响。

    用的人多了,担心的也多了

    这次调查是今年2月做的,一共问了5119个美国成年人。有个数字挺显眼:49%的人说用过AI聊天机器人,比2024年的33%涨了不少。ChatGPT最常用,44%的人说用过,比2023年翻了一倍。

    年轻人用得最多——18到29岁这个年龄段,66%的人用过聊天机器人。但讽刺的是,恰恰是这群人最不看好AI的前景。48%的年轻人觉得AI会产生负面影响,只有14%觉得是好事。

    AI调查配图
    三分之二的美国人对AI的快速发展保持警惕

    每天在用,但不太信

    大约四分之一的美国人说他们每天都会用聊天机器人。用得最多的场景是搜索信息(42%)和工作任务(38%)。三成的人觉得AI让他们的生产力提高了,但也有不少人对AI给出的信息质量表示怀疑。

    66%的美国人认为AI会让他们的个人信息更不安全,只有3%的人觉得会更安全。

    对政府的监管能力,大家也没什么信心。67%的人说他们对美国政府有效监管AI”信心不足”。有趣的是,民主党人比共和党人更不相信政府能管好AI——这在两年前还是反过来的。

    智能设备渗透日常生活

    除了聊天机器人,AI还在以别的方式进入美国人的家。35%的人有智能音箱(比如Amazon Echo),37%的人有智能手表,18%的人装了智能门铃。60%的人说他们会看搜索引擎结果顶部的AI摘要。

    这些数字说明,AI已经不是什么未来概念了,它正在真实地改变人们获取信息、管理健康和与科技互动的方式。但公众的情绪显然比硅谷的乐观叙事复杂得多——人们在使用这些工具,同时也在用警惕的眼光打量它们。


  • AI代理进公司打工,这家公司要给它们发员工身份

    AI代理进公司打工,这家公司要给它们发员工身份

    AI代理进公司打工,这件事在过去一年里从概念变成了现实。Goldman Sachs去年把AI编程代理Devin当正式员工来用,McKinsey年初说自家已经有25000个AI代理在和60000名人类员工一起干活。问题跟着来了:这些”数字员工”谁来管?权限怎么给?出了问题找谁?

    给AI代理发”工牌”

    网络安全创业公司NewCore从隐身模式走了出来,拿了6600万美元种子轮,估值after investment 3亿美元。领投的是专注网络安全的风投Cyberstarts,Index Ventures和Evolution Equity Partners跟投。他们的产品说白了就是一件事:把AI代理当”员工”来管理,给它们发身份、设权限、能吊销、能审计。

    AI代理身份管理概念图
    AI代理需要自己的”员工身份”,而不只是一串API密钥 | 配图来源:WorkBuddy AI生成

    创始人Zohar Alon之前创办过云安全公司Dome9(后来卖给了Check Point),他说服自己再创业的理由是:现在的身份系统——Okta、微软的Entra这些——都是给人类员工设计的,AI代理往里一塞,scale和复杂度会把它们撑爆。

    “我们很确定,AI代理要给那些用了15年、20年的身份平台增加的规模和复杂度,迟早会把它们搞崩。”
    ——Zohar Alon,NewCore联合创始人兼CEO

    不是给机器密钥,是给数字员工身份

    NewCore的平台把人类员工和AI代理的身份放在同一个系统里管,但AI代理拿的是”一等身份”——有自己的权限生命周期控制、独立的吊销机制,而不是被塞进传统的service account或者机器密钥的抽屉里。

    技术上一个关键是所谓的”split-key”架构:把关键身份凭证分成两份,客户拿一份,平台拿一份,这样就没有单一妥协点了。对于已经在用Anthropic Claude Code、OpenAI Codex或者Cursor的团队,NewCore提供了一个”Agentic Skill”集成包,让这些AI工具以受管身份访问企业系统,而不是靠人工分发的密钥。

    员工还可以用NewCore的手机App来授权、审查、吊销AI代理的访问权限——Alon把它描述成人类监督层,公司在部署更自主的系统时,总得有个”人”在循环里。

    AI代理比你想象的更快进入职场

    NewCore现在有50多个员工,分布在美国和以色列,平台当前有不到10个客户和10多个设计伙伴在用它。公司预计今年夏天开始向客户收费。

    Alon的预测是:在聚焦技术的组织里,AI代理数量几年内就会超过人类员工。TCS董事长N. Chandrasekaran最近也说了类似的话:AI代理的规模终将匹敌这家印度IT服务公司的员工总数。

    身份系统很可能是第一个被大规模AI代理部署压垮的企业系统。公司最终会需要新办法来监控、授权和吊销那些在网络里跑来跑去的数字工人——在它们搞出乱子之前。