标签: AI

  • Stable Diffusion WebUI:最流行的AI图像生成工具,163K+ Stars让你在浏览器里玩转Stable Diffusion

    Stable Diffusion WebUI:最流行的AI图像生成工具,163K+ Stars让你在浏览器里玩转Stable Diffusion

    Stable Diffusion WebUI 界面截图

    🎨 项目简介

    Stable Diffusion WebUI 是由 AUTOMATIC1111 开发的基于 Gradio 框架的 Stable Diffusion 浏览器交互界面,是 AI 图像生成领域最流行、功能最完整的开源工具。只需简单部署,即可在浏览器中完成文生图、图生图、模型训练、参数微调等全流程 AI 绘画操作。

    🟣 163K+ Stars
    📦 最流行 AI 绘画工具
    🔧 丰富扩展生态
    💻 本地私有部署

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.10.6(更高版本可能不兼容 torch)
    • Git
    • NVIDIA 显卡(推荐 4GB+ 显存,2GB 也可运行)
    • 或 AMD 显卡 / Intel 核显 / Apple Silicon(需参考对应安装指南)

    Windows 快速安装(推荐方式)

    # 方式1:一键包(最简单)
    下载 v1.0.0-pre 版本的 sd.webui.zip
    解压后依次运行 update.bat 和 run.bat 即可

    # 方式2:源码安装
    1. 安装 Python 3.10.6(勾选 “Add Python to PATH”)
    2. 安装 Git
    3. 克隆仓库:
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    4. 双击运行 webui-user.bat

    Linux 安装

    # Debian/Ubuntu
    sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    cd stable-diffusion-webui
    ./webui.sh

    🚀 核心功能

    🖼️ 文生图 / 图生图
    支持 txt2img 和 img2img 核心模式,内置参数调节、分辨率控制、批处理

    🎭 Inpainting / Outpainting
    支持局部重绘(内绘)和扩展画布(外绘),智能补全图像内容

    🔧 模型与扩展
    支持 Textual Inversion、LoRA、Hypernetworks,兼容数千个社区扩展插件

    🎨 后期处理与超分
    集成 GFPGAN、CodeFormer 人脸修复,RealESRGAN 超分辨率,批处理工具

    🎯 Attention 精准控制
    支持 ((keyword)) 和 (keyword:weight) 语法精确控制模型对提示词的关注度

    💡 典型使用场景

    🎬 场景一:AI 艺术创作

    输入自然语言提示词(如 “a fantasy castle on a floating island, digital art, trending on ArtStation”),即可生成高质量 AI 艺术作品。通过 Negative Prompt 排除不想要的元素,使用 X/Y/Z plot 批量测试不同参数组合,快速找到最佳生成配置。

    🔄 场景二:图生图风格转换

    上传参考图片,配合提示词进行风格转换(如将照片转为动漫风格、油画风格)。支持 Denoising strength 控制与原图的相似度,配合 Inpainting 可精确重绘指定区域(如更换人物服装、修改背景)。

    🏋️ 场景三:LoRA 模型微调与训练

    使用 Training 标签页训练自己的 Textual Inversion 嵌入或 LoRA 模型,只需几十张样本图片即可学习特定人物、风格或物品特征。训练完成后一键加载,在生成中调用自定义概念,实现个性化 AI 绘画。

    🌟 推荐理由

    Stable Diffusion WebUI 是 AI 绘画领域毫无争议的标杆工具。作为 GitHub 上 Star 数最多的 Stable Diffusion 界面(163K+),它不仅功能全面,更重要的是拥有最活跃的社区和扩展生态——目前已有数千个自定义脚本和扩展插件,覆盖从人脸修复、批量处理到 ComfyUI 工作流集成的各类需求。

    与云端 AI 绘画服务(如 Midjourney)相比,WebUI 的最大优势是完全本地运行,无需付费订阅,数据隐私有保障,且支持任意开源 Stable Diffusion 模型(SD1.5/SD2.0/SDXL/SD3 等)。对显存的要求也相当亲民——4GB 显存即可流畅运行,甚至 2GB 也有成功案例。

    无论你是 AI 艺术创作者、游戏美术设计师,还是仅仅对 AI 绘画感兴趣的爱好者,Stable Diffusion WebUI 都是最好的起点。一键安装脚本让部署变得异常简单,丰富的教程资源和社区支持也能帮助你快速上手。

    AI绘画
    Stable Diffusion
    图像生成
    本地部署
    开源
  • 英伟达说它的AI数据中心可以不用水了

    英伟达说它的AI数据中心可以不用水了

    AI数据中心耗水这件事,过去一年里被翻来覆去地骂过了。从美国中西部 farmers 抱怨地下水被抽干,到环保组织把数据中心称为”数字吸血鬼”,舆论的压力终于让产业链里最有话语权的人坐不住了。

    英伟达在本周的一篇博客里给出了自己的答案:把数据中心的设计改成100%液冷,同时让服务器运行在更高的温度——最高到45摄氏度(113华氏度)。两套组合拳打下来,英伟达说,传统冷却塔系统每兆瓦每年要耗掉约260万加仑水,而新设计可以”把用水量降到接近零”,最高减少100%。

    热一点,反而省水

    这套设计的核心逻辑其实不难理解。传统数据中心用冷却塔把热量排到水里,水被加热后蒸发,带走热量——但这也意味着大量的水就这么没了。英伟达的Rubin代参考设计改用了全液冷:热量在芯片上就被”抓住”,通过液体回路传递出去,而且液体本身可以跑很高的温度。

    温度越高,室外的干式冷却器就越容易把热量排出去——因为温差大了。结果是,一年里有大部分时间,根本不需要用水来冷却。英伟达的可持续发展负责人乔什·帕克说,从传统冷却塔系统的约260万加仑/兆瓦/年,可以降到”接近零”。

    “热量在芯片上被直接捕获,通过液体回路以高得多的温度传输,让室外干式冷却器在一年中的大部分时间里都能高效排热。”——英伟达官方博客

    不是所有人都买账

    当然,英伟达的这篇博客出来之后,质疑的声音也不少。Gizmodo的文章就指出了一个很现实的问题:英伟达没有提这套液冷数据中心的建设成本比传统风冷贵多少。如果贵到大部分公司不愿意改,那”参考设计”再好也就是个参考。

    另一个更根本的问题是,数据中心耗水只是它环境足迹的一部分。建设过程中混凝土和钢材的碳排放、运行时的耗电量(哪怕水冷更有效率,AI训练本身还是要吃大量电力)、还有为这些数据中心配套的新增发电能力——这些都没有因为液冷而消失。

    换句话说,英伟达解决了一个真实但局部的问题。至于整个AI基础设施是不是在一条不可持续的发展路径上狂奔,那是另一篇文章的话题了。


    亚马逊也在做类似的事

    英伟达不是唯一一个在这个方向上发力的人。亚马逊最近也高调宣传了自己数据中心的”更高耐热 tolerance”设计,通过让服务器允许运行在更高温度,减少冷却所需的能量和水。只不过亚马逊的数据中心大部分还是风冷的,改进幅度没有英伟达的100%液冷那么激进。

    有意思的是,英伟达在博客里说”每一个为Rubin代建设云服务和数据中心的运营商都在做这个转型”。如果这是真的,那意味着从2026年开始,新建的大型AI数据中心会大规模转向液冷——这对那些还在用老设计的公司来说,可能会面临越来越大的舆论和客户压力。

    Nvidia液冷AI数据中心设计
    英伟达Rubin代参考设计,100%液冷方案 | 图源:Nvidia

    这件事的真正意义

    把这件事放在更大的背景里看,它其实标志着AI基础设施竞争的一个新阶段。过去大家比的是谁的芯片快、谁的模型准,现在开始有人比谁的数据中心更”干净”了。

    这对消费者来说可能是无感的——你不会因为你用的AI服务跑在液冷数据中心里就觉得它更好用。但对那些正在被数据中心”围困”的社区来说,这是一个实实在在的差异。如果英伟达的说法经得起独立验证,那它至少给行业指出了一条路——AI不一定非要以耗尽当地水资源为代价。

    当然,路有了和大家都走,是两回事。成本、标准、监管,这些才是决定液冷能不能真正普及的关键。英伟达开了口,接下来要看云服务商们跟不跟了。

  • 2026年科技大裁员:AI成了最好的借口

    2026年科技大裁员:AI成了最好的借口

    甲骨文(Oracle)本周一披露的文件让很多人倒吸一口凉气——过去12个月里,这家软件巨头悄无声息地裁掉了2.1万名员工,占其总劳动力的13%。而在同一份年报里,公司清楚地写着:”AI技术的采用和部署已经导致、并可能继续导致我们的劳动力减少。”

    这句话把2026年科技行业最刺眼的一层遮羞布给扯了下来。公司们一边报告着创纪录的营收,一边把”AI”三个字当成裁员通知书上最体面的理由。

    数字比故事更荒诞

    根据裁员追踪网站Layoffs.fyi的数据,今年以来已经有196家科技公司裁掉了超过11.98万名员工。而5月单月,美国科技行业的裁员规模达到了数年来的最高峰——促成这一波裁员的最常被提及的理由,就是AI。

    Cloudflare的CEO马修·普林斯在裁掉1100人(约占员工总数20%)之后,写了一篇博客文章解释原因。他说,被裁掉的”绝大多数人是测量者”——中层管理、财务、法务、内部审计、收入确认岗位。言下之意,AI把这些活儿接了,人不需要那么多了。那一个季度Cloudflare的营收是6.398亿美元,同比增长34%,是公司历史上最好的单季表现。

    营收在涨,人头在减。AI既是增长的引擎,也是砍人的理由。这套叙事在2026年的科技公司里,已经快变成标准模板了。

    一份不断变长的名单

    把今年这波”AI裁员潮”里的名字捋一遍,会发现一个有趣的模式——越赚钱的公司,砍人砍得越理直气壮。

    • Block(前Square):杰克·多西把将近一半的员工送走了——4000人,从1万多人砍到不到6000人。他在X上写,AI工具让”一种全新的工作方式成为可能”。
    • 亚马逊:1月砍掉1.6万个企业岗位,紧接着2025年10月已经砍过1.4万个。CEO安迪·贾西的理由是”减少层级、增加 ownership、去掉官僚作风”,顺带提了一句生成式AI会让公司需要”更少的人来做今天在做的一些工作”。
    • 谷歌:没有宣布一个总数,但过去一年里悄悄裁掉了超过三分之一管理小团队的管理者。云业务季度营收增长63%,首次突破200亿美元,网络安全团队却被悄无声息地削了一刀。
    • Meta:5月裁掉约8000人(约占劳动力10%),同时把约7000人转进了AI岗位——据说是”他们讨厌的那些岗位”。
    • 英特尔:2025年Q4到2026年4月,估算累计裁掉3000到9000个美国岗位,累计自2024年9月以来超过1.5万个职位消失。

    这份名单还可以继续列下去:Intuit裁3000人(17%劳动力)、Cisco裁4000人、Coinbase裁700人、PayPal计划未来两三年内裁20%员工(超4500人)……

    AI是真话,还是漂亮的借口?

    科技公司把裁员归因于AI,外界的反应从”果然如此”到”分明是借口”都有。有一点是真的:疫情期间科技公司大举招人,如今这些膨胀的编制本来就需要消化。把AI搬出来,至少让裁员听起来像是面向未来的主动选择,而不是管理失误的后遗症。

    但数据是另一回事。Coinbase的CEO布莱恩·阿姆斯特朗说,AI让工程师”用几天时间完成了过去一个团队要花几周才能做完的事”。如果这是普遍事实,那被裁掉的人里,有多少是真正被AI替代的,又有多少只是恰好在编制缩减的名单上?

    更有意思的是,这些公司一边裁人,一边还在招AI相关岗位。IBM说要三倍增加美国AI和混合云方向的校招名额;通用汽车裁掉500-600个IT岗位的同时,还有约80个AI相关职位挂着。AI没有消灭工作,它只是重新分配了——往哪个方向,就看你站在哪一边了。

    2026年科技行业AI裁员潮
    2026年,AI成为科技公司裁员公告里的常客 | 图源:TechCrunch

    普通的打工人该怎么办

    这场”AI裁员潮”最让人不安的地方,不是某一家公司裁了多少人,而是它正在变成一种预期——每当你听到一家科技公司报告了好业绩,下一个新闻可能就是它要”优化组织结构以拥抱AI”了。

    对普通人来说,这个信号其实挺清楚的:如果你的工作主要是”测量”——做报表、走流程、把A数据搬到B表格里——那AI确实已经在敲门了。但不是所有人都没机会,那些能跟AI协作、懂得用工具放大自己产出的人,反而在这一轮里变得更值钱了。

    只是,这个过程里有多少人是被抛在后面的,就没有人愿意仔细算了。

  • AI把租房广告变成了”卖家秀”:虚拟staging正在坑租客

    看房前,先学会识别AI生成的”假房子”

    Joyce在纽约找房子,在网上看到一间曼哈顿的Studio公寓,照片里空间宽敞、装修精致,还有个壁炉。她立马约了看房。到了现场才发现:房间比照片小了快一半,水槽不一样,灶台少了几个旋钮,壁炉根本不存在。她的朋友后来开玩笑说:”其实应该早点看出来是AI的——你看照片里燃气灶上还放了一盆植物。”

    这种事在纽约、旧金山、洛杉矶这样租房紧张的城市越来越常见。房产经纪人历来擅长把破房子拍出”能住人”的感觉,但生成式AI把这件事变成了点几下鼠标就能完成的任务——而且效果比传统修图夸张得多。

    AI虚拟staging租房陷阱
    AI虚拟staging让租房广告中的房子看起来比实际好太多|插图

    “虚拟布置”不是新东西,但AI让它失控了

    Virtual staging(虚拟布置)本身不是新鲜事。早在这波AI热潮之前,房产经纪人就会用软件把空房间”摆”上家具,让租客更容易想象自己住进去的样子。那时候的虚拟布置还算克制——家具尺寸大致合理,房间布局基本符合物理规律。

    生成式AI进来之后,情况变了。现在的AI工具可以在几秒钟内生成一套”完美”的房间效果图,而且不需要任何真实性约束——六人餐桌可以塞进10平米的Studio,不存在的壁炉可以放在不存在的客厅里。更关键的是,这些图片看起来”足够真实”,如果不是细心的人,很难一眼看出来。

    问题在于:租房市场上的信息不对称本来就严重,AI让这种不对称变得更极端了。租客花了时间、通勤成本去看房,结果发现房子和照片完全两样——这种浪费对整个市场的效率是一种损耗。

    监管在哪?

    目前美国各州对AI生成内容在房屋租赁广告中的使用,基本处于”没人管”的状态。联邦贸易委员会(FTC)有关于广告真实性的规定,但那些规定是针对”虚假宣传”的,执行起来需要有人举报、调查、取证,周期很长。

    纽约市正在考虑一项法案,要求房屋租赁广告必须披露是否使用了AI生成的图片。这个思路是对的——就像食品包装上要标注成分一样,租房广告如果用了AI修图,也应该让租客知道。但法案能不能通过、通过了怎么执行,都是未知数。

    租客能做什么?

    眼下的现实是:租客只能靠自己。几个实用的建议:

    • 看房前用Google街景确认一下楼的外观,如果广告里的楼和街景对不上,基本可以确定照片有问题
    • 注意照片里的细节——家具比例、光线方向、窗外景色是否一致
    • 要求看”原始照片”或视频看房,很多经纪人其实手里有没修过的照片
    • 如果条件允许,优先选择提供实地看房的房源

    说到底,AI虚拟staging本身不是坏事——它可以帮助租客更好地理解空间可能性。问题在于当它为虚假宣传服务的时候,没有人来约束。这个灰色地带还会存在多久,取决于监管什么时候跟上。


    Joyce后来找到了另一间公寓,没用AI照片的那间。她说:”以后看房前,我都会先假设照片是假的。”这句话挺悲哀的,但在2026年,这可能是最实用的生存策略。

  • OpenAI给ChatGPT买了一张”合法身份证”:和Getty Images的合作,不止是几张图片的事

    一张照片的授权费,OpenAI替AI行业交了

    上周OpenAI和Getty Images悄无声息地签了一纸协议,内容是:ChatGPT以后在回答问题和搜索结果里,可以直接展示Getty Images的授权图片。这不是一句公关废话,背后是AI公司和版权方长达三年的对峙终于换了一种玩法。

    Getty Images不是小角色。它手里握着近6亿张图片的版权,是全球最大的专业图库之一。2023年,Getty以”未经授权使用版权图片训练模型”为由,把Stability AI告上了法庭,索赔金额高达1.8万亿美元。那场官司到现在还没打完,但整个AI行业都看清了一件事:训练数据从哪儿来,以后会越来越是个问题。

    ChatGPT与Getty Images合作
    OpenAI与Getty Images达成多年授权合作,ChatGPT将展示正版图片|插图

    Perplexity先走了一步,OpenAI跟上了

    其实在这之前,Getty Images已经和另一家AI公司做过类似的事。今年早些时候,Perplexity宣布在搜索结果里嵌入Getty Images的授权图片,用户搜到的每一张图都是”干净”的,有授权、有来源。当时不少人觉得Perplexity是在借Getty的品牌背书,让自己和那些”随便抓图训练”的AI公司区别开来。

    现在OpenAI也跟进了。ChatGPT的搜索功能每天都在和Google、Perplexity抢用户,如果搜出来的图片一半是侵权风险、一半是来历不明,用户迟早会用脚投票。与其等法院判,不如先自己把路铺好。

    这次合作的核心逻辑很简单:AI公司付钱买授权,版权方拿到一笔稳定的”AI时代版税”,用户用到的图片有来源可查。三方各退一步,换一个都能接受的局面。

    AI训练数据的”原罪”,正在被悄悄洗掉

    过去两年,AI公司和版权方的关系基本是”你告我、我继续用”。Stable Diffusion、Midjourney、ChatGPT的图像生成能力,很大程度上建立在”互联网上所有图片我都能用”的假设上。这个假设现在越来越站不住脚了。

    欧盟的《AI法案》已经要求AI公司披露训练数据来源。美国法院的判决也在往版权方倾斜。上个月,一名联邦法官裁定AI公司使用版权内容进行训练不一定属于”合理使用”(fair use),这个判决对整个行业都是一记警钟。

    OpenAI选择和Getty Images合作,某种程度上是在给整个行业探路。如果这条路走得通,其他AI公司大概率也会跟进——毕竟,没人想成为那个”坚持不付钱然后被告到破产”的典型。

    用户感知不强,但影响深远

    对普通ChatGPT用户来说,这个变化可能不太明显。以前搜”埃菲尔铁塔”出来的图片是哪儿来的,大多数人不会去点开看。以后这些图片会带上Getty Images的水印或来源标注,仅此而已。

    但往大了说,这是AI行业从”野蛮生长”向”合规化”转型的一个缩影。训练数据、生成内容、版权归属——这些问题在过去是可以”先做了再说”的灰色地带,现在正在一个个被摆到台面上来解决。

    Getty Images首席执行官Craig Peters在公告里说了一句话,挺值得玩味的:”我们要确保AI的发展不会以牺牲创作者的权益为代价。”这话听起来像公关辞令,但仔细想想,如果创作者真的从AI的每一张生成图片里都拿不到一分钱,谁还愿意往互联网上传原创内容?那样的话,AI训练数据枯竭也不是不可能。


    OpenAI和Getty Images的这笔交易,金额没披露,期限说是”多年”。可以预见的是,接下来会有更多类似的授权协议冒出来。AI公司掏钱买安心,版权方拿到新的收入来源,这大概是眼下能想到的、最不坏的一种结局。

  • LangGraph:Build Resilient Agents,LangChain 团队出品的 AI 智能体编排框架,循环计算图让智能体真正「会思考」(35.5K Stars)

    LangGraph:Build Resilient Agents,LangChain 团队出品的 AI 智能体编排框架,循环计算图让智能体真正「会思考」(35.5K Stars)

    🔄

    LangGraph

    Build Resilient Agents —— LangChain 团队出品的 AI 智能体编排框架

    35.5K+ Stars
    MIT 许可
    Python
    LangChain 官方

    LangGraph 是由 LangChain 团队开发的 AI 智能体编排框架,专为构建有状态、可循环、鲁棒的 AI 智能体而设计。与传统的 DAG(有向无环图)工作流不同,LangGraph 支持循环计算图,让智能体能够真正”思考-行动-反思”,实现接近人类的问题解决过程。

    LangGraph 架构设计

    LangGraph 循环计算图设计(支持状态循环与条件分支)

    ⚙️
    安装要求和过程

    环境要求

    • Python >= 3.9
    • pip 或 poetry 包管理器
    • (可选)LangChain 生态集成
    • (可选)LangSmith 用于调试追踪

    快速安装

    # 安装 LangGraph 核心库
    pip install langgraph
    
    # 安装 LangGraph CLI(用于本地开发)
    pip install langgraph-cli
    
    # 安装 LangChain(如需使用 LangChain 集成)
    pip install langchain langchain-openai
    
    # 使用 poetry
    poetry add langgraph

    最新版本:langgraph==1.2.6(2026-06-18 发布)


    核心功能

    01

    🔄 循环计算图支持

    与传统 DAG 框架不同,LangGraph 支持循环(cycles)条件分支,让智能体能够迭代优化输出、进行多轮对话、实现复杂的决策逻辑。这是构建真正”会思考”的智能体的关键能力。

    02

    💾 持久化状态管理

    内置 Checkpointer 机制,支持将智能体状态持久化到内存、SQLite、PostgreSQL 等存储后端。支持人机协作(Human-in-the-Loop):可以在智能体执行过程中暂停、审核、修改状态,然后继续执行。

    03

    🎯 细粒度控制与调试

    支持 时间旅行(Time Travel) 调试:可以回到智能体执行的任意步骤,检查状态、修改输入、重新运行。完美集成 LangSmith 进行追踪和评估。支持断点、单步执行、状态快照等高级调试功能。

    04

    🏗️ LangGraph Studio 可视化 IDE

    提供 LangGraph Studio 桌面应用,可视化编辑智能体工作流、实时预览执行状态、交互式调试。支持一键部署为 API 服务,或导出为 Python 代码。让智能体开发从”写代码”升级为”画流程”。

    05

    🚀 生产级部署方案

    提供 LangGraph Cloud(托管服务)和 自托管(Docker + LangGraph Server)两种部署方式。支持水平扩展、异步执行、长时运行任务、Webhook 回调等企业级特性。已有数千家公司在生产环境使用。

    💡
    典型使用场景

    场景一:多轮对话智能客服

    利用 LangGraph 的循环计算图,构建能够”理解上下文→查询知识库→生成回复→等待用户反馈→迭代优化”的智能客服。通过持久化状态,即使会话中断数小时,智能体仍能记住之前的对话内容。配合 LangSmith 可以持续优化回复质量。

    场景二:AI 研究智能体

    构建能够”分解问题→搜索资料→阅读内容→综合答案→验证准确性→补充细节”的自主研究智能体。LangGraph 的循环机制让智能体可以在发现信息不足时自动回溯、重新搜索,直到找到满意答案。这是 LangGraph 官方示例中的经典案例。

    场景三:代码审查智能体

    构建代码审查工作流:智能体 A 负责读取 PR diff,智能体 B 负责检查代码规范,智能体 C 负责生成审查意见,协调器(supervisor)负责整合结果。LangGraph 的多智能体协调能力让这种复杂协作变得简单。支持人工审核节点,关键决策需人工确认后才执行。

    ❤️
    推荐理由

    作为 LangChain 生态的核心框架,LangGraph 解决了 AI 智能体开发中最棘手的问题:如何让智能体”有记忆、能循环、可调试”。如果你用过 LangChain 的 LCEL(LangChain Expression Language),可能会觉得”链式调用”很方便,但遇到需要循环、条件分支、状态管理的复杂场景就力不从心了。LangGraph 正是为这些场景而生。

    我最欣赏 LangGraph 的 「时间旅行调试」功能。传统智能体开发是”黑盒”——你输入一个问题,等半天得到一个答案,中间发生了什么完全不知道。LangGraph 让你可以”回到过去”:查看某一步的状态、修改输入、重新运行。这简直是 AI 智能体开发的”时光机”,大幅提升了调试效率。

    另外,LangGraph Studio 是我见过最实用的 AI 智能体可视化工具。它不仅能”看”到智能体的执行流程,还能”改”——直接在某一步修改状态,然后继续运行。对于复杂智能体的开发和演示,这是无敌的工具。

    当然,LangGraph 也有学习曲线。如果你是完全的新手,建议先从 官方教程开始,跟着示例做一遍”聊天机器人”和”研究智能体”两个案例,就能掌握核心概念。MIT 许可 + LangChain 团队维护 + 35K+ Stars,这是目前最值得学习的 AI 智能体框架之一。

    📊 项目信息

    GitHub Stars: 35,504+
    Forks: 5,956+
    开源许可: MIT
    主要语言: Python
    最新版本: langgraph==1.2.6
    最后更新: 2026-06-23
    维护团队: LangChain 团队
    Issues 开放: 591

    🔄 如果你正在构建需要”记忆、循环、反思”能力的 AI 智能体,

    LangGraph 是目前最成熟、最完整的解决方案。

    LangChain 生态官方框架 · MIT 许可 · 35K+ Stars · 生产环境验证

  • AI芯片红利分给谁了?SK海力士挤掉三星,成韩国市值一哥





    AI芯片红利分给谁了?SK海力士挤掉三星,成韩国市值一哥

    AI芯片红利分给谁了?SK海力士挤掉三星,成韩国市值一哥

    来源:The Verge · 2026年6月22日

    SK海力士半导体芯片工厂
    SK海力士的HBM芯片工厂,高带宽内存正是AI训练不可或缺的核心元件|示意图

    三星称霸韩国股市整整26年之后,终于被人挤下来了。这次把它拉下马的,不是什么新晋互联网巨头,而是曾经差点破产的同胞——SK海力士。

    路透社6月22日报道,SK海力士的市值已经突破1.35万亿美元,正式超越三星,成为韩国市值最高的公司。这个位子,三星从2000年起就一直坐着,中间经历过全球金融危机、手机电池爆炸门、内存价格暴跌,都没能被撼动。

    这次不一样。这次是AI把牌桌掀了。

    HBM:AI时代最抢手的东西

    SK海力士做的是什么生意?简单说,它是全球最大的高带宽内存(HBM)供应商。这种内存芯片和普通电脑里的内存不一样——它专门配给GPU使用,负责在AI训练和推理时,让数据能以极高的速度在芯片之间传输。

    你可以把它理解为GPU的”短期记忆”。AI模型越大,需要的HBM就越多。而目前全球能稳定量产HBM的公司,只有三家:SK海力士、三星、美光。其中SK海力士的技术最成熟,良率最高,英伟达最新款的Blackwell和Rubin芯片,用的都是SK海力士的HBM。

    谷歌的TPU也一样。SK海力士几乎是当前AI基础设施里最不可或缺的”隐形冠军”。

    “AI训练需要的不只是算力,还有足够快的内存。HBM就是那个瓶颈,而SK海力士握着瓶颈的钥匙。”

    三星怎么就掉队了

    三星不是没有做HBM。它起步甚至比SK海力士还早。但问题在于,三星的HBM3E芯片在英伟达的认证测试中,良率和稳定性始终达不到要求。英伟达一度把三星从供应链里踢了出去,后来虽然重新认证通过,但市场份额已经被SK海力士抢走了大部分。

    更深层的问题在于,三星是一家业务极其庞杂的巨头——手机、家电、显示面板、内存、代工,样样都做。当AI芯片的红利来临时,三星的决策链条太长,反应不够快。而SK海力士虽然业务也多元,但核心就押在内存这条线上,转型反而更坚决。

    还有一个有意思的背景:SK海力士在20年前差点因为债务崩盘,当时是政府牵头、债权团接手,才把它从死亡线上拉回来。谁能想到,20年后的AI热潮,让它完成了一次几乎不可能的逆袭。

    1.35万亿美元意味着什么

    1.35万亿美元,这个数字放在全球范围内看,已经超过了很多人的想象。它大致相当于整个印度尼西亚一年的GDP,或者接近腾讯加阿里巴巴的市值总和。

    但对SK海力士来说,这个数字能不能站稳,还是个问号。AI芯片的需求目前确实火爆,但这波热潮能持续多久,没有人能给出确切答案。一旦AI基础设施建设的速度放缓,或者客户开始去库存,SK海力士的业绩和股价都会承受巨大压力。

    三星当然也不会坐视不理。它已经在全力推进HBM4的研发,希望在下一代产品上扳回一城。而美光也在加速追赶。这个市场远没有到格局确定的时候。

    更大的格局变化

    SK海力士超越三星,某种程度上也是全球半导体产业权力转移的一个缩影。过去几十年,半导体行业的话语权在英特尔、三星这类”全能型”巨头手里。而现在,AI把话语权重新分配了——谁掌握了算力最关键的那一环,谁就能在短期内获得不成比例的回报。

    韩国内部也在讨论,这种过度依赖AI芯片的局面是不是一种风险。如果AI热潮退去,韩国经济会不会跟着剧烈震荡?但眼下,对于SK海力士和它的股东来说,这个问题还远得很。


    从差点破产到市值韩国第一,SK海力士的故事大概是这轮AI热潮里最戏剧性的注脚之一。它同时也提醒所有人:AI不只是大模型公司的游戏,产业链上游那些看似枯燥的芯片制造商,可能才是这波红利最确定的受益者。


  • Meta监督委员会发话了:AI生成的色情化视频,不能说不自愿就不删





    Meta监督委员会发话了:AI生成的色情化视频,不能说不自愿就不删

    Meta监督委员会发话了:AI生成的色情化视频,不能说不自愿就不删

    来源:The Verge · 2026年6月23日

    Meta监督委员会与AI内容审核
    AI生成内容的内容审核,正成为社交平台最棘手的问题之一|示意图

    6月23日,Meta的监督委员会(Oversight Board)公开要求Meta下架一段在Instagram上流传的”AI生成色情化视频”——视频中的女性并非公众人物,但她的形象被AI篡改成了性化内容。

    这本来不是什么新鲜事。Deepfake色情内容在互联网上已经泛滥了多年。但这次值得关注的是Meta的第一次回应——以及监督委员会为什么忍不了。

    Meta第一次说”不违规”

    事情发生后,有人向Meta举报这段视频,认为它违反了平台关于非自愿性化内容(NCII)的规定。Meta的审核系统看了一眼,得出的结论是:没有迹象表明这段内容是”非自愿的”,所以不用删。

    这个判断听起来很荒谬——视频本身就是AI生成的,对象是一个普通女性,她根本没有”自愿”参与拍摄的可能性。但Meta的审核逻辑是:除非有明确证据表明确实是非自愿的,否则不认定为违规。

    监督委员会直接否定了这个逻辑。他们在声明中写道:AI生成的对他人的冒名内容,应当”默认被视为非自愿”。换句话说,平台不能要求受害者来证明自己”没有同意”——因为AI生成的内容,本质上就不存在”同意”这个前提。

    “AI生成的冒名内容应当被默认判定为非自愿内容。”——Meta监督委员会

    非公众人物的”保护真空”

    这次事件的受害者不是名人。她没有庞大的粉丝群体帮她发声,也没有公关团队帮她向平台施压。她只是一个普通用户,突然发现自己的脸出现在了一段她从未参与过的性化视频里。

    监督委员会特别指出了这个问题:现有的内容审核机制,对公众人物和非公众人物的保护是不对等的。名人发的深伪色情内容确实也会被处理,但往往是因为涉及”露骨内容”或”骚扰”,而不是因为”未经同意”。而对于普通人来说,这种内容造成的伤害可能更大——她们没有应对机制,也没有话语权。

    委员会的建议很明确:Meta应该修改其内容审核标准,将”AI生成的冒名内容”单独列为一个类别,并默认视为非自愿内容处理,不需要举报人提供额外证明。

    审核跟不上生成速度

    这件事背后更大的问题是:AI生成内容的爆发速度,已经远远超过了平台内容审核的跟进速度。以前要制作一段色情化视频,需要真实的拍摄和后期;现在只需要一张照片和一段开源的Deepfake代码,几分钟就能生成一段以假乱真的视频。

    Meta每年在内容审核上花费超过50亿美元,雇用了上万名审核员,还部署了AI审核系统。但面对AI生成的NCII,这套体系仍然显得力不从心——审核员需要判断”这是真的还是AI生成的”、”当事人是否自愿”,而这些判断在越来越多的案例中变得极其困难。

    监督委员会的这次介入,某种程度上是在替Meta”补课”。委员会本身是一个独立机构,由Meta资助但独立运作,专门审查Meta的内容审核决策是否得当。这次它站在了受害者一边,也等于给整个行业提了个醒。

    其他平台在做什么

    Meta不是唯一面临这个问题的平台。TikTok、X(推特)、Pornhub都曾被指责对Deepfake色情内容处理不力。2024年,X甚至因为大量Deepfake色情内容被安全组织点名,被迫更新了相关审核政策。

    有一些平台开始尝试用技术手段主动检测AI生成内容——比如在上传时自动识别是否由已知Deepfake工具生成。但这类技术的准确率仍然有限,而且新的生成工具每天都在出现,检测永远慢一步。

    更根本的解决方案可能是立法。美国多个州已经在推动相关法案,要求平台在收到举报后必须在规定时间内删除Deepfake色情内容,否则将面临罚款。但联邦层面的立法进展缓慢,而互联网本身又是跨地域的,单一国家的法律能起多大作用,还是个问号。


    监督委员会这次的表态,至少让”AI生成冒名内容应默认视为非自愿”这个原则被摆上了台面。接下来要看Meta会不会真的修改审核标准,以及其他平台会不会跟上。对于无数可能成为下一个受害者的普通用户来说,这一天来得已经够晚了。


  • 日本AI公司做了个「元模型」:用Claude和Gemini一起干活,效果居然超过它们

    日本AI公司做了个「元模型」:用Claude和Gemini一起干活,效果居然超过它们

    大多数AI公司都在拼命训练更大的模型,日本初创公司Sakana却在做一件看起来有点「偷懒」的事:它训练了一个模型,专门负责指挥其他模型干活。这个产品叫Fugu Ultra,最近发布的基准测试结果让不少人感到意外。

    先说结论:Fugu Ultra的性能,据称可以媲美甚至超过Fable 5、Gemini 3.1 Pro和GPT-5.5。但它做到这一点的方法,不是自己从头训练一个更大的模型,而是巧妙地把多个前沿模型组合在一起使用

    Sakana Fugu AI模型编排
    Fugu Ultra通过编排多个AI模型来提供前沿级性能(配图由AI生成)

    它到底是怎么工作的

    Fugu本身是一个经过专门训练的语言模型,核心能力是「学会如何协调多模型协作」。遇到简单任务,它自己就处理了;遇到复杂的多步骤任务,它会自动把任务拆开,分配给专家模型池里的多个模型,然后再把结果整合起来返回给用户。

    关键是,用户完全不需要知道背后发生了什么。你只需要调用一个API端点,Fugu会自动完成模型选择、任务委托、结果验证、内容合成——整个过程对用户是透明的。

    Sakana的说法是,Fugu会「仔细选择何时使用其他前沿模型(比如Claude和Gemini)来处理特定任务」,但不会告诉用户具体哪个任务用了哪个模型。这种设计引发了一些讨论——如果用户不知道背后是哪个模型在处理自己的请求,怎么判断输出质量?

    基准测试说了什么

    Sakana公布了基准测试结果,涵盖编程、推理、科学、智能体能力等多个类别。Fugu Ultra的得分与Fable 5、Mythos Preview处于同一梯队。更值得注意的是,Fugu的得分普遍高于它底层调用的各个基础模型——这说明「编排」本身带来了性能增益,不只是简单地把几个模型堆在一起。

    据Sakana披露,在近500名beta测试用户的真实场景验证中,Fugu在AutoResearch、代码审查、网络安全分析等任务中,表现超过了Gemini 3.1 Pro、Opus 4.8和GPT 5.5等头部模型。

    一个巧妙的「避险」设计

    Fugu还有一个值得关注的设计:它的底层专家模型池是完全支持动态替换的。如果某个模型供应商突然限制访问(比如出口管制、政策变动),Fugu会自动路由到其他可用模型。

    这在当前地缘政治环境下很有意义。美国对先进AI模型的出口管制越来越严,如果一个产品完全依赖Anthropic或OpenAI的API,随时可能因为政策变化而中断。Fugu的「多模型备份」设计,某种程度上是在这个问题上做文章。

    Sakana在自己的技术报告里说:「随着时间的推移,Sakana Fugu会自然地通过纳入更新、更高效的模型来成长,包括我们自己的模型。」换句话说,今天的Fugu Ultra和明年的Fugu Ultra,底层模型组合可能完全不一样,但对用户来说,调用方式不变。

    这不就是「套壳」吗

    看到这里,你可能会想:这不就是一个精心设计的「套壳」产品吗?把别人的模型包装一下,加一层调度逻辑,然后卖得更贵?

    这个质疑有道理,但也不完全公平。Fugu的价值不在于「调用Claude的API」这件事本身——谁都能调用Claude的API——而在于如何智能地决定什么时候调用哪个模型、如何把多个模型的输出整合成一个高质量答案。这个「如何调度」的问题,其实是AI领域一个很活跃的研究方向,叫「多智能体编排」。

    Sakana的两个研究论文(发表在ICLR 2026)就是在做这个。从学术论文到可商用的产品,这条路不好走,但Fugu算是目前能看到的最完整的实现之一。


    更大的问题

    Fugu的出现,提出了一个更大的问题:AI的未来是「一个超级模型解决所有问题」,还是「一群专门化的模型协同工作」?

    过去两年的主流叙事是前者:模型越大越好,数据越多越好,Scaling Law就是王道。但越来越多的人开始质疑这个叙事。训练一个前沿级模型要消耗多少算力?产生多少碳排放?有多少任务是真的需要一个万亿参数模型才能解决的?

    Fugu代表的,是后一种思路:与其把所有能力塞进一个模型,不如让专门的模型做专门的事,上面加一层智能调度。这个思路如果成立,对整个AI基础设施的投资逻辑都会产生影响。

  • Signal总裁警告:AI聊天机器人不是你的朋友,别把隐私交出去

    Signal总裁警告:AI聊天机器人不是你的朋友,别把隐私交出去

    你有没有对着ChatGPT倾诉过心事?或者让Claude帮你做重要决定?最近这个现象越来越普遍,有人甚至把AI聊天机器人当成真正的朋友。但Signal总裁Meredith Whittaker最近在接受Bloomberg采访时,说了一句值得每个人听进去的话。

    「这些不是你的朋友。它们不是有意识的生物。它们不是有感知的对话者。」—— Meredith Whittaker,Signal总裁

    她自己怎么用AI

    Whittaker说她也会用AI工具,「偶尔用来格式化一下文档」,但她坚持一件事:不向AI提问。她的原话是:「我对自己的思考和写作非常认真,我不希望把一个想法推敲的过程,被一个把网上已有内容取平均值的系统给出的回答给提前封闭或遮蔽了。」

    这话说得挺重的。「把网上已有内容取平均值的系统」——这是对大语言模型本质的一个相当直白的描述。她的意思是,如果你让AI帮你「思考」,你得到的不是新思想,而是互联网上已有观点的某种平均态。

    AI聊天机器人隐私警示
    AI聊天机器人的隐私隐患正在引发越来越多关注(配图由AI生成)

    Copilot帮你买圣诞礼物?

    采访中还提到了微软AI CEO Mustafa Suleyman的预测:到今年圣诞节,用户可以让Microsoft Copilot全权负责节日购物。Copilot会「偷听」家庭群聊,推断出每个家庭成员想要什么,然后替你下单。

    Whittaker对此的反应很直接。她说,这意味着你要给Copilot访问权限的包括:你的信用卡、你的浏览器、你的Signal消息、代表你给兄弟姐妹发消息的能力、你的家庭住址、你的日历……

    「你刚才描述的,是一个在多个应用和服务之间具有极强渗透性访问权限的系统,」她说。「在Signal的场景下,这相当于一种后门。」

    「后门」这个词很关键

    Signal的核心卖点是端到端加密,任何第三方(包括Signal自己)都无法读取消息内容。但如果AI agent获得了代表用户操作Signal的权限,那么理论上,这个agent就能看到消息内容,甚至替你回复。

    这不是Signal一家的问题。所有强调隐私的应用——WhatsApp、Telegram、Proton Mail——都面临同样的困境:AI agent时代,用户自己主动交出了原本受加密保护的数据。


    人们为什么把AI当朋友

    这股趋势不是凭空来的。Character.AI、Replika这些产品,从设计之初就把「陪伴」作为核心功能。它们记得你上次说了什么,会用你喜欢的语气说话,甚至会在你难过的时候「安慰」你。

    技术上说,这叫「情感依恋设计」。它很有效,但代价是什么?Whittaker的警告指向一个核心矛盾:一个系统越是让你觉得它是朋友,它就能从你这里获取到越多的数据。而这些数据最终去了哪里、被用来做什么,用户往往并不清楚。

    监管在哪里

    目前来看,AI companion这类产品的监管几乎是空白。欧盟的AI Act有一些原则性规定,但具体到「AI能不能替你发消息」这个问题,还没有明确的答案。

    Whittaker的表态,某种程度上是在监管真正到位之前,先给公众提个醒。她的建议很实际:用AI做工具没问题,但别把它当成思考的替代品,更别把它当成朋友。