博客

  • GitHub Copilot突然涨价,AI行业的好日子要到头了

    微软最近悄悄改了GitHub Copilot的收费规则——从原来的”一口价”变成按token用量收费。这事在Reddit上炸了锅,有用户直接造了个新词:“Tokenpocalypse”(Token末日)。听起来像玩笑,但背后藏着AI行业一个越来越烫手的问题:烧钱的速度,已经烧到用户头上了。

    投资人的钱,不是无限供应的

    过去几年,AI公司给人的感觉是”钱多、任性、随便用”。ChatGPT刚开始收费的时候,20美元一个月,怎么看都像拍脑袋定的价——”先弄个号码看看”。但那个价格背后,是投资人在替用户买单。

    现在不一样了。Anthropic要上市,OpenAI也想上市,投资人不干了——你得证明自己能赚钱。怎么办?只能把成本往用户那边推。GitHub Copilot这波涨价,只是个开始。

    Uber当年也是这么过来的:先烧钱抢市场,再涨价、压缩成本、挤利润。AI公司现在走到了同一条路上,只是他们的成本比Uber刚多了——算力、电费、GPU……每一样都是吞金兽。

    连Uber都扛不住的AI账单

    TechCrunch的播客里提到一个很有意思的案例:Uber。这家公司在一年半的时间里,把自己AI预算花爆了,然后赶紧给员工用AI设限——”别再用那么多了,太贵了”。

    想想看,Uber这样的公司都觉得AI贵,那中小公司怎么办?更要命的是,AI公司自己也在亏钱。Anthropic要上市,招股书里得写”风险因素”——可这行业变得太快,今天的风险,下个月可能就不是风险了,也可能突然多了十个新风险。怎么写?

    “Tokenmaxxing”从爆火到翻车,只用了6个月

    还有一个很魔幻的事:”tokenmaxxing”(极致化使用token)这个概念,从流行到被企业嫌弃,只用了6个月。一开始大家觉得”能多用就多用,反正公司报销”,后来财务一看账单,直接晕过去。

    AI公司现在面临一个尴尬的局面:降价吧,自己亏死;涨价吧,用户骂死。微软选择先涨为敬,其他公司大概率会跟上。到那时候,AI工具就不再是什么”人人用得起”的东西了,而会变成按用量计费的企业级服务——用得越多,账单越恐怖。


    对普通用户来说,这意味着什么?可能是ChatGPT Plus涨价,可能是Claude限制免费次数,可能是你公司里用的AI工具突然开始”按token收费”。Tokenpocalypse这个词,说不定很快就会从Reddit的段子,变成所有人的账单现实。

  • 纽约州率先出手:AI聊天机器人不准再假装是孩子的’朋友’

    AI聊天机器人能不能跟青少年建立”陪伴关系”?纽约州说不行。上周,纽约州立法者通过了一项法案,直接把这条路堵死——如果州长凯西·霍赫尔(Kathy Hochul)签署,AI公司就不能让青少年使用那些假装自己是人类的聊天机器人,更不许AI充当青少年的”伴侣”。

    一场悲剧推动的立法

    这事不是凭空冒出来的。过去一年多,好几家AI公司被推上了被告席,原因都一样——他们的聊天机器人被指控诱导青少年用户自杀或自残。官司有的还在打,有的已经达成和解,但舆论的压力已经足够让立法者坐不住了。

    最典型的案子是Character.AI。这款应用允许用户创建”虚拟角色”,然后跟它们聊天。问题出在,这些AI角色会被青少年当成”真实的存在”,甚至建立情感依赖。悲剧发生后,家属把Character.AI告上法庭,类似的诉讼接二连三。

    AI陪伴这个词,听着温情,背后可能是青少年心理健康的风险。纽约州这份法案,等于直接给”AI假装人类陪伴青少年”按了暂停键。

    法案到底说了什么

    法案的核心很直接:禁止AI聊天机器人向未成年人”扮演同伴角色”。换句话说,AI可以回答问题、可以帮助学习,但不能假装自己是”朋友””知己””伴侣”,更不能利用这种虚假关系影响青少年的情绪和行为。

    目前法案已经通过了州议会,但还得等州长霍赫尔签字才能正式生效。霍赫尔是民主党人,历来对科技监管比较积极,外界普遍预期她会签。一旦落地,纽约州就成了全美第一个在州层面限制”AI陪伴”的州。

    AI公司的麻烦才刚开始

    这份法案一旦生效,受影响的不会只有Character.AI。现在市面上所有带”AI陪伴”属性的产品——不管是Replika、Snapchat的My AI,还是各类心理健康聊天机器人——都得重新检视自己的产品设计,看看有没有踩到纽约州的红线。

    更麻烦的是,纽约州向来是其他州的政策风向标。加州、马萨诸塞州、伊利诺伊州……很可能跟着出台类似规定。到那时候,AI公司面临的就不只是”纽约州市场”的问题,而是整个美国市场对”AI陪伴”的监管收紧。


    这件事也给国内提了个醒。国内AI聊天产品也不少,不少同样主打”陪伴””倾听””虚拟朋友”。青少年保护这根弦,迟早也得绷起来。纽约州这份法案,值得盯着看。

  • ComfyUI:109K Stars!最强节点式AI绘画工具,工作流可视化让创作更自由

    ComfyUI 截图

    ComfyUI 节点式工作流界面

    📘 项目简介

    ComfyUI 是一款功能最强大的开源生成式AI节点式应用程序,也是用于生成式AI的节点式界面和推理引擎。由 comfyanonymous 及众多贡献者开发,完全开源,支持在本地Windows、Linux、macOS设备上运行。用户可以通过节点组合各类AI模型和操作,实现高度可定制、可控的内容生成。

    核心特点:

    💻 安装要求和过程

    环境要求

    硬件要求

    • 显卡:NVIDIA GPU (推荐) 或 AMD GPU,至少 4GB 显存
    • 内存:建议 16GB 以上
    • 存储:至少 10GB 可用空间(用于模型文件)

    软件要求

    • Python:3.9 – 3.12
    • Git:用于克隆仓库
    • CUDA:12.4+ (NVIDIA GPU)

    快速安装步骤

    # 方法一:使用官方桌面应用(推荐)
    # 访问 https://comfy.org/download 下载安装

    # 方法二:从源码安装
    # 1. 克隆仓库
    git clone https://github.com/Comfy-Org/ComfyUI.git
    cd ComfyUI

    # 2. 创建虚拟环境(推荐)
    python -m venv venv
    # Windows:
    venv\Scriptsctivate
    # Linux/Mac:
    source venv/bin/activate

    # 3. 安装依赖
    pip install -r requirements.txt

    # 4. 启动 ComfyUI
    python main.py

    # 5. 访问浏览器
    # 打开 http://127.0.0.1:8188

    便携版(Windows):

    如果不想配置环境,可以下载官方提供的独立便携包,解压即可使用,无需安装Python和依赖。

    ⚙️ 核心功能

    1. 节点式工作流搭建

    通过可视化节点连接的方式组合AI模型、业务逻辑,灵活定制生成流程。每个节点代表一个功能模块(加载模型、输入提示词、采样、保存图像等),通过连线定义数据流。

    2. 多模态内容生成

    支持图像、视频、音频、3D等多种类型的内容生成,覆盖生成式AI主流应用场景。原生支持最新的开源SOTA模型。

    3. 自定义扩展能力

    支持自定义节点开发和发布,可对接第三方模型、工具,拓展功能边界。拥有丰富的社区插件生态,可以通过 ComfyUI Manager 一键安装扩展。

    4. 工作流管理与复用

    支持工作流模板复用、子图拆分、部分执行等特性。完成的工作流可以保存为JSON文件,方便分享和复用。内置 Comfy Hub 功能,可探索全球顶尖创作者的公开工作流。

    5. API 与自动化对接

    支持通过 MCP 协议连接AI智能体,实现生成任务的自动化调用。提供完整的 REST API,可以无缝集成到现有工作流中。

    🎯 典型使用场景

    场景一:AI 艺术创作者

    需求:创作者需要精细控制AI绘画的每一个环节,尝试不同的模型组合和参数调整。

    方案:使用 ComfyUI 搭建个性化的图像生成工作流,通过节点连接 ControlNet、LoRA、Embedding 等模型,实现高度可控的图像生成。可以保存多个工作流模板(如写实风格、动漫风格、概念设计等),一键切换。

    优势:相比 WebUI,ComfyUI 的工作流方式让创作者能更清晰地理解生成过程,便于调试和优化。

    场景二:AI 应用开发者

    需求:开发者需要将AI图像生成功能集成到自己的应用或服务中,要求高并发、低延迟。

    方案:利用 ComfyUI 的 API 模式,将工作流保存为JSON,通过 API 调用实现自动化图像生成。可以部署在服务器上,提供 HTTP 接口供其他应用调用。

    优势:工作流可视化编辑,调试完成后一键部署,大幅降低开发门槛。

    场景三:AI 研究与学习

    需求:研究人员和学生需要深入理解扩散模型的各个组件和工作原理。

    方案:ComfyUI 的节点式设计天然适合教学和研究。每个节点对应一个操作(如CLIP编码、VAE解码、KSampler采样等),可以清晰地看到数据流动和处理的全过程。

    优势:模块化设计让实验和对比变得简单,方便快速验证新想法。

    🌟 推荐理由

    为什么推荐 ComfyUI?

    1. 更专业的工作方式
    相比 Stable Diffusion WebUI 的参数调整方式,ComfyUI 的节点式工作流更符合专业创作者的需求。它可以保存完整的工作流,方便复现和分享。

    2. 更高的资源效率
    ComfyUI 支持智能缓存,相同节点的计算结果会被复用,大幅减少重复计算。对显存的要求也相对更低。

    3. 强大的社区生态
    拥有超过 1000+ 自定义节点插件,覆盖各种功能需求。ComfyUI Manager 让插件安装变得极其简单。

    4. 活跃的开发团队
    由 comfyanonymous 主导开发,社区活跃度极高,Issues 和 PR 响应迅速,版本更新频繁。

    5. 面向未来的设计
    不仅支持图像生成,还在积极扩展视频、3D、音频等多模态生成能力,是真正的”生成式AI操作系统”。

    使用心得:

    我第一次使用 ComfyUI 时确实被满满的节点吓到了,感觉比 WebUI 复杂很多。但坚持使用后,我发现节点式工作流其实是更直观的方式——它让你看清AI绘画的每一个步骤。现在我已经积累了几十个工作流模板,从简单文生图到复杂的 ControlNet 组合,切换起来非常方便。如果你是想深入理解Stable Diffusion原理,或者需要高度定制化的生成流程,ComfyUI 绝对值得投入时间学习。

    📥 下载地址

    🎬 结语

    ComfyUI 代表了AI创作工具的一个新方向——从”黑盒”转向”白盒”,从”简单参数调整”转向”可视化编程”。虽然学习曲线比 WebUI 陡峭,但一旦掌握,它将赋予你前所未有的控制力和创造力。

    如果你满足以下条件,强烈建议尝试 ComfyUI:

    • 对AI绘画的工作原理感兴趣,想深入理解每个环节
    • 需要高度定制化的生成流程,WebUI 无法满足需求
    • 希望通过工作流的方式管理和复用你的创作流程
    • 准备将AI图像生成集成到自己的应用或服务中

    温馨提示:ComfyUI 的节点式界面可能一开始会让人不知所措,但不用担心,社区有大量的教程和工作流可以参考。从简单的文生图工作流开始,逐步添加功能,你会发现这种方式的强大之处。


    本文由 AI 辅助创作,开源项目信息来自 GitHub 官方仓库及社区贡献。
    如果你觉得这个项目不错,欢迎到 GitHub 上给它一个 Star!

  • 联合国报告:AI数据中心环境足迹堪比大国,耗水相当于13亿人年用量

    联合国大学(UNU)前几天甩出一份报告,读完之后心情有点复杂。报告说,到2030年,全球数据中心的年耗电量将达到945太瓦时——这是什么概念?差不多等于巴基斯坦、孟加拉国和尼日利亚三个国家加起来的年用电量,这三个国家总人口超过6.5亿。

    而这只是冰山一角。除了耗电,数据中心每用1度电,冷却系统和能源生产还会同步产生”水足迹”和”土地足迹”。报告预测,到2030年,AI相关的耗水量将相当于13亿人的基本年度生活用水需求,土地足迹超过1.45万平方公里——大概是雅加达都会区面积的两倍。

    AI数据中心俯视图
    乡村地区绿色田野中的大型数据中心俯视图(图源:UN News)

    训练模型不是耗电大户,你每天用AI才是

    公众讨论AI的环境影响时,目光往往盯着训练大模型需要多少电。但联合国大学的研究发现,日常使用AI占总能源需求的80%到90%。这个规模相当惊人:一项被广泛使用的AI服务每天处理约25亿次提示,每年消耗数百吉瓦时的电力。

    不同任务的能耗差异也很大。生成一张AI图像所需的能源,是简单文本分类的1000倍以上,而视频生成需要的资源甚至更多。靠提升效率来抵消增长的能源需求?报告说这不太现实,因为”反弹效应”——成本和性能降低会驱动使用量上升,最终结果还是总资源消耗增加。

    到2030年,AI基础设施预计每年将产生多达250万吨电子垃圾。其中大部分负担会落在处置能力有限的中低收入国家。

    环境成本集中在哪里,收益就去到了哪里

    这份报告点出了一个经常被忽视的问题:AI基础设施的环境影响分布极不均匀。技术的收益是全球性的,但成本往往集中在特定地区。

    在一些国家,数据中心已经占到全国电力消耗的很大一部分,给能源系统带来巨大压力。在另一些国家,数据中心扩张正在大量消耗水资源,有时甚至是在干旱条件下进行的。报告特别提到,AI硬件所需关键矿物的开采,也在资源产地引发了环境退化和社会不平等的担忧。

    电子垃圾的挑战同样严峻。到2030年,AI基础设施预计每年将产生多达250万吨电子垃圾,而其中大部分负担可能会落在处置能力有限的中低收入国家——也就是说,发达国家享受AI的便利,发展中国家承担电子垃圾的后果。

    超过90%的AI算力集中在美国和中国

    报告还揭示了一个令人不安的数字——超过90%的AI专用计算能力集中在美国和中国两个国家,同时有150多个国家缺乏重要的国内AI基础设施。这种不平衡不仅限制了这些国家的经济机会,还引发了环境正义问题:一些国家承担了环境成本,却没有分享到AI驱动的增长带来的收益。

    这跟几个月前Erin Brockovich盯上数据中心行业的故事形成了呼应。当时她的团队上线了全美数据中心分布地图,首月收到近4000份居民投诉,核心问题就是”不透明”——项目获批后才公布、居民被排除在决策之外。现在联合国大学把这个问题放在了全球尺度上重新讨论。


    联合国大学的研究人员强调,这份报告并不是反对AI本身,而是呼吁采取紧急行动,确保这项技术在地球承载限度内发展。报告提出了”负责任的AI生态系统”框架,构建原则包括透明度、设计即高效、公平性、全生命周期责任、全球合作和可持续使用。

    具体到能做些什么:各国政府需要将AI基础设施纳入能源、水和土地利用规划;企业需要设计尽量减少资源消耗的系统;普通用户也可以通过尽可能选择低影响的应用来发挥作用。AI的未来不仅取决于技术创新,还取决于当下做出的治理选择。

  • Anthropic秘密递交IPO申请,9650亿美元估值反超OpenAI

    6月1日,Anthropic悄咪咪地向美国SEC递交了S-1注册声明,正式启动IPO进程。这家公司走的是”秘密递表”路线,外界暂时看不到招股书细节,但光是这份声明本身,就已经在硅谷炸开了锅。

    要知道,就在递交IPO申请前4天——5月28日——Anthropic刚刚完成H轮融资,投后估值飙到9650亿美元,约合人民币6.5万亿元。这个数字已经正式超过了OpenAI今年3月融资后的8520亿美元估值。Anthropic从”OpenAI挑战者”变成了”全球估值最高的AI初创企业”。

    从OpenAI出走的人,做了一家比OpenAI更值钱的公司

    Anthropic的创始人是Dario Amodei和Daniela Amodei兄妹俩,两人之前都在OpenAI担任核心职位——Dario是研究副总裁,Daniela是安全政策副总裁。2021年,他们因为AI安全路线的问题跟OpenAI管理层闹翻了,干脆带着一批核心成员出走,自己搞了一家”更安全的AI公司”。

    当时ChatGPT还没出生,AI的主流叙事是”先把AGI做出来再说”。Anthropic选了一条不同的路:先把企业级用户和开发者伺候好,再做消费者市场。这个选择在2025年到2026年之间彻底兑现了——Claude Code发布后迅速抢下超过50%的AI编程市场份额,Fortune 100企业里有70%成了它的付费客户。

    Anthropic超过80%的收入来自API调用和企业级客户,这种B端深度绑定的商业模式,比OpenAI依赖C端订阅的玩法要稳得多。

    收入5个月涨了5倍,这在AI圈是什么概念

    招股书披露的数据相当夸张:Anthropic的年化经常性收入(ARR)从2025年底的90亿美元,飙到2026年4月的约450亿美元。短短4个月,收入规模涨了5倍。

    更狠的是,公司预计2026年第二季度就能首次实现盈利。在AI公司普遍”收入越高、亏得越多”的大环境下,Anthropic居然快要赚钱了。2024年它的毛利率一度低到-94%,全是GPU折旧和推理算力成本拖累的。到2025年,毛利率已经修正到约40%,公司还给自己定了一个远期目标:2027年突破70%。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(图源:Getty Images)

    谷歌和亚马逊都在重仓,这场IPO不止是Anthropic的事

    Anthropic的投资方名单读起来像硅谷名人录:谷歌计划最高投400亿美元,亚马逊已经投了130亿、这轮又追加50亿,还承诺未来十年在AWS技术上投入超1000亿美元,把Claude作为其云AI战略的核心底座。

    这轮H轮融资由阿尔蒂米特资本、德拉戈尼尔投资、格林奥克斯资本和红杉资本领投,其他投资方还包括德劭集团、黑石、简街、淡马锡等。估值在3个月内从2月G轮融资的3800亿美元暴涨154%,达到9650亿美元。

    现在美股科技板块的IPO窗口全面打开。SpaceX已于5月20日正式递交招股书,目标估值2万亿美元;OpenAI预计今年9月启动上市流程,目标市值约1万亿至1.2万亿美元。三家公司的合计潜在募资规模可能超过2400亿美元,合计估值可能超过4万亿美元。


    Anthropic选在秋季正式挂牌,给自己留了5到6个月的窗口期来应对市场波动。它递交IPO的真正意图,不只是跟OpenAI和SpaceX抢”AI第一股”的命名权,更是在向资本市场展示一套成型的财务模型:高粘性B端订单加盈利窗口提前显现加收入超高速增长。这套打法跟OpenAI依赖消费者订阅的逻辑截然不同,它的估值框架会更贴近企业级软件和SaaS的定价范式。

    当然,市场上也有质疑声。香橼资本公开表示将做空Anthropic,马斯克在社交媒体上直接开炮说”万亿估值是个笑话”。多空对峙在IPO定价阶段就已经开始了,最终市场买不买账,还要看正式招股书里披露的数字够不够有说服力。

  • 国产大模型又放大招,MiniMax M3编程能力居然超过了GPT-5.5

    最近国产大模型圈又热闹起来了,MiniMax刚发布了新一代的通用模型MiniMax M3,据说编程能力在SWE-Bench Pro基准测试里超过了GPT-5.5和Gemini 3.1 Pro,只比Claude Opus 4.7差一点点。

    自研架构,1M超长上下文

    MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型,用的是自研的MiniMax Sparse Attention(MSA)稀疏注意力架构,1M上下文下单token的计算量只有上一代的1/20,处理长文本的时候效率高了很多。

    MiniMax的团队说,M3的编程能力已经能帮开发者完成很多复杂的编程任务,比如调试代码、优化性能、写复杂的算法,能省不少时间。

    MiniMax M3模型发布
    MiniMax正式发布新一代通用模型MiniMax M3

    除了模型本身,MiniMax还推出了配套的AI编程产品MiniMax Code,能自主运行数天不用人工干预,帮开发者完成从写代码到测试的全流程。现在很多开发者都已经用上AI辅助编程了,MiniMax Code这种能自主运行的工具,说不定能把编程的效率再提一个档次。


    国产大模型加速上市

    就在发布M3的同时,MiniMax还启动了A股IPO辅导,目标是在科创板上市。其实之前智谱也已经完成了第四期上市辅导,国产大模型公司现在都在加速上市进程,说明资本对AI落地价值的认可已经回归基本面了。以后我们不仅能用到更好的国产大模型,还能通过投资分享AI发展的红利。

    • M3编程能力超过GPT-5.5,接近Claude Opus 4.7
    • 支持1M超长上下文,自研稀疏注意力架构,效率更高
    • 推出MiniMax Code,可自主运行数天,辅助编程全流程
    • 启动A股IPO辅导,国产大模型加速上市进程
    📎 原文来源:MiniMax推出MiniMax M3模型
  • 黄仁勋又发新卡了,这次英伟达要把AI芯片塞进你的电脑里

    这两天台北的Computex 2026展会正式开幕,英伟达的CEO黄仁勋又站出来搞事情了。这次他带来的不是普通的显卡,而是专为Agentic AI设计的新一代Vera Rubin芯片,据说OpenAI和Anthropic已经率先决定用了。

    不止是新芯片,还要做PC处理器

    除了Vera Rubin芯片,黄仁勋还宣布要和微软合作,推出基于台积电3nm工艺的ARM架构Windows PC芯片,名字叫RTX SPARK,计划2026年秋季就上市。这意味着英伟达正式进军个人电脑芯片市场,要打破英特尔这么多年的垄断。

    黄仁勋在演讲里说,Agentic AI的时代已经全面到来了,以后的AI不是只能聊聊天,而是能自主完成很多复杂的任务,这就需要更强大的芯片来支持。

    黄仁勋在GTC Taipei 2026大会演讲
    黄仁勋在GTC Taipei 2026大会上发表主题演讲

    其实这几年英伟达在AI芯片领域的优势已经很明显了,这次发布的Vera Rubin芯片专门针对Agentic AI做了优化,处理多任务的能力比之前的芯片强了不少。而RTX SPARK PC芯片更是直接杀入英特尔的腹地,以后我们买电脑的时候,除了英特尔和AMD的处理器,可能还要多一个英伟达的选项了。


    国产芯片也在发力

    就在英伟达发布新芯片的同时,国内的算力芯片也在进步。深圳河套学院最近用昇腾910C集群,完成了1.6万亿参数的DeepSeek-V4-Pro全流程训练,这说明国产芯片已经能支撑世界级的超大参数模型训练了。以后国内做AI训练和推理,用国产芯片也能有不错的效果,不用完全依赖国外的产品。

    • Vera Rubin芯片专为Agentic AI设计,性能大幅提升
    • RTX SPARK PC芯片采用台积电3nm工艺,2026年秋季上市
    • 国产昇腾910C集群已完成万亿参数模型训练,国产算力进步明显
  • Ollama:170k Stars!本地LLM运行工具,让AI模型在本地飞速运行

    配图

    Ollama Logo
    Ollama – 本地LLM运行工具

    项目简介

    Ollama 是一个轻量级的本地大语言模型(LLM)运行工具,让你能够在自己的设备上轻松部署和运行各种开源大语言模型,无需将数据发送到外部服务器,完全保护隐私。

    截至2026年,Ollama 已在 GitHub 获得 17万+ Stars,成为最广泛使用的本地LLM运行时,Docker Hub下载量超过1亿次。

    安装要求和过程

    环境要求

    • 操作系统:Linux(Ubuntu 20.04+)、macOS 11+、Windows 10(需WSL2)
    • 内存:8GB以上(运行7B模型),16GB以上(运行13B模型),32GB以上(运行33B+模型)
    • 存储:至少10GB可用空间(用于存放模型文件)
    • GPU:可选,NVIDIA GPU(CUDA)、AMD GPU(ROCm)或苹果M系列芯片可加速推理

    快速安装步骤

    macOS/Linux 一键安装:

    # Linux/macOS
    curl -fsSL https://ollama.com/install.sh | sh
    
    # macOS 也可用 Homebrew
    brew install ollama

    Windows 安装:

    1. 访问 https://ollama.com/download 下载 Windows 安装包
    2. 运行 OllamaSetup.exe,按照提示完成安装
    3. 打开命令提示符或PowerShell,输入 ollama --version 验证安装

    Docker 安装(推荐服务器环境):

    docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

    核心功能

    1. 一键运行本地模型:支持一键拉取和运行100+开源大语言模型,包括 Llama 3.3、Mistral、Qwen、Phi、DeepSeek R1 等热门模型。
    2. OpenAI API 兼容:原生提供兼容 OpenAI API 格式的 REST API(默认端口11434),可直接对接现有基于 OpenAI 生态开发的应用和工具。
    3. 智能硬件加速:自动适配 NVIDIA(CUDA)、AMD(ROCm)、苹果 M 系列芯片(Metal)的 GPU 加速,大幅提升推理速度。
    4. 模型自定义配置:支持通过 Modelfile 自定义模型参数(温度、上下文长度、系统提示词等),轻松创建专属模型。
    5. 多模态支持:最新版本支持视觉模型(如 Llama 3.2 Vision),可处理图像输入,实现图文混合推理。

    典型使用场景

    场景一:开发者本地 AI 应用开发

    作为开发者,你可以使用 Ollama 在本地运行 LLM,用于:

    • 开发和测试 AI 应用,无需支付 API 费用
    • 对接 Open-WebUI 等前端界面,搭建私有化 AI 聊天助手
    • 通过 API 集成到自己的应用中,实现本地智能推理

    示例:用 Ollama 运行 Llama 3.3 8B 模型,通过 OpenAI 兼容 API 为本地应用添加 AI 能力。

    场景二:企业私有化部署

    对于企业用户,Ollama 提供了:

    • 数据隐私保护:所有推理过程在本地完成,敏感数据无需上传云端
    • 零 API 成本:无需为每次 API 调用付费,适合高频调用场景
    • 离线可用:模型下载后,无需联网即可使用,适合内网环境

    推荐理由

    我个人从2025年开始使用 Ollama,它已经成为我本地 AI 开发的标配工具。推荐理由如下:

    1. 极简体验:一条命令就能安装,一条命令就能运行模型,对新手极其友好。
    2. 生态丰富:支持对接 Open-WebUI、Continue(VS Code 插件)、LangChain 等50+主流工具,可玩性极高。
    3. 性能优秀:支持 4-bit/8-bit 量化,即使在中端笔记本上也能流畅运行 7B 参数的模型。
    4. 活跃社区:GitHub 上40000+社区集成,几乎任何你能想到的工作流,都有人已经做好了集成方案。

    如果你想要一个简单、快速、隐私安全的本地 LLM 运行方案,Ollama 绝对是首选。

    下载地址

  • WWDC 2026:苹果准备再次介绍Siri,这次真的要用上Gemini了

    过去几年,苹果在AI这条路上一直在追赶。但换个角度看,落后未必是坏事。

    周一的WWDC 2026上,苹果准备再次向用户介绍新版Siri。说”再次”,是因为我们早在2024年苹果高调”推出”Apple Intelligence时就见过新Siri了——当时换上了发光边框,提供了不同的语音选项,还具备了把问题转交给ChatGPT的能力。苹果当时承诺Siri的”智能”功能很快上线,结果并没有。

    事实上,苹果围绕Apple Intelligence的宣传如此具有误导性,以至于公司正在和解一起集体诉讼,需要为从未兑现的功能向iPhone用户进行赔偿。

    2024年WWDC上苹果首次曝光AI版Siri
    2024年WWDC上,苹果首次曝光AI版Siri,口号是”AI for the rest of us”。两年过去了,这次得动真格了。

    AI助手竞赛,苹果已经输了

    如果把这事儿当成一场竞赛,苹果已经输得很彻底了。Gemini已经能实现叫Uber、点照烧外卖、查看你的日历并计算你该什么时候出发去机场这类功能。Gemini赢得这场竞赛,实至名归。

    但与此同时,人们对AI的不信任感正在上升,尤其是年轻人。Gemini越强大,给人的感觉就越诡异。要交付真正有用的助手,AI必须做到能预判你的需求,但”希望AI助手预判你的下一步需求”和”亲眼看到它真的这么做了”完全是两回事。

    我自愿授予了Gemini访问我的Google相册和Gmail的权限,但每次听到Gemini大声说出我儿子的名字,我还是会觉得毛骨悚然。

    苹果的新玩法:借力Gemini

    新版Siri将以某种形式基于Gemini构建。苹果无疑会为这项特权支付高昂的费用,但这种”隔了一层”的合作模式也有潜在的好处。

    你知道哪家公司没有和大型不受欢迎的数据中心项目绑定吗?是苹果。谷歌为了在全国各地的社区大规模开工建设数据中心,并没有赢得多少好感。苹果就算付费给谷歌,也不用背负这个负面名声,哪怕它付给谷歌的钱大概率会被投入到庞大的数据中心建设中。

    还有Copilot相关的争议:也就是”到处都是AI按钮”的问题。Siri尝试总结消息的功能既好笑又烦人,但至少Siri不会钻进你每一份工作文档里,非要帮你做总结。

    隐私牌,苹果的老本事

    可以预料,苹果会在WWDC上大谈隐私。私有云计算(Private Cloud Compute)会被再次搬出来,据说这项技术可以让你的数据就像从未离开过你的设备一样安全。新版Siri可能还会提供自动删除聊天记录的选项,而不是默认保留所有数据。

    承诺更私密、更安全的AI体验,可能会吸引那些不愿意向谷歌交出更多个人信息的人。但对于那些已经受够了软件里到处都是AI的人来说,这并没有什么帮助。


    苹果完全可以把AI进展缓慢包装成更负责任的做法。把之前的延迟说成是”花时间把事情做对”,并不是个坏策略。但虚假启动的阶段已经结束了。这次Siri必须要真的兑现承诺;这种第二次机会不会一直有,错过了就不会再来。

  • Meta自己下场做AI点击诱饵,还把已故女王生成了两遍

    Facebook上早就充斥着各种点击诱饵文章,现在Meta干脆自己动手,用AI批量生产这类内容了。

    事情是这样的。Meta的独立AI应用有个”为你推荐”板块,会推送一堆看着就很眼熟的故事卡片——标题党、配图夸张、内容空洞,典型的点击诱饵风格。但问题在于,这些故事从头到尾都是AI生成的,包括话题、配图、正文,一个字都不是人写的。

    AI眼中的英国是什么样

    驻伦敦的记者Robert Hart收到了一堆极具”英国特色”的推送:茶、礼仪、酒吧、王室、足球,还有排队技巧。具体标题大概是这样的:”王室管家终于解决了先加奶还是先加茶的争论”、”不知道原因就加入排队的心理学”、”英式责备的精髓解析”、”逛遍英国所有酒吧的极限运动”。

    他的同事更惨,被算法判定为奢侈品手表爱好者,推送了”我的假劳力士实验”和”劳力士候补名单背后的残酷数学”这类故事。

    Meta AI生成的错误王室图片,出现了两个伊丽莎白二世女王
    AI生成的英国王室图片,里面出现了两个伊丽莎白二世女王——而她已经去世几年了。图片来源:Meta AI

    AI生成的正文基本是凑字数的填充内容,翻来覆去重复提示词的前提,没有任何实质信息,也没有标注任何信息来源。如果你多次点击同一张卡片,每次生成的故事都是同一个主题的不同变体,但内容会略有不同。

    AI生成的内容里甚至出现了真实人物,而且错误百出。一张标题为”2026年谁真的在为王室买单?”的配图里,出现了两个伊丽莎白二世女王——而她已经去世几年了。她旁边还有看起来像是凯特王妃和威廉王子的人物,但面部扭曲、身体比例怪异,是典型的AI生成瑕疵。

    Meta的尴尬回应

    记者联系Meta询问这个功能的目的是什么、输出的内容算新闻还是虚构故事、有什么保障措施、生成真实人物图像是否符合其内容政策。Meta发言人的回应非常简短:”我们的目标是推荐对你最相关的内容——比如健身建议、膳食计划或其他见解——甚至在你提出要求之前。”

    后来这份声明又发了一遍,神秘地删除了”甚至在你提出要求之前”这句话。

    当天晚些时候,第三份声明来了:”这是针对有限数量用户的测试,该功能将被弃用。Meta没有推进该功能的计划。”

    这个回应反而引发了更多疑问:《The Verge》至少有四名记者都能使用这个功能,这算哪门子的”有限测试”?


    说到底,这件事暴露了Meta在AI内容生成上的草率。一个连”先加奶还是先加茶”都搞不清楚的AI,批量生产点击诱饵内容推送给用户,还生成已故王室成员的错误图像——这不是创新,这是 irresponsible。