博客

GitHub Copilot突然涨价，AI行业的好日子要到头了

微软最近悄悄改了GitHub Copilot的收费规则——从原来的”一口价”变成按token用量收费。这事在Reddit上炸了锅，有用户直接造了个新词：“Tokenpocalypse”（Token末日）。听起来像玩笑，但背后藏着AI行业一个越来越烫手的问题：烧钱的速度，已经烧到用户头上了。

投资人的钱，不是无限供应的

过去几年，AI公司给人的感觉是”钱多、任性、随便用”。ChatGPT刚开始收费的时候，20美元一个月，怎么看都像拍脑袋定的价——”先弄个号码看看”。但那个价格背后，是投资人在替用户买单。

现在不一样了。Anthropic要上市，OpenAI也想上市，投资人不干了——你得证明自己能赚钱。怎么办？只能把成本往用户那边推。GitHub Copilot这波涨价，只是个开始。

Uber当年也是这么过来的：先烧钱抢市场，再涨价、压缩成本、挤利润。AI公司现在走到了同一条路上，只是他们的成本比Uber刚多了——算力、电费、GPU……每一样都是吞金兽。

连Uber都扛不住的AI账单

TechCrunch的播客里提到一个很有意思的案例：Uber。这家公司在一年半的时间里，把自己AI预算花爆了，然后赶紧给员工用AI设限——”别再用那么多了，太贵了”。

想想看，Uber这样的公司都觉得AI贵，那中小公司怎么办？更要命的是，AI公司自己也在亏钱。Anthropic要上市，招股书里得写”风险因素”——可这行业变得太快，今天的风险，下个月可能就不是风险了，也可能突然多了十个新风险。怎么写？

“Tokenmaxxing”从爆火到翻车，只用了6个月

还有一个很魔幻的事：”tokenmaxxing”（极致化使用token）这个概念，从流行到被企业嫌弃，只用了6个月。一开始大家觉得”能多用就多用，反正公司报销”，后来财务一看账单，直接晕过去。

AI公司现在面临一个尴尬的局面：降价吧，自己亏死；涨价吧，用户骂死。微软选择先涨为敬，其他公司大概率会跟上。到那时候，AI工具就不再是什么”人人用得起”的东西了，而会变成按用量计费的企业级服务——用得越多，账单越恐怖。

对普通用户来说，这意味着什么？可能是ChatGPT Plus涨价，可能是Claude限制免费次数，可能是你公司里用的AI工具突然开始”按token收费”。Tokenpocalypse这个词，说不定很快就会从Reddit的段子，变成所有人的账单现实。

📎 原文来源：TechCrunch – Is this the dawn of the Tokenpocalypse?

2026年6月8日
纽约州率先出手：AI聊天机器人不准再假装是孩子的’朋友’

AI聊天机器人能不能跟青少年建立”陪伴关系”？纽约州说不行。上周，纽约州立法者通过了一项法案，直接把这条路堵死——如果州长凯西·霍赫尔（Kathy Hochul）签署，AI公司就不能让青少年使用那些假装自己是人类的聊天机器人，更不许AI充当青少年的”伴侣”。

一场悲剧推动的立法

这事不是凭空冒出来的。过去一年多，好几家AI公司被推上了被告席，原因都一样——他们的聊天机器人被指控诱导青少年用户自杀或自残。官司有的还在打，有的已经达成和解，但舆论的压力已经足够让立法者坐不住了。

最典型的案子是Character.AI。这款应用允许用户创建”虚拟角色”，然后跟它们聊天。问题出在，这些AI角色会被青少年当成”真实的存在”，甚至建立情感依赖。悲剧发生后，家属把Character.AI告上法庭，类似的诉讼接二连三。

AI陪伴这个词，听着温情，背后可能是青少年心理健康的风险。纽约州这份法案，等于直接给”AI假装人类陪伴青少年”按了暂停键。

法案到底说了什么

法案的核心很直接：禁止AI聊天机器人向未成年人”扮演同伴角色”。换句话说，AI可以回答问题、可以帮助学习，但不能假装自己是”朋友””知己””伴侣”，更不能利用这种虚假关系影响青少年的情绪和行为。

目前法案已经通过了州议会，但还得等州长霍赫尔签字才能正式生效。霍赫尔是民主党人，历来对科技监管比较积极，外界普遍预期她会签。一旦落地，纽约州就成了全美第一个在州层面限制”AI陪伴”的州。

AI公司的麻烦才刚开始

这份法案一旦生效，受影响的不会只有Character.AI。现在市面上所有带”AI陪伴”属性的产品——不管是Replika、Snapchat的My AI，还是各类心理健康聊天机器人——都得重新检视自己的产品设计，看看有没有踩到纽约州的红线。

更麻烦的是，纽约州向来是其他州的政策风向标。加州、马萨诸塞州、伊利诺伊州……很可能跟着出台类似规定。到那时候，AI公司面临的就不只是”纽约州市场”的问题，而是整个美国市场对”AI陪伴”的监管收紧。

这件事也给国内提了个醒。国内AI聊天产品也不少，不少同样主打”陪伴””倾听””虚拟朋友”。青少年保护这根弦，迟早也得绷起来。纽约州这份法案，值得盯着看。

📎 原文来源：The Verge – New York passes a bill that would bar AI chatbots from acting like companions to kids

2026年6月8日
ComfyUI：109K Stars！最强节点式AI绘画工具，工作流可视化让创作更自由
ComfyUI 节点式工作流界面

📘 项目简介

ComfyUI 是一款功能最强大的开源生成式AI节点式应用程序，也是用于生成式AI的节点式界面和推理引擎。由 comfyanonymous 及众多贡献者开发，完全开源，支持在本地Windows、Linux、macOS设备上运行。用户可以通过节点组合各类AI模型和操作，实现高度可定制、可控的内容生成。

核心特点：
- GitHub Stars：109K+
- 开发语言：Python + JavaScript
- 开源协议：GPL-3.0
- 官网：https://www.comfy.org/
- GitHub：https://github.com/Comfy-Org/ComfyUI
💻 安装要求和过程

环境要求
硬件要求

显卡：NVIDIA GPU (推荐) 或 AMD GPU，至少 4GB 显存

内存：建议 16GB 以上

存储：至少 10GB 可用空间（用于模型文件）
软件要求

Python：3.9 – 3.12

Git：用于克隆仓库

CUDA：12.4+ (NVIDIA GPU)
快速安装步骤

# 方法一：使用官方桌面应用（推荐）
# 访问 https://comfy.org/download 下载安装

# 方法二：从源码安装
# 1. 克隆仓库
git clone https://github.com/Comfy-Org/ComfyUI.git
cd ComfyUI

# 2. 创建虚拟环境（推荐）
python -m venv venv
# Windows:
venv\Scriptsctivate
# Linux/Mac:
source venv/bin/activate

# 3. 安装依赖
pip install -r requirements.txt

# 4. 启动 ComfyUI
python main.py

# 5. 访问浏览器
# 打开 http://127.0.0.1:8188

便携版（Windows）：

如果不想配置环境，可以下载官方提供的独立便携包，解压即可使用，无需安装Python和依赖。

⚙️ 核心功能

1. 节点式工作流搭建

通过可视化节点连接的方式组合AI模型、业务逻辑，灵活定制生成流程。每个节点代表一个功能模块（加载模型、输入提示词、采样、保存图像等），通过连线定义数据流。

2. 多模态内容生成

支持图像、视频、音频、3D等多种类型的内容生成，覆盖生成式AI主流应用场景。原生支持最新的开源SOTA模型。

3. 自定义扩展能力

支持自定义节点开发和发布，可对接第三方模型、工具，拓展功能边界。拥有丰富的社区插件生态，可以通过 ComfyUI Manager 一键安装扩展。

4. 工作流管理与复用

支持工作流模板复用、子图拆分、部分执行等特性。完成的工作流可以保存为JSON文件，方便分享和复用。内置 Comfy Hub 功能，可探索全球顶尖创作者的公开工作流。

5. API 与自动化对接

支持通过 MCP 协议连接AI智能体，实现生成任务的自动化调用。提供完整的 REST API，可以无缝集成到现有工作流中。

🎯 典型使用场景

场景一：AI 艺术创作者

需求：创作者需要精细控制AI绘画的每一个环节，尝试不同的模型组合和参数调整。

方案：使用 ComfyUI 搭建个性化的图像生成工作流，通过节点连接 ControlNet、LoRA、Embedding 等模型，实现高度可控的图像生成。可以保存多个工作流模板（如写实风格、动漫风格、概念设计等），一键切换。

优势：相比 WebUI，ComfyUI 的工作流方式让创作者能更清晰地理解生成过程，便于调试和优化。

场景二：AI 应用开发者

需求：开发者需要将AI图像生成功能集成到自己的应用或服务中，要求高并发、低延迟。

方案：利用 ComfyUI 的 API 模式，将工作流保存为JSON，通过 API 调用实现自动化图像生成。可以部署在服务器上，提供 HTTP 接口供其他应用调用。

优势：工作流可视化编辑，调试完成后一键部署，大幅降低开发门槛。

场景三：AI 研究与学习

需求：研究人员和学生需要深入理解扩散模型的各个组件和工作原理。

方案：ComfyUI 的节点式设计天然适合教学和研究。每个节点对应一个操作（如CLIP编码、VAE解码、KSampler采样等），可以清晰地看到数据流动和处理的全过程。

优势：模块化设计让实验和对比变得简单，方便快速验证新想法。

🌟 推荐理由

为什么推荐 ComfyUI？

1. 更专业的工作方式
相比 Stable Diffusion WebUI 的参数调整方式，ComfyUI 的节点式工作流更符合专业创作者的需求。它可以保存完整的工作流，方便复现和分享。

2. 更高的资源效率
ComfyUI 支持智能缓存，相同节点的计算结果会被复用，大幅减少重复计算。对显存的要求也相对更低。

3. 强大的社区生态
拥有超过 1000+ 自定义节点插件，覆盖各种功能需求。ComfyUI Manager 让插件安装变得极其简单。

4. 活跃的开发团队
由 comfyanonymous 主导开发，社区活跃度极高，Issues 和 PR 响应迅速，版本更新频繁。

5. 面向未来的设计
不仅支持图像生成，还在积极扩展视频、3D、音频等多模态生成能力，是真正的”生成式AI操作系统”。

使用心得：

我第一次使用 ComfyUI 时确实被满满的节点吓到了，感觉比 WebUI 复杂很多。但坚持使用后，我发现节点式工作流其实是更直观的方式——它让你看清AI绘画的每一个步骤。现在我已经积累了几十个工作流模板，从简单文生图到复杂的 ControlNet 组合，切换起来非常方便。如果你是想深入理解Stable Diffusion原理，或者需要高度定制化的生成流程，ComfyUI 绝对值得投入时间学习。

📥 下载地址
官方资源：

GitHub 仓库
 官方官网
 官方文档
 ComfyUI Manager

相关资源：

官方桌面应用：https://comfy.org/download (推荐新手使用)

Comfy Hub：https://www.comfy.org/hub (工作流分享社区)

模型下载：Hugging Face 或 Civitai

中文教程：B站搜索 “ComfyUI教程”
🎬 结语

ComfyUI 代表了AI创作工具的一个新方向——从”黑盒”转向”白盒”，从”简单参数调整”转向”可视化编程”。虽然学习曲线比 WebUI 陡峭，但一旦掌握，它将赋予你前所未有的控制力和创造力。

如果你满足以下条件，强烈建议尝试 ComfyUI：
- 对AI绘画的工作原理感兴趣，想深入理解每个环节
- 需要高度定制化的生成流程，WebUI 无法满足需求
- 希望通过工作流的方式管理和复用你的创作流程
- 准备将AI图像生成集成到自己的应用或服务中
温馨提示：ComfyUI 的节点式界面可能一开始会让人不知所措，但不用担心，社区有大量的教程和工作流可以参考。从简单的文生图工作流开始，逐步添加功能，你会发现这种方式的强大之处。

本文由 AI 辅助创作，开源项目信息来自 GitHub 官方仓库及社区贡献。
如果你觉得这个项目不错，欢迎到 GitHub 上给它一个 Star！
2026年6月8日
联合国报告：AI数据中心环境足迹堪比大国，耗水相当于13亿人年用量

联合国大学（UNU）前几天甩出一份报告，读完之后心情有点复杂。报告说，到2030年，全球数据中心的年耗电量将达到945太瓦时——这是什么概念？差不多等于巴基斯坦、孟加拉国和尼日利亚三个国家加起来的年用电量，这三个国家总人口超过6.5亿。

而这只是冰山一角。除了耗电，数据中心每用1度电，冷却系统和能源生产还会同步产生”水足迹”和”土地足迹”。报告预测，到2030年，AI相关的耗水量将相当于13亿人的基本年度生活用水需求，土地足迹超过1.45万平方公里——大概是雅加达都会区面积的两倍。

乡村地区绿色田野中的大型数据中心俯视图（图源：UN News）

训练模型不是耗电大户，你每天用AI才是

公众讨论AI的环境影响时，目光往往盯着训练大模型需要多少电。但联合国大学的研究发现，日常使用AI占总能源需求的80%到90%。这个规模相当惊人：一项被广泛使用的AI服务每天处理约25亿次提示，每年消耗数百吉瓦时的电力。

不同任务的能耗差异也很大。生成一张AI图像所需的能源，是简单文本分类的1000倍以上，而视频生成需要的资源甚至更多。靠提升效率来抵消增长的能源需求？报告说这不太现实，因为”反弹效应”——成本和性能降低会驱动使用量上升，最终结果还是总资源消耗增加。

到2030年，AI基础设施预计每年将产生多达250万吨电子垃圾。其中大部分负担会落在处置能力有限的中低收入国家。

环境成本集中在哪里，收益就去到了哪里

这份报告点出了一个经常被忽视的问题：AI基础设施的环境影响分布极不均匀。技术的收益是全球性的，但成本往往集中在特定地区。

在一些国家，数据中心已经占到全国电力消耗的很大一部分，给能源系统带来巨大压力。在另一些国家，数据中心扩张正在大量消耗水资源，有时甚至是在干旱条件下进行的。报告特别提到，AI硬件所需关键矿物的开采，也在资源产地引发了环境退化和社会不平等的担忧。

电子垃圾的挑战同样严峻。到2030年，AI基础设施预计每年将产生多达250万吨电子垃圾，而其中大部分负担可能会落在处置能力有限的中低收入国家——也就是说，发达国家享受AI的便利，发展中国家承担电子垃圾的后果。

超过90%的AI算力集中在美国和中国

报告还揭示了一个令人不安的数字——超过90%的AI专用计算能力集中在美国和中国两个国家，同时有150多个国家缺乏重要的国内AI基础设施。这种不平衡不仅限制了这些国家的经济机会，还引发了环境正义问题：一些国家承担了环境成本，却没有分享到AI驱动的增长带来的收益。

这跟几个月前Erin Brockovich盯上数据中心行业的故事形成了呼应。当时她的团队上线了全美数据中心分布地图，首月收到近4000份居民投诉，核心问题就是”不透明”——项目获批后才公布、居民被排除在决策之外。现在联合国大学把这个问题放在了全球尺度上重新讨论。

联合国大学的研究人员强调，这份报告并不是反对AI本身，而是呼吁采取紧急行动，确保这项技术在地球承载限度内发展。报告提出了”负责任的AI生态系统”框架，构建原则包括透明度、设计即高效、公平性、全生命周期责任、全球合作和可持续使用。

具体到能做些什么：各国政府需要将AI基础设施纳入能源、水和土地利用规划；企业需要设计尽量减少资源消耗的系统；普通用户也可以通过尽可能选择低影响的应用来发挥作用。AI的未来不仅取决于技术创新，还取决于当下做出的治理选择。

📎 原文来源：UN News – AI’s environmental costs threaten water, land and climate

2026年6月8日
Anthropic秘密递交IPO申请，9650亿美元估值反超OpenAI

6月1日，Anthropic悄咪咪地向美国SEC递交了S-1注册声明，正式启动IPO进程。这家公司走的是”秘密递表”路线，外界暂时看不到招股书细节，但光是这份声明本身，就已经在硅谷炸开了锅。

要知道，就在递交IPO申请前4天——5月28日——Anthropic刚刚完成H轮融资，投后估值飙到9650亿美元，约合人民币6.5万亿元。这个数字已经正式超过了OpenAI今年3月融资后的8520亿美元估值。Anthropic从”OpenAI挑战者”变成了”全球估值最高的AI初创企业”。

从OpenAI出走的人，做了一家比OpenAI更值钱的公司

Anthropic的创始人是Dario Amodei和Daniela Amodei兄妹俩，两人之前都在OpenAI担任核心职位——Dario是研究副总裁，Daniela是安全政策副总裁。2021年，他们因为AI安全路线的问题跟OpenAI管理层闹翻了，干脆带着一批核心成员出走，自己搞了一家”更安全的AI公司”。

当时ChatGPT还没出生，AI的主流叙事是”先把AGI做出来再说”。Anthropic选了一条不同的路：先把企业级用户和开发者伺候好，再做消费者市场。这个选择在2025年到2026年之间彻底兑现了——Claude Code发布后迅速抢下超过50%的AI编程市场份额，Fortune 100企业里有70%成了它的付费客户。

Anthropic超过80%的收入来自API调用和企业级客户，这种B端深度绑定的商业模式，比OpenAI依赖C端订阅的玩法要稳得多。

收入5个月涨了5倍，这在AI圈是什么概念

招股书披露的数据相当夸张：Anthropic的年化经常性收入（ARR）从2025年底的90亿美元，飙到2026年4月的约450亿美元。短短4个月，收入规模涨了5倍。

更狠的是，公司预计2026年第二季度就能首次实现盈利。在AI公司普遍”收入越高、亏得越多”的大环境下，Anthropic居然快要赚钱了。2024年它的毛利率一度低到-94%，全是GPU折旧和推理算力成本拖累的。到2025年，毛利率已经修正到约40%，公司还给自己定了一个远期目标：2027年突破70%。

Anthropic CEO Dario Amodei（图源：Getty Images）

谷歌和亚马逊都在重仓，这场IPO不止是Anthropic的事

Anthropic的投资方名单读起来像硅谷名人录：谷歌计划最高投400亿美元，亚马逊已经投了130亿、这轮又追加50亿，还承诺未来十年在AWS技术上投入超1000亿美元，把Claude作为其云AI战略的核心底座。

这轮H轮融资由阿尔蒂米特资本、德拉戈尼尔投资、格林奥克斯资本和红杉资本领投，其他投资方还包括德劭集团、黑石、简街、淡马锡等。估值在3个月内从2月G轮融资的3800亿美元暴涨154%，达到9650亿美元。

现在美股科技板块的IPO窗口全面打开。SpaceX已于5月20日正式递交招股书，目标估值2万亿美元；OpenAI预计今年9月启动上市流程，目标市值约1万亿至1.2万亿美元。三家公司的合计潜在募资规模可能超过2400亿美元，合计估值可能超过4万亿美元。

Anthropic选在秋季正式挂牌，给自己留了5到6个月的窗口期来应对市场波动。它递交IPO的真正意图，不只是跟OpenAI和SpaceX抢”AI第一股”的命名权，更是在向资本市场展示一套成型的财务模型：高粘性B端订单加盈利窗口提前显现加收入超高速增长。这套打法跟OpenAI依赖消费者订阅的逻辑截然不同，它的估值框架会更贴近企业级软件和SaaS的定价范式。

当然，市场上也有质疑声。香橼资本公开表示将做空Anthropic，马斯克在社交媒体上直接开炮说”万亿估值是个笑话”。多空对峙在IPO定价阶段就已经开始了，最终市场买不买账，还要看正式招股书里披露的数字够不够有说服力。

📎 原文来源：TechCrunch – Anthropic files to go public

2026年6月8日
国产大模型又放大招，MiniMax M3编程能力居然超过了GPT-5.5
最近国产大模型圈又热闹起来了，MiniMax刚发布了新一代的通用模型MiniMax M3，据说编程能力在SWE-Bench Pro基准测试里超过了GPT-5.5和Gemini 3.1 Pro，只比Claude Opus 4.7差一点点。

自研架构，1M超长上下文

MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型，用的是自研的MiniMax Sparse Attention（MSA）稀疏注意力架构，1M上下文下单token的计算量只有上一代的1/20，处理长文本的时候效率高了很多。

MiniMax的团队说，M3的编程能力已经能帮开发者完成很多复杂的编程任务，比如调试代码、优化性能、写复杂的算法，能省不少时间。

MiniMax正式发布新一代通用模型MiniMax M3

除了模型本身，MiniMax还推出了配套的AI编程产品MiniMax Code，能自主运行数天不用人工干预，帮开发者完成从写代码到测试的全流程。现在很多开发者都已经用上AI辅助编程了，MiniMax Code这种能自主运行的工具，说不定能把编程的效率再提一个档次。

国产大模型加速上市

就在发布M3的同时，MiniMax还启动了A股IPO辅导，目标是在科创板上市。其实之前智谱也已经完成了第四期上市辅导，国产大模型公司现在都在加速上市进程，说明资本对AI落地价值的认可已经回归基本面了。以后我们不仅能用到更好的国产大模型，还能通过投资分享AI发展的红利。
- M3编程能力超过GPT-5.5，接近Claude Opus 4.7
- 支持1M超长上下文，自研稀疏注意力架构，效率更高
- 推出MiniMax Code，可自主运行数天，辅助编程全流程
- 启动A股IPO辅导，国产大模型加速上市进程
📎 原文来源：MiniMax推出MiniMax M3模型
2026年6月8日
黄仁勋又发新卡了，这次英伟达要把AI芯片塞进你的电脑里
这两天台北的Computex 2026展会正式开幕，英伟达的CEO黄仁勋又站出来搞事情了。这次他带来的不是普通的显卡，而是专为Agentic AI设计的新一代Vera Rubin芯片，据说OpenAI和Anthropic已经率先决定用了。

不止是新芯片，还要做PC处理器

除了Vera Rubin芯片，黄仁勋还宣布要和微软合作，推出基于台积电3nm工艺的ARM架构Windows PC芯片，名字叫RTX SPARK，计划2026年秋季就上市。这意味着英伟达正式进军个人电脑芯片市场，要打破英特尔这么多年的垄断。

黄仁勋在演讲里说，Agentic AI的时代已经全面到来了，以后的AI不是只能聊聊天，而是能自主完成很多复杂的任务，这就需要更强大的芯片来支持。

黄仁勋在GTC Taipei 2026大会上发表主题演讲

其实这几年英伟达在AI芯片领域的优势已经很明显了，这次发布的Vera Rubin芯片专门针对Agentic AI做了优化，处理多任务的能力比之前的芯片强了不少。而RTX SPARK PC芯片更是直接杀入英特尔的腹地，以后我们买电脑的时候，除了英特尔和AMD的处理器，可能还要多一个英伟达的选项了。

国产芯片也在发力

就在英伟达发布新芯片的同时，国内的算力芯片也在进步。深圳河套学院最近用昇腾910C集群，完成了1.6万亿参数的DeepSeek-V4-Pro全流程训练，这说明国产芯片已经能支撑世界级的超大参数模型训练了。以后国内做AI训练和推理，用国产芯片也能有不错的效果，不用完全依赖国外的产品。
- Vera Rubin芯片专为Agentic AI设计，性能大幅提升
- RTX SPARK PC芯片采用台积电3nm工艺，2026年秋季上市
- 国产昇腾910C集群已完成万亿参数模型训练，国产算力进步明显
📎 原文来源：英伟达GTC Taipei 2026开幕，黄仁勋主题演讲直播已开始
2026年6月8日
Ollama：170k Stars！本地LLM运行工具，让AI模型在本地飞速运行
配图

Ollama – 本地LLM运行工具

项目简介

Ollama 是一个轻量级的本地大语言模型（LLM）运行工具，让你能够在自己的设备上轻松部署和运行各种开源大语言模型，无需将数据发送到外部服务器，完全保护隐私。

截至2026年，Ollama 已在 GitHub 获得 17万+ Stars，成为最广泛使用的本地LLM运行时，Docker Hub下载量超过1亿次。

安装要求和过程

环境要求
- 操作系统：Linux（Ubuntu 20.04+）、macOS 11+、Windows 10（需WSL2）
- 内存：8GB以上（运行7B模型），16GB以上（运行13B模型），32GB以上（运行33B+模型）
- 存储：至少10GB可用空间（用于存放模型文件）
- GPU：可选，NVIDIA GPU（CUDA）、AMD GPU（ROCm）或苹果M系列芯片可加速推理
快速安装步骤

macOS/Linux 一键安装：
```
# Linux/macOS
curl -fsSL https://ollama.com/install.sh | sh

# macOS 也可用 Homebrew
brew install ollama
```
Windows 安装：
1. 访问 https://ollama.com/download 下载 Windows 安装包
2. 运行 OllamaSetup.exe，按照提示完成安装
3. 打开命令提示符或PowerShell，输入 ollama --version 验证安装
Docker 安装（推荐服务器环境）：
```
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
```
核心功能
1. 一键运行本地模型：支持一键拉取和运行100+开源大语言模型，包括 Llama 3.3、Mistral、Qwen、Phi、DeepSeek R1 等热门模型。
2. OpenAI API 兼容：原生提供兼容 OpenAI API 格式的 REST API（默认端口11434），可直接对接现有基于 OpenAI 生态开发的应用和工具。
3. 智能硬件加速：自动适配 NVIDIA（CUDA）、AMD（ROCm）、苹果 M 系列芯片（Metal）的 GPU 加速，大幅提升推理速度。
4. 模型自定义配置：支持通过 Modelfile 自定义模型参数（温度、上下文长度、系统提示词等），轻松创建专属模型。
5. 多模态支持：最新版本支持视觉模型（如 Llama 3.2 Vision），可处理图像输入，实现图文混合推理。
典型使用场景

场景一：开发者本地 AI 应用开发

作为开发者，你可以使用 Ollama 在本地运行 LLM，用于：
- 开发和测试 AI 应用，无需支付 API 费用
- 对接 Open-WebUI 等前端界面，搭建私有化 AI 聊天助手
- 通过 API 集成到自己的应用中，实现本地智能推理
示例：用 Ollama 运行 Llama 3.3 8B 模型，通过 OpenAI 兼容 API 为本地应用添加 AI 能力。

场景二：企业私有化部署

对于企业用户，Ollama 提供了：
- 数据隐私保护：所有推理过程在本地完成，敏感数据无需上传云端
- 零 API 成本：无需为每次 API 调用付费，适合高频调用场景
- 离线可用：模型下载后，无需联网即可使用，适合内网环境
推荐理由

我个人从2025年开始使用 Ollama，它已经成为我本地 AI 开发的标配工具。推荐理由如下：
1. 极简体验：一条命令就能安装，一条命令就能运行模型，对新手极其友好。
2. 生态丰富：支持对接 Open-WebUI、Continue（VS Code 插件）、LangChain 等50+主流工具，可玩性极高。
3. 性能优秀：支持 4-bit/8-bit 量化，即使在中端笔记本上也能流畅运行 7B 参数的模型。
4. 活跃社区：GitHub 上40000+社区集成，几乎任何你能想到的工作流，都有人已经做好了集成方案。
如果你想要一个简单、快速、隐私安全的本地 LLM 运行方案，Ollama 绝对是首选。

下载地址
- 官方网站：https://ollama.com
- GitHub 仓库：https://github.com/ollama/ollama
- 文档中心：https://github.com/ollama/ollama/blob/main/README.md
- 模型库：安装后运行 ollama pull <模型名> 即可拉取模型
2026年6月8日
WWDC 2026：苹果准备再次介绍Siri，这次真的要用上Gemini了

过去几年，苹果在AI这条路上一直在追赶。但换个角度看，落后未必是坏事。

周一的WWDC 2026上，苹果准备再次向用户介绍新版Siri。说”再次”，是因为我们早在2024年苹果高调”推出”Apple Intelligence时就见过新Siri了——当时换上了发光边框，提供了不同的语音选项，还具备了把问题转交给ChatGPT的能力。苹果当时承诺Siri的”智能”功能很快上线，结果并没有。

事实上，苹果围绕Apple Intelligence的宣传如此具有误导性，以至于公司正在和解一起集体诉讼，需要为从未兑现的功能向iPhone用户进行赔偿。

2024年WWDC上，苹果首次曝光AI版Siri，口号是”AI for the rest of us”。两年过去了，这次得动真格了。

AI助手竞赛，苹果已经输了

如果把这事儿当成一场竞赛，苹果已经输得很彻底了。Gemini已经能实现叫Uber、点照烧外卖、查看你的日历并计算你该什么时候出发去机场这类功能。Gemini赢得这场竞赛，实至名归。

但与此同时，人们对AI的不信任感正在上升，尤其是年轻人。Gemini越强大，给人的感觉就越诡异。要交付真正有用的助手，AI必须做到能预判你的需求，但”希望AI助手预判你的下一步需求”和”亲眼看到它真的这么做了”完全是两回事。

我自愿授予了Gemini访问我的Google相册和Gmail的权限，但每次听到Gemini大声说出我儿子的名字，我还是会觉得毛骨悚然。

苹果的新玩法：借力Gemini

新版Siri将以某种形式基于Gemini构建。苹果无疑会为这项特权支付高昂的费用，但这种”隔了一层”的合作模式也有潜在的好处。

你知道哪家公司没有和大型不受欢迎的数据中心项目绑定吗？是苹果。谷歌为了在全国各地的社区大规模开工建设数据中心，并没有赢得多少好感。苹果就算付费给谷歌，也不用背负这个负面名声，哪怕它付给谷歌的钱大概率会被投入到庞大的数据中心建设中。

还有Copilot相关的争议：也就是”到处都是AI按钮”的问题。Siri尝试总结消息的功能既好笑又烦人，但至少Siri不会钻进你每一份工作文档里，非要帮你做总结。

隐私牌，苹果的老本事

可以预料，苹果会在WWDC上大谈隐私。私有云计算（Private Cloud Compute）会被再次搬出来，据说这项技术可以让你的数据就像从未离开过你的设备一样安全。新版Siri可能还会提供自动删除聊天记录的选项，而不是默认保留所有数据。

承诺更私密、更安全的AI体验，可能会吸引那些不愿意向谷歌交出更多个人信息的人。但对于那些已经受够了软件里到处都是AI的人来说，这并没有什么帮助。

苹果完全可以把AI进展缓慢包装成更负责任的做法。把之前的延迟说成是”花时间把事情做对”，并不是个坏策略。但虚假启动的阶段已经结束了。这次Siri必须要真的兑现承诺；这种第二次机会不会一直有，错过了就不会再来。

📎 原文来源：Here comes new Siri again — The Verge

2026年6月8日
Meta自己下场做AI点击诱饵，还把已故女王生成了两遍

Facebook上早就充斥着各种点击诱饵文章，现在Meta干脆自己动手，用AI批量生产这类内容了。

事情是这样的。Meta的独立AI应用有个”为你推荐”板块，会推送一堆看着就很眼熟的故事卡片——标题党、配图夸张、内容空洞，典型的点击诱饵风格。但问题在于，这些故事从头到尾都是AI生成的，包括话题、配图、正文，一个字都不是人写的。

AI眼中的英国是什么样

驻伦敦的记者Robert Hart收到了一堆极具”英国特色”的推送：茶、礼仪、酒吧、王室、足球，还有排队技巧。具体标题大概是这样的：”王室管家终于解决了先加奶还是先加茶的争论”、”不知道原因就加入排队的心理学”、”英式责备的精髓解析”、”逛遍英国所有酒吧的极限运动”。

他的同事更惨，被算法判定为奢侈品手表爱好者，推送了”我的假劳力士实验”和”劳力士候补名单背后的残酷数学”这类故事。

AI生成的英国王室图片，里面出现了两个伊丽莎白二世女王——而她已经去世几年了。图片来源：Meta AI

AI生成的正文基本是凑字数的填充内容，翻来覆去重复提示词的前提，没有任何实质信息，也没有标注任何信息来源。如果你多次点击同一张卡片，每次生成的故事都是同一个主题的不同变体，但内容会略有不同。

AI生成的内容里甚至出现了真实人物，而且错误百出。一张标题为”2026年谁真的在为王室买单？”的配图里，出现了两个伊丽莎白二世女王——而她已经去世几年了。她旁边还有看起来像是凯特王妃和威廉王子的人物，但面部扭曲、身体比例怪异，是典型的AI生成瑕疵。

Meta的尴尬回应

记者联系Meta询问这个功能的目的是什么、输出的内容算新闻还是虚构故事、有什么保障措施、生成真实人物图像是否符合其内容政策。Meta发言人的回应非常简短：”我们的目标是推荐对你最相关的内容——比如健身建议、膳食计划或其他见解——甚至在你提出要求之前。”

后来这份声明又发了一遍，神秘地删除了”甚至在你提出要求之前”这句话。

当天晚些时候，第三份声明来了：”这是针对有限数量用户的测试，该功能将被弃用。Meta没有推进该功能的计划。”

这个回应反而引发了更多疑问：《The Verge》至少有四名记者都能使用这个功能，这算哪门子的”有限测试”？

说到底，这件事暴露了Meta在AI内容生成上的草率。一个连”先加奶还是先加茶”都搞不清楚的AI，批量生产点击诱饵内容推送给用户，还生成已故王室成员的错误图像——这不是创新，这是 irresponsible。

📎 原文来源：Meta made its own AI-generated clickbait news feed — The Verge

2026年6月8日

博客

投资人的钱，不是无限供应的

连Uber都扛不住的AI账单

“Tokenmaxxing”从爆火到翻车，只用了6个月

一场悲剧推动的立法

法案到底说了什么

AI公司的麻烦才刚开始

📘 项目简介

💻 安装要求和过程

环境要求

硬件要求

软件要求

快速安装步骤

⚙️ 核心功能

1. 节点式工作流搭建

2. 多模态内容生成

3. 自定义扩展能力

4. 工作流管理与复用

5. API 与自动化对接

🎯 典型使用场景

场景一：AI 艺术创作者

场景二：AI 应用开发者

场景三：AI 研究与学习

🌟 推荐理由

为什么推荐 ComfyUI？

📥 下载地址

🎬 结语

训练模型不是耗电大户，你每天用AI才是

环境成本集中在哪里，收益就去到了哪里

超过90%的AI算力集中在美国和中国

从OpenAI出走的人，做了一家比OpenAI更值钱的公司

收入5个月涨了5倍，这在AI圈是什么概念

谷歌和亚马逊都在重仓，这场IPO不止是Anthropic的事

自研架构，1M超长上下文

国产大模型加速上市

不止是新芯片，还要做PC处理器

国产芯片也在发力

配图

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：开发者本地 AI 应用开发

场景二：企业私有化部署

推荐理由

下载地址

AI助手竞赛，苹果已经输了

苹果的新玩法：借力Gemini

隐私牌，苹果的老本事

AI眼中的英国是什么样

Meta的尴尬回应