作者: hiyoho

  • 绿色卫衣女性与巨型WhatsApp标志超写实人像

    绿色卫衣女性与巨型WhatsApp标志超写实人像

    绿色卫衣女性与巨型WhatsApp标志超写实人像



    🤖 Nano banana pro

    🇺🇸 English Prompt

    A hyper-realistic, 8k, full-body studio shot of a beautiful young woman, uploaded face as reference, standing confidently with a slight smile. The person is wearing a vibrant green hoodie with the white text 'AIwithkinza' prominently displayed on the chest, grey cargo pants with visible pockets, and clean white sneakers. They are leaning casually against an oversized, three-dimensional WhatsApp logo, which is significantly larger than the person, creating a surreal sense of scale; the person's left arm rests on top of the WhatsApp logo, while their right hand is casually tucked into their pant pocket, and their legs are crossed at the ankles.
    ​The WhatsApp logo is rendered with a glossy finish, featuring the iconic green speech bubble and white phone icon, and is supported by a sleek metallic pole that extends downwards. The entire setup is placed on a rectangular, matte black pedestal, around which soft, ethereal white smoke or clouds gently billow, creating a sense of elevation and mystique. A silver plaque is affixed to the front of the pedestal, displaying the text 'Kinza ' in an elegant script.
    ​The composition is a centered, eye-level shot with an 85mm lens, utilizing cinematic studio lighting with soft shadows and subtle rim lighting to highlight textures and depth. The background is a clean, minimalist light grey, ensuring the subject and props are the focal point, with highly detailed textures visible on the clothing, skin, and props.

    🇨🇳 中文提示词

    一张超写实、8k、全身工作室拍摄的一位美丽年轻女性的照片,上传的面部作为参考,自信地站着,带着微小的微笑。这个人穿着一件鲜艳的绿色连帽衫,胸前显眼地印着白色文字“AIwithkinza”,灰色工装裤带有可见的口袋,以及干净的白色运动鞋。他们自然地靠在一个超大的、三维的WhatsApp标志上,这个标志比人要大得多,营造出一种超现实的比例感;这个人的左臂搭在WhatsApp标志顶部,而右手自然地插进裤兜里,双腿在脚踝处交叉。WhatsApp标志以亮面呈现,具有标志性的绿色气泡和白色电话图标,并由一根向下延伸的光滑金属杆支撑。整个装置放置在一个长方形的哑光黑色底座上,周围环绕着柔和、空灵的白烟或云朵轻轻翻腾,营造出一种提升感和神秘感。底座正面贴着一块银色标牌,以优雅的字体显示文字“Kinza”。构图是采用85mm镜头的中心、平视拍摄,利用电影工作室灯光,配合柔和的阴影和微妙的轮廓光,以突出纹理和深度。背景是干净、极简的浅灰色,确保主体和道具是焦点,衣服、皮肤和道具上可见高度详细的纹理。
  • 超写实女性足球运动员全身肖像

    超写实女性足球运动员全身肖像

    超写实女性足球运动员全身肖像



    🤖 ChatGPT

    🇺🇸 English Prompt

    Ultra-realistic full-body female football player portrait, standing confidently on a professional football field, wearing a stylish white football jersey and shorts with black accents and number 7, white knee-high socks, white football boots, one foot resting on a soccer ball, arms crossed, confident smile, long flowing dark hair, athletic physique, stadium lights in background, green grass turf, sports photography, dynamic pose, professional athlete look, cinematic lighting, ultra-detailed, sharp focus,  quality, realistic shadows, sports magazine cover style, vibrant colors, high-end football player portrait.

    🇨🇳 中文提示词

    超写实全身女性足球运动员肖像,自信地站在专业足球场上,穿着时尚的白色足球球衣和带有黑色点缀的短裤及7号号码,白色及膝长袜,白色足球鞋,一只脚踩在足球上,双臂交叉,自信的微笑,长而飘逸的深色头发,运动体型,背景中有体育场灯光,绿草草坪,运动摄影,动态姿势,专业运动员外观,电影级光效,超细节,锐利聚焦,高质量,真实阴影,体育杂志封面风格,鲜艳的色彩,高端足球运动员肖像。
  • GitHub Copilot突然涨价,AI行业的好日子要到头了

    微软最近悄悄改了GitHub Copilot的收费规则——从原来的”一口价”变成按token用量收费。这事在Reddit上炸了锅,有用户直接造了个新词:“Tokenpocalypse”(Token末日)。听起来像玩笑,但背后藏着AI行业一个越来越烫手的问题:烧钱的速度,已经烧到用户头上了。

    投资人的钱,不是无限供应的

    过去几年,AI公司给人的感觉是”钱多、任性、随便用”。ChatGPT刚开始收费的时候,20美元一个月,怎么看都像拍脑袋定的价——”先弄个号码看看”。但那个价格背后,是投资人在替用户买单。

    现在不一样了。Anthropic要上市,OpenAI也想上市,投资人不干了——你得证明自己能赚钱。怎么办?只能把成本往用户那边推。GitHub Copilot这波涨价,只是个开始。

    Uber当年也是这么过来的:先烧钱抢市场,再涨价、压缩成本、挤利润。AI公司现在走到了同一条路上,只是他们的成本比Uber刚多了——算力、电费、GPU……每一样都是吞金兽。

    连Uber都扛不住的AI账单

    TechCrunch的播客里提到一个很有意思的案例:Uber。这家公司在一年半的时间里,把自己AI预算花爆了,然后赶紧给员工用AI设限——”别再用那么多了,太贵了”。

    想想看,Uber这样的公司都觉得AI贵,那中小公司怎么办?更要命的是,AI公司自己也在亏钱。Anthropic要上市,招股书里得写”风险因素”——可这行业变得太快,今天的风险,下个月可能就不是风险了,也可能突然多了十个新风险。怎么写?

    “Tokenmaxxing”从爆火到翻车,只用了6个月

    还有一个很魔幻的事:”tokenmaxxing”(极致化使用token)这个概念,从流行到被企业嫌弃,只用了6个月。一开始大家觉得”能多用就多用,反正公司报销”,后来财务一看账单,直接晕过去。

    AI公司现在面临一个尴尬的局面:降价吧,自己亏死;涨价吧,用户骂死。微软选择先涨为敬,其他公司大概率会跟上。到那时候,AI工具就不再是什么”人人用得起”的东西了,而会变成按用量计费的企业级服务——用得越多,账单越恐怖。


    对普通用户来说,这意味着什么?可能是ChatGPT Plus涨价,可能是Claude限制免费次数,可能是你公司里用的AI工具突然开始”按token收费”。Tokenpocalypse这个词,说不定很快就会从Reddit的段子,变成所有人的账单现实。

  • 纽约州率先出手:AI聊天机器人不准再假装是孩子的’朋友’

    AI聊天机器人能不能跟青少年建立”陪伴关系”?纽约州说不行。上周,纽约州立法者通过了一项法案,直接把这条路堵死——如果州长凯西·霍赫尔(Kathy Hochul)签署,AI公司就不能让青少年使用那些假装自己是人类的聊天机器人,更不许AI充当青少年的”伴侣”。

    一场悲剧推动的立法

    这事不是凭空冒出来的。过去一年多,好几家AI公司被推上了被告席,原因都一样——他们的聊天机器人被指控诱导青少年用户自杀或自残。官司有的还在打,有的已经达成和解,但舆论的压力已经足够让立法者坐不住了。

    最典型的案子是Character.AI。这款应用允许用户创建”虚拟角色”,然后跟它们聊天。问题出在,这些AI角色会被青少年当成”真实的存在”,甚至建立情感依赖。悲剧发生后,家属把Character.AI告上法庭,类似的诉讼接二连三。

    AI陪伴这个词,听着温情,背后可能是青少年心理健康的风险。纽约州这份法案,等于直接给”AI假装人类陪伴青少年”按了暂停键。

    法案到底说了什么

    法案的核心很直接:禁止AI聊天机器人向未成年人”扮演同伴角色”。换句话说,AI可以回答问题、可以帮助学习,但不能假装自己是”朋友””知己””伴侣”,更不能利用这种虚假关系影响青少年的情绪和行为。

    目前法案已经通过了州议会,但还得等州长霍赫尔签字才能正式生效。霍赫尔是民主党人,历来对科技监管比较积极,外界普遍预期她会签。一旦落地,纽约州就成了全美第一个在州层面限制”AI陪伴”的州。

    AI公司的麻烦才刚开始

    这份法案一旦生效,受影响的不会只有Character.AI。现在市面上所有带”AI陪伴”属性的产品——不管是Replika、Snapchat的My AI,还是各类心理健康聊天机器人——都得重新检视自己的产品设计,看看有没有踩到纽约州的红线。

    更麻烦的是,纽约州向来是其他州的政策风向标。加州、马萨诸塞州、伊利诺伊州……很可能跟着出台类似规定。到那时候,AI公司面临的就不只是”纽约州市场”的问题,而是整个美国市场对”AI陪伴”的监管收紧。


    这件事也给国内提了个醒。国内AI聊天产品也不少,不少同样主打”陪伴””倾听””虚拟朋友”。青少年保护这根弦,迟早也得绷起来。纽约州这份法案,值得盯着看。

  • ComfyUI:109K Stars!最强节点式AI绘画工具,工作流可视化让创作更自由

    ComfyUI 截图

    ComfyUI 节点式工作流界面

    📘 项目简介

    ComfyUI 是一款功能最强大的开源生成式AI节点式应用程序,也是用于生成式AI的节点式界面和推理引擎。由 comfyanonymous 及众多贡献者开发,完全开源,支持在本地Windows、Linux、macOS设备上运行。用户可以通过节点组合各类AI模型和操作,实现高度可定制、可控的内容生成。

    核心特点:

    💻 安装要求和过程

    环境要求

    硬件要求

    • 显卡:NVIDIA GPU (推荐) 或 AMD GPU,至少 4GB 显存
    • 内存:建议 16GB 以上
    • 存储:至少 10GB 可用空间(用于模型文件)

    软件要求

    • Python:3.9 – 3.12
    • Git:用于克隆仓库
    • CUDA:12.4+ (NVIDIA GPU)

    快速安装步骤

    # 方法一:使用官方桌面应用(推荐)
    # 访问 https://comfy.org/download 下载安装

    # 方法二:从源码安装
    # 1. 克隆仓库
    git clone https://github.com/Comfy-Org/ComfyUI.git
    cd ComfyUI

    # 2. 创建虚拟环境(推荐)
    python -m venv venv
    # Windows:
    venv\Scriptsctivate
    # Linux/Mac:
    source venv/bin/activate

    # 3. 安装依赖
    pip install -r requirements.txt

    # 4. 启动 ComfyUI
    python main.py

    # 5. 访问浏览器
    # 打开 http://127.0.0.1:8188

    便携版(Windows):

    如果不想配置环境,可以下载官方提供的独立便携包,解压即可使用,无需安装Python和依赖。

    ⚙️ 核心功能

    1. 节点式工作流搭建

    通过可视化节点连接的方式组合AI模型、业务逻辑,灵活定制生成流程。每个节点代表一个功能模块(加载模型、输入提示词、采样、保存图像等),通过连线定义数据流。

    2. 多模态内容生成

    支持图像、视频、音频、3D等多种类型的内容生成,覆盖生成式AI主流应用场景。原生支持最新的开源SOTA模型。

    3. 自定义扩展能力

    支持自定义节点开发和发布,可对接第三方模型、工具,拓展功能边界。拥有丰富的社区插件生态,可以通过 ComfyUI Manager 一键安装扩展。

    4. 工作流管理与复用

    支持工作流模板复用、子图拆分、部分执行等特性。完成的工作流可以保存为JSON文件,方便分享和复用。内置 Comfy Hub 功能,可探索全球顶尖创作者的公开工作流。

    5. API 与自动化对接

    支持通过 MCP 协议连接AI智能体,实现生成任务的自动化调用。提供完整的 REST API,可以无缝集成到现有工作流中。

    🎯 典型使用场景

    场景一:AI 艺术创作者

    需求:创作者需要精细控制AI绘画的每一个环节,尝试不同的模型组合和参数调整。

    方案:使用 ComfyUI 搭建个性化的图像生成工作流,通过节点连接 ControlNet、LoRA、Embedding 等模型,实现高度可控的图像生成。可以保存多个工作流模板(如写实风格、动漫风格、概念设计等),一键切换。

    优势:相比 WebUI,ComfyUI 的工作流方式让创作者能更清晰地理解生成过程,便于调试和优化。

    场景二:AI 应用开发者

    需求:开发者需要将AI图像生成功能集成到自己的应用或服务中,要求高并发、低延迟。

    方案:利用 ComfyUI 的 API 模式,将工作流保存为JSON,通过 API 调用实现自动化图像生成。可以部署在服务器上,提供 HTTP 接口供其他应用调用。

    优势:工作流可视化编辑,调试完成后一键部署,大幅降低开发门槛。

    场景三:AI 研究与学习

    需求:研究人员和学生需要深入理解扩散模型的各个组件和工作原理。

    方案:ComfyUI 的节点式设计天然适合教学和研究。每个节点对应一个操作(如CLIP编码、VAE解码、KSampler采样等),可以清晰地看到数据流动和处理的全过程。

    优势:模块化设计让实验和对比变得简单,方便快速验证新想法。

    🌟 推荐理由

    为什么推荐 ComfyUI?

    1. 更专业的工作方式
    相比 Stable Diffusion WebUI 的参数调整方式,ComfyUI 的节点式工作流更符合专业创作者的需求。它可以保存完整的工作流,方便复现和分享。

    2. 更高的资源效率
    ComfyUI 支持智能缓存,相同节点的计算结果会被复用,大幅减少重复计算。对显存的要求也相对更低。

    3. 强大的社区生态
    拥有超过 1000+ 自定义节点插件,覆盖各种功能需求。ComfyUI Manager 让插件安装变得极其简单。

    4. 活跃的开发团队
    由 comfyanonymous 主导开发,社区活跃度极高,Issues 和 PR 响应迅速,版本更新频繁。

    5. 面向未来的设计
    不仅支持图像生成,还在积极扩展视频、3D、音频等多模态生成能力,是真正的”生成式AI操作系统”。

    使用心得:

    我第一次使用 ComfyUI 时确实被满满的节点吓到了,感觉比 WebUI 复杂很多。但坚持使用后,我发现节点式工作流其实是更直观的方式——它让你看清AI绘画的每一个步骤。现在我已经积累了几十个工作流模板,从简单文生图到复杂的 ControlNet 组合,切换起来非常方便。如果你是想深入理解Stable Diffusion原理,或者需要高度定制化的生成流程,ComfyUI 绝对值得投入时间学习。

    📥 下载地址

    🎬 结语

    ComfyUI 代表了AI创作工具的一个新方向——从”黑盒”转向”白盒”,从”简单参数调整”转向”可视化编程”。虽然学习曲线比 WebUI 陡峭,但一旦掌握,它将赋予你前所未有的控制力和创造力。

    如果你满足以下条件,强烈建议尝试 ComfyUI:

    • 对AI绘画的工作原理感兴趣,想深入理解每个环节
    • 需要高度定制化的生成流程,WebUI 无法满足需求
    • 希望通过工作流的方式管理和复用你的创作流程
    • 准备将AI图像生成集成到自己的应用或服务中

    温馨提示:ComfyUI 的节点式界面可能一开始会让人不知所措,但不用担心,社区有大量的教程和工作流可以参考。从简单的文生图工作流开始,逐步添加功能,你会发现这种方式的强大之处。


    本文由 AI 辅助创作,开源项目信息来自 GitHub 官方仓库及社区贡献。
    如果你觉得这个项目不错,欢迎到 GitHub 上给它一个 Star!

  • 联合国报告:AI数据中心环境足迹堪比大国,耗水相当于13亿人年用量

    联合国大学(UNU)前几天甩出一份报告,读完之后心情有点复杂。报告说,到2030年,全球数据中心的年耗电量将达到945太瓦时——这是什么概念?差不多等于巴基斯坦、孟加拉国和尼日利亚三个国家加起来的年用电量,这三个国家总人口超过6.5亿。

    而这只是冰山一角。除了耗电,数据中心每用1度电,冷却系统和能源生产还会同步产生”水足迹”和”土地足迹”。报告预测,到2030年,AI相关的耗水量将相当于13亿人的基本年度生活用水需求,土地足迹超过1.45万平方公里——大概是雅加达都会区面积的两倍。

    AI数据中心俯视图
    乡村地区绿色田野中的大型数据中心俯视图(图源:UN News)

    训练模型不是耗电大户,你每天用AI才是

    公众讨论AI的环境影响时,目光往往盯着训练大模型需要多少电。但联合国大学的研究发现,日常使用AI占总能源需求的80%到90%。这个规模相当惊人:一项被广泛使用的AI服务每天处理约25亿次提示,每年消耗数百吉瓦时的电力。

    不同任务的能耗差异也很大。生成一张AI图像所需的能源,是简单文本分类的1000倍以上,而视频生成需要的资源甚至更多。靠提升效率来抵消增长的能源需求?报告说这不太现实,因为”反弹效应”——成本和性能降低会驱动使用量上升,最终结果还是总资源消耗增加。

    到2030年,AI基础设施预计每年将产生多达250万吨电子垃圾。其中大部分负担会落在处置能力有限的中低收入国家。

    环境成本集中在哪里,收益就去到了哪里

    这份报告点出了一个经常被忽视的问题:AI基础设施的环境影响分布极不均匀。技术的收益是全球性的,但成本往往集中在特定地区。

    在一些国家,数据中心已经占到全国电力消耗的很大一部分,给能源系统带来巨大压力。在另一些国家,数据中心扩张正在大量消耗水资源,有时甚至是在干旱条件下进行的。报告特别提到,AI硬件所需关键矿物的开采,也在资源产地引发了环境退化和社会不平等的担忧。

    电子垃圾的挑战同样严峻。到2030年,AI基础设施预计每年将产生多达250万吨电子垃圾,而其中大部分负担可能会落在处置能力有限的中低收入国家——也就是说,发达国家享受AI的便利,发展中国家承担电子垃圾的后果。

    超过90%的AI算力集中在美国和中国

    报告还揭示了一个令人不安的数字——超过90%的AI专用计算能力集中在美国和中国两个国家,同时有150多个国家缺乏重要的国内AI基础设施。这种不平衡不仅限制了这些国家的经济机会,还引发了环境正义问题:一些国家承担了环境成本,却没有分享到AI驱动的增长带来的收益。

    这跟几个月前Erin Brockovich盯上数据中心行业的故事形成了呼应。当时她的团队上线了全美数据中心分布地图,首月收到近4000份居民投诉,核心问题就是”不透明”——项目获批后才公布、居民被排除在决策之外。现在联合国大学把这个问题放在了全球尺度上重新讨论。


    联合国大学的研究人员强调,这份报告并不是反对AI本身,而是呼吁采取紧急行动,确保这项技术在地球承载限度内发展。报告提出了”负责任的AI生态系统”框架,构建原则包括透明度、设计即高效、公平性、全生命周期责任、全球合作和可持续使用。

    具体到能做些什么:各国政府需要将AI基础设施纳入能源、水和土地利用规划;企业需要设计尽量减少资源消耗的系统;普通用户也可以通过尽可能选择低影响的应用来发挥作用。AI的未来不仅取决于技术创新,还取决于当下做出的治理选择。

  • Anthropic秘密递交IPO申请,9650亿美元估值反超OpenAI

    6月1日,Anthropic悄咪咪地向美国SEC递交了S-1注册声明,正式启动IPO进程。这家公司走的是”秘密递表”路线,外界暂时看不到招股书细节,但光是这份声明本身,就已经在硅谷炸开了锅。

    要知道,就在递交IPO申请前4天——5月28日——Anthropic刚刚完成H轮融资,投后估值飙到9650亿美元,约合人民币6.5万亿元。这个数字已经正式超过了OpenAI今年3月融资后的8520亿美元估值。Anthropic从”OpenAI挑战者”变成了”全球估值最高的AI初创企业”。

    从OpenAI出走的人,做了一家比OpenAI更值钱的公司

    Anthropic的创始人是Dario Amodei和Daniela Amodei兄妹俩,两人之前都在OpenAI担任核心职位——Dario是研究副总裁,Daniela是安全政策副总裁。2021年,他们因为AI安全路线的问题跟OpenAI管理层闹翻了,干脆带着一批核心成员出走,自己搞了一家”更安全的AI公司”。

    当时ChatGPT还没出生,AI的主流叙事是”先把AGI做出来再说”。Anthropic选了一条不同的路:先把企业级用户和开发者伺候好,再做消费者市场。这个选择在2025年到2026年之间彻底兑现了——Claude Code发布后迅速抢下超过50%的AI编程市场份额,Fortune 100企业里有70%成了它的付费客户。

    Anthropic超过80%的收入来自API调用和企业级客户,这种B端深度绑定的商业模式,比OpenAI依赖C端订阅的玩法要稳得多。

    收入5个月涨了5倍,这在AI圈是什么概念

    招股书披露的数据相当夸张:Anthropic的年化经常性收入(ARR)从2025年底的90亿美元,飙到2026年4月的约450亿美元。短短4个月,收入规模涨了5倍。

    更狠的是,公司预计2026年第二季度就能首次实现盈利。在AI公司普遍”收入越高、亏得越多”的大环境下,Anthropic居然快要赚钱了。2024年它的毛利率一度低到-94%,全是GPU折旧和推理算力成本拖累的。到2025年,毛利率已经修正到约40%,公司还给自己定了一个远期目标:2027年突破70%。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(图源:Getty Images)

    谷歌和亚马逊都在重仓,这场IPO不止是Anthropic的事

    Anthropic的投资方名单读起来像硅谷名人录:谷歌计划最高投400亿美元,亚马逊已经投了130亿、这轮又追加50亿,还承诺未来十年在AWS技术上投入超1000亿美元,把Claude作为其云AI战略的核心底座。

    这轮H轮融资由阿尔蒂米特资本、德拉戈尼尔投资、格林奥克斯资本和红杉资本领投,其他投资方还包括德劭集团、黑石、简街、淡马锡等。估值在3个月内从2月G轮融资的3800亿美元暴涨154%,达到9650亿美元。

    现在美股科技板块的IPO窗口全面打开。SpaceX已于5月20日正式递交招股书,目标估值2万亿美元;OpenAI预计今年9月启动上市流程,目标市值约1万亿至1.2万亿美元。三家公司的合计潜在募资规模可能超过2400亿美元,合计估值可能超过4万亿美元。


    Anthropic选在秋季正式挂牌,给自己留了5到6个月的窗口期来应对市场波动。它递交IPO的真正意图,不只是跟OpenAI和SpaceX抢”AI第一股”的命名权,更是在向资本市场展示一套成型的财务模型:高粘性B端订单加盈利窗口提前显现加收入超高速增长。这套打法跟OpenAI依赖消费者订阅的逻辑截然不同,它的估值框架会更贴近企业级软件和SaaS的定价范式。

    当然,市场上也有质疑声。香橼资本公开表示将做空Anthropic,马斯克在社交媒体上直接开炮说”万亿估值是个笑话”。多空对峙在IPO定价阶段就已经开始了,最终市场买不买账,还要看正式招股书里披露的数字够不够有说服力。

  • 国产大模型又放大招,MiniMax M3编程能力居然超过了GPT-5.5

    最近国产大模型圈又热闹起来了,MiniMax刚发布了新一代的通用模型MiniMax M3,据说编程能力在SWE-Bench Pro基准测试里超过了GPT-5.5和Gemini 3.1 Pro,只比Claude Opus 4.7差一点点。

    自研架构,1M超长上下文

    MiniMax M3是国内首个同时具备前沿编程能力、1M超长上下文、原生多模态三项核心能力的大模型,用的是自研的MiniMax Sparse Attention(MSA)稀疏注意力架构,1M上下文下单token的计算量只有上一代的1/20,处理长文本的时候效率高了很多。

    MiniMax的团队说,M3的编程能力已经能帮开发者完成很多复杂的编程任务,比如调试代码、优化性能、写复杂的算法,能省不少时间。

    MiniMax M3模型发布
    MiniMax正式发布新一代通用模型MiniMax M3

    除了模型本身,MiniMax还推出了配套的AI编程产品MiniMax Code,能自主运行数天不用人工干预,帮开发者完成从写代码到测试的全流程。现在很多开发者都已经用上AI辅助编程了,MiniMax Code这种能自主运行的工具,说不定能把编程的效率再提一个档次。


    国产大模型加速上市

    就在发布M3的同时,MiniMax还启动了A股IPO辅导,目标是在科创板上市。其实之前智谱也已经完成了第四期上市辅导,国产大模型公司现在都在加速上市进程,说明资本对AI落地价值的认可已经回归基本面了。以后我们不仅能用到更好的国产大模型,还能通过投资分享AI发展的红利。

    • M3编程能力超过GPT-5.5,接近Claude Opus 4.7
    • 支持1M超长上下文,自研稀疏注意力架构,效率更高
    • 推出MiniMax Code,可自主运行数天,辅助编程全流程
    • 启动A股IPO辅导,国产大模型加速上市进程
    📎 原文来源:MiniMax推出MiniMax M3模型
  • 黄仁勋又发新卡了,这次英伟达要把AI芯片塞进你的电脑里

    这两天台北的Computex 2026展会正式开幕,英伟达的CEO黄仁勋又站出来搞事情了。这次他带来的不是普通的显卡,而是专为Agentic AI设计的新一代Vera Rubin芯片,据说OpenAI和Anthropic已经率先决定用了。

    不止是新芯片,还要做PC处理器

    除了Vera Rubin芯片,黄仁勋还宣布要和微软合作,推出基于台积电3nm工艺的ARM架构Windows PC芯片,名字叫RTX SPARK,计划2026年秋季就上市。这意味着英伟达正式进军个人电脑芯片市场,要打破英特尔这么多年的垄断。

    黄仁勋在演讲里说,Agentic AI的时代已经全面到来了,以后的AI不是只能聊聊天,而是能自主完成很多复杂的任务,这就需要更强大的芯片来支持。

    黄仁勋在GTC Taipei 2026大会演讲
    黄仁勋在GTC Taipei 2026大会上发表主题演讲

    其实这几年英伟达在AI芯片领域的优势已经很明显了,这次发布的Vera Rubin芯片专门针对Agentic AI做了优化,处理多任务的能力比之前的芯片强了不少。而RTX SPARK PC芯片更是直接杀入英特尔的腹地,以后我们买电脑的时候,除了英特尔和AMD的处理器,可能还要多一个英伟达的选项了。


    国产芯片也在发力

    就在英伟达发布新芯片的同时,国内的算力芯片也在进步。深圳河套学院最近用昇腾910C集群,完成了1.6万亿参数的DeepSeek-V4-Pro全流程训练,这说明国产芯片已经能支撑世界级的超大参数模型训练了。以后国内做AI训练和推理,用国产芯片也能有不错的效果,不用完全依赖国外的产品。

    • Vera Rubin芯片专为Agentic AI设计,性能大幅提升
    • RTX SPARK PC芯片采用台积电3nm工艺,2026年秋季上市
    • 国产昇腾910C集群已完成万亿参数模型训练,国产算力进步明显
  • Ollama:170k Stars!本地LLM运行工具,让AI模型在本地飞速运行

    配图

    Ollama Logo
    Ollama – 本地LLM运行工具

    项目简介

    Ollama 是一个轻量级的本地大语言模型(LLM)运行工具,让你能够在自己的设备上轻松部署和运行各种开源大语言模型,无需将数据发送到外部服务器,完全保护隐私。

    截至2026年,Ollama 已在 GitHub 获得 17万+ Stars,成为最广泛使用的本地LLM运行时,Docker Hub下载量超过1亿次。

    安装要求和过程

    环境要求

    • 操作系统:Linux(Ubuntu 20.04+)、macOS 11+、Windows 10(需WSL2)
    • 内存:8GB以上(运行7B模型),16GB以上(运行13B模型),32GB以上(运行33B+模型)
    • 存储:至少10GB可用空间(用于存放模型文件)
    • GPU:可选,NVIDIA GPU(CUDA)、AMD GPU(ROCm)或苹果M系列芯片可加速推理

    快速安装步骤

    macOS/Linux 一键安装:

    # Linux/macOS
    curl -fsSL https://ollama.com/install.sh | sh
    
    # macOS 也可用 Homebrew
    brew install ollama

    Windows 安装:

    1. 访问 https://ollama.com/download 下载 Windows 安装包
    2. 运行 OllamaSetup.exe,按照提示完成安装
    3. 打开命令提示符或PowerShell,输入 ollama --version 验证安装

    Docker 安装(推荐服务器环境):

    docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

    核心功能

    1. 一键运行本地模型:支持一键拉取和运行100+开源大语言模型,包括 Llama 3.3、Mistral、Qwen、Phi、DeepSeek R1 等热门模型。
    2. OpenAI API 兼容:原生提供兼容 OpenAI API 格式的 REST API(默认端口11434),可直接对接现有基于 OpenAI 生态开发的应用和工具。
    3. 智能硬件加速:自动适配 NVIDIA(CUDA)、AMD(ROCm)、苹果 M 系列芯片(Metal)的 GPU 加速,大幅提升推理速度。
    4. 模型自定义配置:支持通过 Modelfile 自定义模型参数(温度、上下文长度、系统提示词等),轻松创建专属模型。
    5. 多模态支持:最新版本支持视觉模型(如 Llama 3.2 Vision),可处理图像输入,实现图文混合推理。

    典型使用场景

    场景一:开发者本地 AI 应用开发

    作为开发者,你可以使用 Ollama 在本地运行 LLM,用于:

    • 开发和测试 AI 应用,无需支付 API 费用
    • 对接 Open-WebUI 等前端界面,搭建私有化 AI 聊天助手
    • 通过 API 集成到自己的应用中,实现本地智能推理

    示例:用 Ollama 运行 Llama 3.3 8B 模型,通过 OpenAI 兼容 API 为本地应用添加 AI 能力。

    场景二:企业私有化部署

    对于企业用户,Ollama 提供了:

    • 数据隐私保护:所有推理过程在本地完成,敏感数据无需上传云端
    • 零 API 成本:无需为每次 API 调用付费,适合高频调用场景
    • 离线可用:模型下载后,无需联网即可使用,适合内网环境

    推荐理由

    我个人从2025年开始使用 Ollama,它已经成为我本地 AI 开发的标配工具。推荐理由如下:

    1. 极简体验:一条命令就能安装,一条命令就能运行模型,对新手极其友好。
    2. 生态丰富:支持对接 Open-WebUI、Continue(VS Code 插件)、LangChain 等50+主流工具,可玩性极高。
    3. 性能优秀:支持 4-bit/8-bit 量化,即使在中端笔记本上也能流畅运行 7B 参数的模型。
    4. 活跃社区:GitHub 上40000+社区集成,几乎任何你能想到的工作流,都有人已经做好了集成方案。

    如果你想要一个简单、快速、隐私安全的本地 LLM 运行方案,Ollama 绝对是首选。

    下载地址