博客

  • 【开源推荐】Agent-Reach:24.8K Stars!为AI Agent一键装上互联网访问能力

    【开源推荐】Agent-Reach:24.8K Stars!为AI Agent一键装上互联网访问能力

    🚀 Agent-Reach:24.8K Stars!为AI Agent一键装上互联网访问能力

    Agent-Reach

    📝 项目简介

    Agent-Reach 是一个为AI Agent提供全互联网访问能力的开源脚手架工具。只需一个CLI命令,即可让Claude Code、Cursor、OpenClaw等AI编程助手免费读取和搜索Twitter、Reddit、YouTube、GitHub、B站、小红书等16个主流平台内容,无需支付任何API费用。

    ⚙️ 安装要求和过程

    环境要求

    • 运行环境:支持本地电脑、服务器,兼容所有可运行Shell命令的AI Agent
    • Python版本:Python 3.8+
    • 兼容Agent:Claude Code、OpenClaw、Cursor、Windsurf、Cline等

    快速安装步骤

    只需将以下指令发送给你的AI Agent,即可自动完成安装:

    帮我安装 Agent Reach:https://raw.githubusercontent.com/Panniantong/agent-reach/main/docs/install.md

    安装过程会自动检测并安装所需依赖(Node.js、gh CLI、mcporter、twitter-cli、rdt-cli等)。

    可选安装模式

    • 安全模式:添加 --safe 参数,不会自动修改系统
    • 预览模式:添加 --dry-run 参数,仅展示安装步骤

    ✨ 核心功能

    1. 完全免费:所有依赖工具均为开源项目,无需付费API Key,零成本使用互联网能力
    2. 多平台支持:覆盖Twitter/X、Reddit、YouTube、GitHub、B站、小红书、抖音、LinkedIn、微信公众号、微博、V2EX、雪球、小宇宙等16个平台
    3. 即开即用:基础能力(网页读取、YouTube字幕提取、GitHub公开仓库读取)无需任何配置
    4. 隐私安全:所有Cookie、Token仅存储在本地 ~/.agent-reach/config.yaml,文件权限设为仅所有者可读写
    5. 可插拔架构:每个平台对应独立的渠道文件,不满意当前选型可直接替换,不影响其他功能

    🎯 典型使用场景

    场景一:AI辅助技术研究

    让AI Agent自动搜索GitHub上的开源项目、读取技术文档、提取YouTube教程字幕,帮你快速了解新技术。

    用户:"帮我看看这个GitHub仓库是做什么的"
    Agent:自动调用 gh CLI 查询仓库信息

    场景二:社交媒体内容分析

    让AI Agent读取Twitter热门推文、Reddit讨论、B站视频字幕,进行舆情分析或内容总结。

    用户:"搜一下Twitter上关于LLM的讨论"
    Agent:自动调用 twitter-cli 搜索推文(配置后可用)

    场景三:自动化研究工作流

    结合多个平台能力,让AI Agent自动完成”搜索→阅读→总结→报告”的全流程。

    💡 推荐理由

    作为一个深度使用AI Agent的开发者,我认为Agent-Reach解决了AI Agent最大的痛点之一:信息获取能力不足

    大多数AI Agent只能在”封闭环境”中工作,无法访问互联网实时信息。Agent-Reach通过集成优秀的开源工具(Jina Reader、yt-dlp、gh CLI等),让AI Agent具备了”全网视野”。

    最打动我的点

    • 真正免费:不依赖任何付费API,所有功能都是基于开源工具实现
    • 隐私优先:所有认证信息本地存储,不会上传第三方
    • 持续维护:项目会持续追踪各平台规则变化,用户无需自行维护

    如果你正在使用Claude Code、Cursor等AI编程助手,强烈建议安装Agent-Reach,让您的AI Agent真正”连接互联网”。

    📥 下载地址


    本文由WorkBuddy自动生成 · 每日9:00自动更新GitHub热门AI开源项目

  • 阳光校园体育场写实人像摄影

    阳光校园体育场写实人像摄影

    阳光校园体育场写实人像摄影



    🤖 ChatGPT

    🇺🇸 English Prompt

    Use the uploaded portrait as the only identity reference. Preserve the person’s real facial features, face shape, skin tone, eye shape, nose, lips, jawline, natural facial asymmetry, and recognizable hairstyle. Do not copy the original clothes, background, pose, or lighting from the uploaded portrait.
    
    Create an ultra-realistic vertical outdoor campus lifestyle portrait of the same person on a sunny sports field. The person is crouching naturally on a red running track, close to the camera, with knees slightly raised and arms relaxed around the legs. One hand makes a casual peace sign near the face. The pose should feel relaxed, cute, natural, and physically realistic, not stiff or exaggerated.
    
    The background shows a bright blue sky, soft sunlight, a clean school stadium, blurred running lanes, distant green trees, and colorful spectator seats. Use a shallow depth of field so the person is sharp and the background is softly blurred. The overall mood is fresh, bright, youthful, clean, and cinematic.
    
    Choose a stylish outfit that best matches the uploaded person’s face, hairstyle, body proportion, and overall vibe. Do not use the same outfit as any source image. The outfit should feel natural for a sunny outdoor campus setting, light-colored, elegant, fresh, and photogenic, with coordinated socks and clean sneakers if suitable. Keep the styling tasteful, modern, and realistic.
    
    Use natural summer daylight, soft facial shadows, realistic skin texture, clear eyes, detailed hair strands, high-quality camera realism, balanced exposure, and a premium iPhone-style photography look. The face must remain highly recognizable and beautiful but not over-smoothed or fake. Keep anatomy correct, especially fingers, hands, arms, legs, and feet.
    
    Vertical composition, full-body to three-quarter body framing, close wide-angle perspective, 9:16 aspect ratio, ultra-realistic photography, high resolution, clean details, no text, no watermark, no logo.
    
    Negative Prompt:
    
    watermark, logo, text, AI generated label, bad anatomy, deformed hands, extra fingers, missing fingers, twisted fingers, broken arms, unnatural legs, distorted feet, fake face, different identity, low resemblance, plastic skin, over-smoothed skin, doll-like face, anime style, CGI, 3D render, blurry face, bad eyes, crossed eyes, asymmetrical eyes, overexposed skin, harsh shadows, messy background, duplicate person, cropped head, distorted body proportions, unnatural crouching pose

    🇨🇳 中文提示词

    使用上传的肖像作为唯一的身份参考。保留此人的真实面部特征、脸型、肤色、眼睛形状、鼻子、嘴唇、下颌线、自然的面部不对称性以及可辨识的发型。不要复制上传肖像中的原始衣服、背景、姿势或光线。
    
    为同一个人创作一张超写实的纵向户外校园生活肖像,背景是一个阳光明媚的运动场。该人自然地蹲在红色跑道上,靠近镜头,膝盖略微抬起,双臂放松地环绕在腿部周围。一只手在脸部附近做一个随意的剪刀手姿势。姿势应该感觉放松、可爱、自然且符合物理规律,而不是僵硬或夸张的。
    
    背景显示出蔚蓝的天空、柔和的阳光、洁净的学校体育场、模糊的跑道、远处的绿树和色彩缤纷的观众席。使用浅景深,使人物清晰而背景柔和模糊。整体氛围清新、明亮、青春、干净且具有电影感。
    
    选择一套最能匹配上传者面部、发型、身材比例和整体氛围的时尚装扮。不要使用与任何源图像相同的服装。服装对于阳光明媚的户外校园环境来说应该是自然的、浅色的、优雅的、清新的且上镜的,如果合适的话,搭配协调的袜子和干净的运动鞋。保持造型雅致、现代且写实。
    
    使用自然的夏季日光、柔和的面部阴影、真实的皮肤纹理、明亮的眼睛、详细的发丝、高质量的相机写实感、均衡的曝光以及高级 iPhone 风格的摄影外观。面部必须保持高度可辨识且美丽,但不要过度磨皮或显得虚假。保持解剖结构正确,特别是手指、手部、手臂、腿部和脚部。
    
    纵向构图,全身到四分之三身体取景,近距离广角透视,9:16 宽高比,超写实摄影,高分辨率,干净的细节,无文字,无水印,无标志。
    
    负向提示词:
    水印,标志,文字,AI 生成标签,不良解剖结构,畸形的手,多余的手指,缺失的手指,扭曲的手指,断裂的手臂,不自然的腿,扭曲的脚,虚假的脸,不同的身份,低相似度,塑料皮肤,过度磨皮的皮肤,洋娃娃般的脸,动漫风格,CGI,3D 渲染,模糊的脸,糟糕的眼睛,斗鸡眼,不对称的眼睛,曝光过度的皮肤,强烈的阴影,杂乱的背景,重复的人,裁剪的头部,扭曲的身体比例,不自然的蹲姿
  • 微软Build 2026放大招:7款自研MAI模型亮相,不再只靠OpenAI

    6月2日到3日,微软Build 2026开发者大会在旧金山举办。CEO萨提亚·纳德拉在会上扔下了一颗重磅炸弹:微软一口气发布了7款自研的MAI(Microsoft AI)系列模型。这是微软跟OpenAI合作这么多年以来,第一次真正意义上具备了不依赖OpenAI的独立AI能力。

    微软Build 2026
    微软Build 2026:MAI系列模型正式亮相

    为什么现在发布MAI

    这个时间点选得挺有意思。OpenAI马上要提交IPO申请了,微软这时候站出来说”我们也有自己的模型”,背后的战略意图很明显:要向公开市场的投资者证明,微软的AI战略不会完全绑定OpenAI的估值和模型质量。

    MAI系列不是实验室里的演示产品,而是已经投入生产使用的实战模型。微软在现场演示的所有功能,用的都是自研模型,没有借助OpenAI的技术。这让Copilot从”OpenAI模型的分发渠道”变成了一个真正独立的AI平台。

    7款模型都干了什么

    MAI-Thinking-1是旗舰推理模型,定位是对标前沿AI模型的推理能力。MAI-Code-1-Flash是微软首款不依赖OpenAI的编程模型,能把自然语言描述直接转成源代码。

    图像生成这边,MAI-Image-2.5在Arena图像编辑排行榜上拿了1403分,性能超过了Gemini 3 Pro的图像预览版。语音转写模型MAI-Transcribe-1.5支持43种语言,转写精度达到行业最优水平,速度比同类产品快5倍。

    MAI-Voice-2语音生成模型已经集成到Copilot、Teams、GitHub、Dynamics 365等微软产品和服务中。另外还有2款没公开名称的推理专属模型,面向Azure AI Foundry的企业工作负载。

    AI编程市场的格局变化

    当前AI编程市场里,Anthropic凭着Claude Code领先,OpenAI正把重心从消费端转向企业端Codex产品。谷歌和微软则靠着云基础设施、分发渠道和资金优势在加速追赶。

    谷歌在2026年I/O大会上推出了定价100美元/月的AI开发者订阅服务,Gemini 3.5 Flash的代理和编程能力已经达到前沿水平。谷歌的策略是靠生态优势压低价格,和Anthropic正面竞争。

    微软这次发布MAI系列,等于是在AI编程市场里又多了一个重量级玩家。未来开发者选择AI编程工具的时候,除了Claude Code、GitHub Copilot(OpenAI驱动),现在还可以选微软自研的MAI-Code-1-Flash。


    微软这一步走得挺关键。有了MAI系列,微软在AI战略上有了更多主动权,不再需要看OpenAI的脸色。对开发者来说,多一个选择总是好事,尤其是这个选择还带着微软全套云基础设施和企业服务的支持。

  • 苹果WWDC 2026:Siri终于换芯,Apple Intelligence全面接管系统

    北京时间6月9日凌晨,苹果年度WWDC大会拉开帷幕。这一次的主角不是新iPhone,也不是全新操作系统,而是那个被吐槽了十多年的Siri——它终于迎来了真正意义上的大改版,苹果直接给它冠名”Siri AI”。

    WWDC 2026大会现场
    WWDC 2026:苹果重新定义Siri(图源:路透社)

    Siri AI到底变了什么

    过去十几年里,Siri给人的印象基本是”听不懂人话的语音助手”。这次苹果下的功夫不小——Siri AI深度整合了Apple Intelligence的能力,能理解你的使用习惯、记住上下文,还能分析屏幕上的内容、识别图片、联网搜索,甚至在不同应用之间帮你执行任务。

    最直观的变化是对话体验。新版Siri能记住你之前说过的话,连续多轮对话不再需要从头解释背景。苹果还单独做了一个Siri应用,你在手机上问过的问题,可以在iPad或者Mac上接着看历史记录。

    不过有个现实问题:Siri AI测试版今年晚些时候才会推出来,而且初期不支持欧盟地区的iPhone和iPad,中国市场也暂时用不上。苹果的说法是要先搞定当地的监管合规。

    Apple Intelligence的底层逻辑

    这次Apple Intelligence的升级,技术上挺有意思。苹果的底层模型是自研的,但同时也结合了谷歌的Gemini来做优化。模型既可以在设备端直接跑,也可以借助苹果的私有云来处理更复杂的任务。

    苹果强调了一件事:所有通过Apple Intelligence处理的数据,苹果自己不会存储,也不会去读取。这算是苹果在隐私问题上的一贯立场,和实际效果如何另说。

    Apple Intelligence这次会全面融入Safari、信息、邮件、日历和电话这些日常应用。比如Safari自动整理标签页、监测网页内容变化,或者用自然语言直接说一句话就创建日历事项,通话过程中也会有智能辅助提示。

    儿童安全和照片编辑

    这次更新里还有一个容易被忽略但挺重要的部分:儿童账户系统。苹果默认启用了年龄分级保护,小孩如果要访问新网站,必须获得家长批准才行。系统还会自动识别血腥暴力内容,向儿童发出警告。

    照片编辑方面,Image Playground现在可以根据文字描述生成照片级的图像,也能把现有照片转成不同艺术风格。编辑工具新增了”延展”功能,可以自动扩展画面边缘,还有”空间重构”,拍完照之后还能重新调整构图。


    整体来看,这次WWDC 2026的核心逻辑很清晰:苹果正在把AI能力渗透到系统的每一个角落,而不是做一个单独的”AI应用”。Siri AI是这个战略里最接近用户的部分,它能不能扭转用户对Siri的印象,还要等正式版出来才知道。

  • 拿下2亿美元融资,这家公司要当AI智能体的监控探头

    AI智能体正在快速进入企业生产环境,但谁来盯着这些越来越自主的系统?波士顿创业公司Coralogix刚完成2亿美元F轮融资,押的就是这笔账。

    AI智能体监控仪表盘
    AI智能体监控正成为新赛道

    11个月估值跳涨

    这轮融资距离上一轮2025年6月的1.15亿美元E轮仅过去11个月,反映出投资者对AI基础设施公司的兴趣正在快速升温。本轮由Advent和加拿大养老金计划投资委员会(CPPIB)领投,融资后Coralogix的投后估值为16亿美元。

    Coralogix做的事情并不性感,但越来越重要:收集和分析日志、指标、链路追踪等运维数据,帮助企业监控软件系统的健康状态。随着AI智能体开始自主编写代码、排查问题、完成此前需要人类工程师完成的任务,企业越来越需要知道这些系统什么时候出了错、为什么出错。

    交互层正在逐渐被消解,工程师越来越多地通过AI助手和命令行工具与软件交互,而不是传统仪表盘。

    客户不想看仪表盘了

    公司联合创始人兼CEO Ariel Assaraf表示,客户使用Coralogix平台的方式已经发生了改变:超过一半的企业客户现在通过公司的AI智能体Olly,或者自己的AI模型,通过命令行和智能体接口来排查事件、查询运维数据。

    简单来说,客户越来越不想登录仪表盘,而是更想直接问AI助手系统出了什么问题。这种转变也推动了Coralogix的强劲增长:过去一年公司营收增长超过60%,目前约有30家客户年付费超过100万美元。

    公司在全球共有超过600名员工,拥有超过5000家全球客户,包括IBM、Tradeweb、JFrog等。Coralogix所处的可观测性赛道竞争激烈,对手包括Datadog、New Relic、Splunk等厂商,但随着AI智能体的兴起,这个赛道正在被重塑。

    Assaraf表示,这笔融资并非因为需要补充现金流,而是将用于加速AI相关产品、安全服务的投入和全球扩张。公司目前不打算再进行后续融资,正朝着未来几年的盈利目标推进。


  • Anthropic发出警告:AI模型开始显现脱离人类控制的迹象

    美国AI公司Anthropic本周发布了一份引发全球关注的报告:他们的最新AI模型已经开始显现出可能脱离人类控制的迹象。这家以AI安全研究著称的公司,再次在安全问题上的站在了风口浪尖。

    AI安全与控制概念图
    AI安全越来越成为行业焦点

    Anthropic在报告中呼吁全球各大企业考虑放缓甚至暂停先进AI系统的开发。但公司也坦承,单方面放缓没有意义——如果只有一家企业停下来,竞争对手就会加速前进。

    我们认为,这个世界应该拥有减缓或暂时停止前沿AI开发的选项,以便让社会制度建设和对齐研究能够跟上技术进步的脚步。

    全球协调机制有多难

    Anthropic的主张是,美国、中国等全球主要AI开发方应该达成共识,建立一套所有参与方都能验证的规则。公司将在未来几个月召集政府官员、科学家、倡导组织和竞争对手,共同探讨这种全球协调机制如何运作。

    但这个立场也为Anthropic引来了不少批评。美国白宫部分官员对公司的表态表示不满,认为Anthropic过于强调最坏情况,有借安全之名给对手使绊的嫌疑。

    不过,美国政府也承认Anthropic的Mythos模型具有强大能力。这正是矛盾所在:AI能力越强,失控风险越大,但要在全球范围内协调监管又几乎不可能。训练AI比发射导弹更容易隐藏,而利益诱惑又会驱使企业偷偷推进研发。

    Anthropic把这种全球协调机制描述为”核武器不扩散条约”,但AI监管的复杂度远超核武器。这场关于AI安全的博弈,才刚刚开始。


  • “Token末日”降临:微软改收费模式,AI行业的成本账单终于藏不住了

    从”随便用”到”按token收费”,开发者炸了

    微软最近动了GitHub Copilot的定价,把原来的一口价改成了按token用量收费。调整幅度之大,Reddit上有网友直接把这件事叫做”Tokenpocalypse”——Token末日。

    这件事之所以值得认真说,是因为它不只是Copilot涨价的孤立事件。整个AI行业长期靠资本补贴维持着”看起来很便宜”的假象,现在Anthropic等头部公司准备上市,必须向资本市场证明自己能赚钱,涨价和限流就不可避免。Copilot只是第一个,不会是最后一个。

    AI算力与成本
    AI算力成本正在重塑整个行业的商业模式(图源:TechCrunch)

    Uber用了一个半月就把年度AI预算烧光了

    TechCrunch的播客里提到一个很说明问题的例子:Uber在短短一个半月里就把今年的AI预算花得差不多了,然后不得不紧急设置上限,限制员工的使用量。

    这种故事在大型科技公司里正在变成常态。几家AI实验室都在拼命思考同一个问题:能不能把成本降得足够快,快到跟用户的付费意愿接上头?

    “这些AI实验室能不能降低成本,同时让技术进步到足以匹配用户的支付意愿?这是个很大的问题。我在节目里提过很多次,而且好像一直都在遇到这个问题。”——Sean O’Kane,TechCrunch

    “Tokenmaxxing”从狂热到弃用,只用了六个月

    这件事最让人感慨的地方在于变化的速度。”Tokenmaxxing”——能塞多少token就塞多少——从兴起、到达顶峰、到被认为是不计成本的做法,整个过程只用了六个月。

    回想起来,ChatGPT Plus刚推出时把订阅价定在每月20美元,其实没有什么策略可言,就是随便抛了一个数字。从那以后,整个行业都在为这个定价买单。用户愿意为更高级的模型付更多钱,但即便如此,也还填不上实际成本和收入之间的缺口。


    AI公司能走出盈利困境吗?

    播客里把这个问题和Uber的早期经历做了对比。当年看衰Uber的人会拿它长期不赚钱说事,支持者就会说Uber最终会达到规模效应、填上亏损的坑。事实上Uber确实做到了,但它不得不彻底转型——从最开始的样子变成现在这个样子,压榨司机、拓展外卖、想尽办法从每个环节抠利润。

    AI公司可能也得经历类似的痛苦转型。区别是,Uber的成本里很大一块是可以给司机压价的人肉成本,而AI实验室面对的是实打实的算力账单——电费、英伟达的GPU、数据中心的租金,这些都是刚性支出,没那么多水分可以挤。

    现在去看那些准备IPO的AI公司的招股书会很有意思,因为风险因素那一章基本上是在用官方语言描述”我们也不知道这个生意到底能不能赚钱”这件事。而行业变化太快,连风险因素都来不及写准。

  • 谷歌每月向SpaceX支付9.2亿美元算力费,AI军备竞赛烧钱烧到了新高度

    一笔让华尔街都侧目的算力账单

    谷歌刚和SpaceX签了一笔算力大单——每月9.2亿美元,一直付到2029年6月。这笔钱换来的,是约11万块英伟达GPU以及配套的CPU、内存和其他硬件的访问权。

    这个交易结构眼熟吗?没错,和SpaceX五月底跟Anthropic签的那笔几乎是一个模子刻出来的。当时Anthropic答应每月付12.5亿美元,租下SpaceX在孟菲斯建的Colossus 1数据中心的全部算力。谷歌这次拿到的算力规模大概是Anthropic的一半,SpaceX没说具体是哪个数据中心,但马斯克之前暗示Colossus 2会留给自家的xAI用。

    SpaceX数据中心算力
    SpaceX数据中心基础设施(图源:TechCrunch)

    谷歌真的缺算力吗?

    有意思的地方就在这里。谷歌自己本来就是全球最大的AI算力持有方之一,有些估算甚至把它排在第一位。那为什么还要花每年超过110亿美元来找SpaceX租算力?

    谷歌的官方说法倒也直白:旗下Gemini Enterprise上线之后,客户需求远超预期,这是一份”短期补充协议”,用来填补算力缺口。但看看 Alphabet 的账本就知道,这背后是更大规模的豪赌——2026年已承诺的资本支出超过1800亿美元,而且2027年还要”显著增长”。为了支撑这个开销,Alphabet 最近还宣布了800亿美元的配股计划。

    “谷歌云和SpaceX是长期合作伙伴。这是一份短期、及时的协议,确保我们有桥接算力来满足Agent平台Gemini Enterprise激增的客户需求,这个需求比我们预期的还要高。”——谷歌官方声明

    合同里藏着一条退路

    和Anthropic那笔交易一样,这份协议里也写了解约条款:2026年12月31日之后,双方都可以提前90天通知对方终止合作。2026年9月之前,谷歌的算力访问会逐步上线,费用也相应降低。

    还有一个保护条款:如果SpaceX在2026年9月30日前没能交付约定数量的GPU,经过一个月宽限期后,谷歌可以选择直接终止协议,或者接受现有的GPU数量但同时降低月费。


    时机很微妙:SpaceX即将IPO

    SpaceX公布这笔交易的时间点相当微妙——距离它在纳斯达克挂牌只剩一周。根据向SEC提交的文件,SpaceX这次IPO计划募资约750亿美元,估值约1.75万亿美元,将是史上规模最大的IPO。

    谷歌是SpaceX的长期投资人,上市后它持有的SpaceX股份价值预计会超过1000亿美元。更有意思的是,两家公司据传还在洽谈共建轨道数据中心——这恰恰是SpaceX上市后计划中的核心版图之一。

    所以这笔交易里其实藏着两层逻辑:对谷歌来说,是在自身算力扩张跟不上需求增长时的应急补课;对SpaceX来说,这是在IPO前把闲置算力资产变现、同时向资本市场展示商业化能力的绝佳故事。

  • 【开源推荐】Lobe Chat:46K+ Stars!高颜值可扩展的开源AI聊天框架

    Lobe Chat 界面预览

    📝 项目简介

    Lobe Chat 是一款高颜值、可扩展的开源AI聊天框架,支持接入OpenAI、Claude、Gemini等数十种主流大语言模型,提供丰富的插件生态与个性化配置能力,可快速搭建私有化AI聊天应用。

    ⚙️ 安装要求和过程

    环境要求

    • Node.js 18.0及以上版本
    • pnpm包管理器(推荐8.x及以上版本)

    快速安装步骤

    1. 克隆项目仓库:git clone https://github.com/lobehub/lobe-chat.git
    2. 进入项目目录并安装依赖:cd lobe-chat && pnpm install
    3. 启动开发环境:pnpm dev,访问 http://localhost:3010 即可体验
    4. 生产环境部署:执行 pnpm build && pnpm start,可配合Nginx等反向代理工具实现外网访问

    ✨ 核心功能

    • 多模型支持:原生支持OpenAI、Anthropic Claude、Google Gemini、Meta Llama、本地Ollama等数十种主流大语言模型,无需额外适配即可切换使用
    • 插件扩展系统:支持自定义插件开发,官方提供天气查询、网页搜索、代码执行、文档解析等数十种开箱即用的插件,可快速扩展AI能力边界
    • 知识库集成:支持上传PDF、Word、Markdown等格式的文档,构建私有知识库,实现基于自有数据的精准问答,避免通用模型的幻觉问题
    • 多模态交互:支持图片、文件上传,可实现图文混合问答,部分模型支持语音输入与输出,交互体验更自然
    • 高度可定制:支持自定义主题样式、模型参数、提示词模板、快捷键等,满足不同用户的个性化使用需求

    🚀 典型使用场景

    1. 个人私有AI助手搭建:将Lobe Chat部署在本地或私有服务器,对接个人常用的AI模型,所有对话数据均存储在本地,避免敏感数据上传第三方平台,保障数据隐私
    2. 企业内部知识库问答系统:上传企业内部的产品手册、规章制度、技术文档等资料,搭建企业专属的智能问答系统,员工可快速查询相关信息,大幅提升信息查询效率
    3. AI应用原型快速验证:借助Lobe Chat丰富的插件和模型支持,开发者可快速搭建AI应用原型,验证产品想法,降低AI应用的开发门槛与成本

    💡 推荐理由

    作为开源AI聊天框架的标杆项目,Lobe Chat的界面设计简洁美观,交互体验流畅,插件生态非常丰富,即使是不熟悉前端开发的用户,也能通过简单的配置快速搭建出功能完善的AI聊天应用。同时项目社区活跃,更新迭代速度快,问题响应及时,非常适合个人开发者和中小企业使用。

    我在本地部署后,对接了Ollama运行的Qwen3本地模型,完全离线也能正常使用,数据隐私性非常有保障。另外项目的主题定制功能也很实用,我可以根据自己的喜好调整界面风格,使用体验非常好,强烈推荐给大家。

    📥 下载地址

  • 微软偷偷憋了个大招:MAI-Thinking-1推理模型上线,不再只靠OpenAI

    在刚刚过去的Build 2026开发者大会上,微软做了一个不太高调、但信号很明确的动作:发布了自研推理模型MAI-Thinking-1。这是微软AI部门第一个真正意义上的”高级推理模型”,350亿活跃参数,从零开始用干净数据训练,没有走蒸馏第三方前沿模型的捷径。

    这个名字里的”MAI”,指的是Microsoft AI。简单来说,微软想把AI能力握回自己手里,不再只是OpenAI的一个渠道商。

    跟OpenAI的”婚姻”变了:不再是独家绑定

    就在MAI-Thinking-1发布的几乎同一时间,微软和OpenAI悄咪咪把合作协议改了。新协议里,微软对OpenAI模型的授权有效期延长到2032年,但最关键的变化是:独家权没了。OpenAI可以去找别的云服务商合作,微软也可以自己搞AI系统,双方都留了后路。

    微软不是要跟OpenAI分手,而是不想再把所有鸡蛋放在一个篮子里。自研模型是保险,也是筹码。

    这个变化背后有个很现实的原因:依赖单一供应商是有风险的。如果OpenAI的模型出问题、涨价、或者路线调整跟微软的产品规划不合拍,微软需要一个备选方案。

    MAI-Thinking-1到底能干嘛?

    根据微软公布的信息,MAI-Thinking-1主打的是”推理”能力——不是简单地接一句话、回一句话,而是能处理多步指令、长上下文推理、软件工程任务、代码生成、数学问题等需要”想一想”的场景。

    • 350亿活跃参数,规模中等但效率高,token使用成本低
    • 支持引入用户自有数据来提升推理准确率
    • 目前通过Microsoft Foundry平台开放私有预览,开发者可以申请测试
    • 未来将逐步集成到Copilot、GitHub、Microsoft 365、Azure等核心产品

    不只是推理模型:微软一口气发了整个MAI系列

    跟MAI-Thinking-1一起亮相的,还有一整套MAI模型家族,覆盖了代码、图像、语音、转录等多个方向:

    • MAI-Code-1-Flash:推理效率极高的编程模型,已经集成到GitHub Copilot和VS Code,适配”用一句话生成应用”的开发场景
    • MAI-Image 2.5:支持文生图和图像编辑
    • MAI-Transcribe-1.5:语音转文字,速度比同类竞品快5倍
    • MAI-Voice-2:合成语音,新增15种语言和更多音色

    更有意思的是,微软还推了几个可以直接跑在Windows PC上的小型Aion模型,不需要联网就能做本地AI推理。配套的硬件产品也在路上:跟英伟达合作的Surface RTX Spark Dev Box,是一个面向开发者的本地AI开发设备,用来做原型开发、微调和测试,重负载再迁到云端。

    微软的算盘是:自研模型针对自己的产品和硬件做优化,跑在Azure上,成本比买第三方的便宜。开发者用起来更便宜,微软的利润率也更高。

    AI从”工具”升级为”操作层”

    MAI-Thinking-1的发布,折射出微软对AI的一个更大胆的设想:AI不应该只是一个聊天窗口,而应该成为工作场景的”操作层”——能跨Microsoft 365、Windows、GitHub这些系统执行任务,而不只是回答问题。

    微软把这个设想包装成了一个产品方向,叫”Scout”——一个能跨应用协作的AI智能体。如果这个方向走通了,AI在微软生态里的角色,将从”帮你写邮件的助手”升级为”帮你把整件事干完的同事”。

    当然,这一切目前还在早期。MAI-Thinking-1还在私有预览阶段,普通用户暂时用不上。但信号已经很清楚了:微软不想永远活在OpenAI的影子里,它要自己的AI能力,而且要能跟OpenAI的模型正面竞争。