标签: AI

  • OpenClaw – 跨平台个人AI助手,支持30+通讯平台集成

    OpenClaw – 跨平台个人AI助手,支持30+通讯平台集成

    ⭐ GitHub Stars: 380,430
    🍴 Forks: 79,687
    📅 最后更新: 2026-06-25
    💻 主要语言: TypeScript

    📝 项目简介

    OpenClaw 是一款可本地部署的跨平台个人AI助手,支持在任何操作系统和通讯平台上运行,采用”龙虾之道”🦞的设计理念,让用户完全掌控自己的数据和隐私。

    💻 安装要求和过程

    环境要求

    • Node.js: 24版本(推荐)或 22.19+
    • 包管理器: npm 或 pnpm
    • 操作系统: macOS, Linux, Windows

    快速安装步骤

    方式一:全局安装(推荐)

    # 使用npm全局安装最新版
    npm install -g openclaw@latest
    
    # 或使用pnpm安装
    pnpm add -g openclaw@latest
    
    # 运行引导式安装,同时安装Gateway守护进程(保证服务常驻)
    openclaw onboard --install-daemon
    

    引导式安装会一步步帮你配置Gateway、工作区、通讯渠道和技能,支持macOS、Linux、Windows系统。

    方式二:Windows原生应用

    Windows用户可以下载原生的 Windows Hub 应用完成配置。

    方式三:源码开发安装

    # 克隆仓库
    git clone https://github.com/openclaw/openclaw.git
    cd openclaw
    
    # 安装依赖(注意:源码部署必须使用pnpm)
    pnpm install
    
    # 初始化本地配置和工作区
    pnpm openclaw setup
    
    # 启动开发模式,源码修改后自动重载
    pnpm gateway:watch
    

    ✨ 核心功能

    1. 本地优先Gateway架构

    统一管理会话、通讯渠道、工具和事件的控制平面,所有数据本地存储,保障隐私安全。

    2. 多渠道支持(30+平台)

    覆盖WhatsApp、Telegram、Slack、Discord、微信、QQ、飞书等主流通讯平台,在常用聊天工具中直接使用AI助手。

    3. 多智能体路由

    可将不同渠道/账号/联系人的请求路由到独立的智能体,实现隔离的工作区和会话,适合多角色协作场景。

    4. 语音交互与实时Canvas

    支持macOS/iOS语音唤醒、Android端连续语音对话,智能体可驱动可视化工作区(Canvas面板),支持A2UI交互。

    5. 技能扩展体系

    支持通过ClawHub安装、管理自定义技能,内置/管理/工作区技能开箱即用,快速扩展AI助手能力边界。

    🎯 典型使用场景

    场景一:个人本地AI助手

    在本地设备部署OpenClaw,无需上传数据到第三方服务,保障数据隐私。通过WhatsApp、Telegram等常用通讯工具随时调用AI助手,实现:

    • 快速查询信息、总结文档
    • 设置定时提醒和任务
    • 管理个人日程和待办事项
    • 本地文件处理和代码辅助

    场景二:开发者工作流集成

    将OpenClaw集成到日常开发工作流中,通过命令行或通讯工具快速完成:

    • 代码审查和bug分析
    • 自动化测试和部署
    • 文档生成和代码注释
    • 项目管理和进度跟踪
    # 向助手发送请求,设置高思考等级
    openclaw agent --message "分析这个bug的根本原因" --thinking high
    
    # 发送消息到指定联系人
    openclaw message send --target +1234567890 --message "代码已修复,请审查"
    

    💡 推荐理由

    为什么推荐OpenClaw?

    • 🏠 真正本地化:数据完全存储在本地,无需担心隐私泄露,符合”own-your-data”理念
    • 🔌 无缝集成:支持30+通讯平台,无需切换应用即可使用AI助手
    • 🚀 活跃社区:380K+ Stars,79K+ Forks,迭代速度快,问题响应及时
    • 🛠️ 高度可扩展:基于ClawHub的技能系统,快速添加自定义功能
    • 🔒 安全沙箱:非主会话默认运行在Docker沙箱,避免安全风险

    个人使用心得:

    OpenClaw最大的优势在于其”本地优先”的设计理念。与依赖云服务的AI助手不同,OpenClaw让你完全掌控自己的数据。通过将其集成到WhatsApp等日常使用的通讯工具中,可以实现真正无缝的AI助手体验。多智能体路由功能特别适合需要隔离不同工作场景的用户,比如将工作和个人助手分开。此外,ClawHub技能生态系统使得扩展功能变得非常简单,社区已经贡献了大量实用技能。

    📥 下载地址

    官方资源链接:

    📊 项目统计

    指标 数据
    ⭐ GitHub Stars 380,430
    🍴 Forks 79,687
    👁️ Watchers 1,792
    ❗ Open Issues 6,634
    💻 主要语言 TypeScript
    📅 最后更新 2026-06-25
    📜 开源协议 MIT License

    本文档持续更新,最后更新时间: 2026-06-26 01:37:21

  • 出版巨头People Inc.放话要和Google打一架,导火索是AI爬虫

    AI爬虫这件事,终于有人准备跟Google正面刚了。出版集团People Inc.(就是原来那个Dotdash Meredith)的CEO Neil Vogel这周在Axios的采访里说的挺直白:”我们很愿意跟他们一起做点有建设性的事,但大概率最后还是要走向对抗,而不是合作。”

    People Inc.与Google AI爬虫对抗概念图
    出版巨头People Inc.准备与Google就AI爬虫问题正面对抗

    有 licensed 的,也有野生爬虫

    Vogel在采访里把话挑明了说。People Inc.已经跟Meta、OpenAI和微软签了AI内容授权协议——这些公司要用来训练模型的内容,是付了钱的。但对于其他那些没有授权、直接上来爬的AI爬虫,People Inc.的做法是:封。

    问题出在Google身上。Google的AI爬虫用的跟Google搜索爬虫是同一个身份,这意味着如果你封了Google的爬虫,你的网站在Google搜索里也就消失了。对于一家靠搜索流量吃饭的媒体集团来说,这等于是被拿捏住了命门。

    “我们很愿意跟他们一起做点有建设性的事,但大概率最后还是要走向对抗,而不是合作。”——Neil Vogel,People Inc. CEO

    Google的垄断地位成了挡箭牌

    这件事的本质,是Google在搜索市场的垄断地位给了它一种别人没有的特权:其他AI公司要爬你的内容,你可以说”不”;但Google要爬,你很难说”不”,因为代价是失去搜索流量。

    Vogel没有细说具体准备怎么跟Google对抗,但业界普遍猜测可能的路径包括:推动立法要求AI爬虫必须获得明确授权、联合其他出版商发起行业抗议、或者在欧盟走反垄断投诉路线(欧盟对Google的 antitrust 案底可比美国厚多了)。

    这事儿不止关乎一家公司

    People Inc.的这个表态,其实是整个出版行业跟AI公司博弈的一个缩影。过去两年,已经有将近400家地方报纸联合起诉了OpenAI和微软,指控它们未经许可爬取内容训练模型。纽约时报的案子到现在还没打完。现在Vogel放话要跟Google对抗,等于是把战场从”训练时的版权问题”扩展到了”实时爬虫的授权问题”。

    有意思的是,Google并不是唯一一个让出版商头疼的。Anthropic的Claude也被发现爬取了大量网站内容,只是它不像Google那样掌握着搜索入口,所以出版商还有谈判的筹码。

    这场对抗最后怎么收场,现在还不好说。但Vogel愿意公开把话挑明,至少说明出版商这边已经不想再忍了。接下来几个月,估计会有更多媒体集团跟进表态——毕竟,如果内容创作者的利益一直被无视,这场AI狂欢的代价,最后还是整个社会来付。


  • 福特拿了JD Power质量第一,却要请回老工程师帮AI擦屁股

    福特这个月算是扬眉吐气了一把——16年来第一次在JD Power新车质量初始排名(IQS)里拿到了主流车企第一名。按理说这是要大吹特吹的里程碑,结果福特自己倒先开口承认了之前几年栽的跟头:公司的AI和自动化系统搞出了一堆麻烦,最后不得不把已经退休的老工程师请回来擦屁股。

    福特AI自动化失败概念图
    福特在AI自动化生产中吃了亏,不得不请回老工程师

    以为AI能包办一切

    福特车辆硬件工程副总裁Charles Poon这周对媒体说了一段挺坦诚的话:”我们犯了一个错误——以为只要引入人工智能、调整一下我们的设计要求,就能自动产出高质量的产品。”

    这话听起来简单,背后是福特过去几年在生产和设计环节大规模引入AI和自动化系统的真实教训。福特和很多车企一样,相信AI能提升效率、减少错误。但现实是,那些自动化系统并没有想象中那么可靠,机器人搞出来的东西有时候还得靠人来收拾残局。

    “我们犯了一个错误——以为只要引入人工智能、调整一下我们的设计要求,就能自动产出高质量的产品。”——Charles Poon,福特车辆硬件工程副总裁

    老工程师的脑子是AI学不会的

    福特的问题出在哪?按Poon的说法,有两件事被低估了。第一是训练AI模型的数据质量——垃圾进、垃圾出,这条铁律在制造业里一样成立。第二是公司那些老工程师脑子里积攒的”隐性知识”,是AI短期内学不来的。

    那些在福特干了一辈子的工程师,经历过无数次车型开发周期,知道哪些设计在真实世界里会出问题、哪些装配流程藏着坑。这些经验大部分没有、也很难被完整地写进系统。结果就是,一些最资深的员工在知识还没来得及转移进自动化系统之前就离职或退休了,福特只能再把他们请回来——要么重新训练系统,要么直接带一带那些被AI搞糊涂了的年轻工程师。

    不止福特一家在交学费

    福特这件事其实折射出一个更普遍的现象。过去几年,从科技巨头到传统制造业,大家都在拼命往AI和自动化上砸钱,好像只要上了AI,效率和质量就能自动起飞。但越来越多的案例表明,AI不是万能药,尤其是在那些需要长期积累的领域-specific知识的场景里。

    特斯拉早几年在Model 3产能爬坡阶段就吃过类似的亏——过度自动化反而成了瓶颈,马斯克后来自己都承认”人类被低估了”。波音在737 MAX的软件问题曝光后,也引发了对过度依赖自动化系统的反思。福特的案例只不过是为这个名单又添了一笔。

    话说回来,福特能在拿了JD Power第一的时候主动讲这些丑事,倒也算有种。毕竟,承认AI有局限性、重新重视人的价值,可能比一味追风口更能帮企业走长远。


  • Adobe把Topaz Labs收了,创意软件军备竞赛又升级了

    Adobe收购Topaz Labs AI创意工具概念图
    Adobe将把Topaz的AI图像视频增强模型集成到Firefly和Creative Cloud(图源:Adobe/Topaz Labs)

    Adobe周四宣布收购Topaz Labs,一家做了20多年图像和视频增强工具的公司。交易细节没披露,但Adobe说会把它并进创意业务板块。

    这个举动背后的逻辑不复杂:Adobe不想让用户在修图修视频的过程中跑到别家工具去。Topaz的产品正好补上Adobe在某些专业增强场景下的短板。

    一家”老”公司的新机会

    Topaz Labs成立已经超过20年,主打图像和视频的AI增强。这两年跑出来的两个核心产品是Astra(AI视频升频)和Wonder(图像修饰和增强)。去年,Topaz还拿了艾美奖,表彰它在视频技术上的贡献。

    更有意思的是他们最近搞的一个技术叫Neurostream,能让大型视频AI模型在消费级GPU上跑起来。这个方向对Adobe来说很有价值——Adobe一直在推”本地运行AI”的能力,Neurostream正好能对上。

    “Topaz Labs在优化大型复杂AI模型以在设备上直接运行方面有深厚积累,这个能力将让Adobe能够为客户提供更快速、更灵敏的体验。”——Adobe创意云产品营销VP Deepa Subramaniam

    Adobe的防守战

    Adobe这几年面临的压力不小。Canva从低端往上吃,Blackmagic Design(DaVinci Resolve的东家)在专业视频剪辑这块一直很能打。Adobe的策略是往所有产品里塞AI,同时把外部的好技术买进来、集成进来,让用户没有理由离开生态。

    Firefly是Adobe的AI品牌,已经集成到Photoshop、Premiere、Illustrator这些主力产品里。把Topaz的模型也融进去,Firefly在”画质增强”这个细分方向上的能力会明显补强。

    Adobe在公告里还说,Topaz的产品会继续作为独立服务在官网上提供。也就是说,现有Topaz用户暂时不用担心产品被”Adobe化”。

    交易时间表

    Adobe说这笔交易将在2026年下半年完成,还需要过监管审批这个关。考虑到两家公司的市场份额,这应该不是什么大问题。

    从更大的视角看,这笔收购是创意软件行业AI军备竞赛的一个缩影。每一家都在想办法让自己的AI更强、更全、更能留住用户。Topaz Labs作为一个在AI增强领域深耕20年的玩家,它的技术积累比它的名气要大得多。


    • Topaz Labs成立20+年,去年获艾美奖
    • 核心产品:Astra(视频升频)、Wonder(图像增强)
    • Neurostream技术可在消费级GPU上运行大型视频AI模型
    • Adobe将把Topaz模型集成到Firefly和Creative Cloud
    • 交易预计2026年下半年完成
  • 帮AI云提速的网络自动化公司Netris,刚拿了a16z的1500万美元

    AI neocloud网络自动化概念图
    Netris平台提供数据中心网络抽象与硬件加速自动化(图源:Netris)

    AI热潮之下,人人都想开数据中心。问题是,GPU买到了,机房租好了,真正能把集群跑起来、开始对外提供算力服务,中间还有很长一段路。

    网络配置、存储对接、多租户隔离——这些脏活累活能把一支工程师团队耗上好几个月。而GPU这东西,闲着就是烧钱。谁先上线,谁就能先产生收入。

    不是SDN,是硬件加速的”SDN”

    Netris做的事情很简单:让数据中心网络配置自动化。他们的软件跑在网络交换机上,把设置、配置、日常运维全部自动跑起来,帮neocloud运营商把上线周期从几个月压缩到几周甚至几天。

    CEO Alex Saroyan说了一句很实在的话:AI场景下的网络,纯软件方案不够用,流量太大了,必须硬件加速。传统数据中心用的SDN(软件定义网络)在AI时代已经跟不上了。Netris提供的就是”像SDN一样灵活、但是完全硬件加速”的方案。

    “AI不是确定性的,它有时候会自己’发挥’,做创意工作很好,但改几千条交换机配置的时候,你不需要它有创意,你需要它非常稳定、可重复。”——Netris CEO Alex Saroyan

    Nvidia先成了他们的推销员

    这个故事最有意思的部分在这里:两年前,Nvidia看到Netris的演示后印象深刻,主动把这家公司推荐给了自己的好几个客户。

    目前Netris已经在全球35个以上的GPU集群上线,涵盖约100万颗GPU,客户名单里有Lightning AI、Foxconn、HPE、Tensorwave、Telus等。Nvidia自己不做这块,但它知道客户有这个痛点,所以帮Netris打开了门。

    Netris的平台是供应商中立的,不管用的是Nvidia还是AMD的服务器,都能跑。这对neocloud运营商来说是个实用的卖点——他们往往同时跑多种硬件。

    a16z为什么要投

    Neocloud这个概念火了以后,市场上冒出了不少玩家——专门做AI推理或训练的云服务商,跟AWS、Azure这种大厂错位竞争。但这些玩家很多是AI或算力公司出身,网络这块并不是他们的强项。

    Netris相当于给这些neocloud提供了一套”开箱即用”的网络自动化平台。a16z合伙人Guido Appenzeller将加入Netris董事会,他在声明里提到,AI基础设施的下一波竞争,很大程度上会落在谁能更快、更高效地把算力交付给客户。

    顺便说一句,Netris成立已经8年了,做网络自动化比AI boom早得多。他们用的都是自研算法,没有往里面堆大模型。Saroyan的态度很明确:改交换机配置不需要AI来”创意”,需要的是稳定和执行力。


    • Netris此轮融资1500万美元,由a16z领投
    • 平台已在35+个GPU集群、约100万颗GPU上部署
    • 核心差异化:硬件加速网络自动化,适配Nvidia和AMD环境
    • Nvidia曾主动向客户推荐Netris
  • Anthropic给Slack装了个永远在线的Claude,企业AI助手变队友了

    Claude Tag在Slack中的概念图
    Anthropic推出Claude Tag,让AI以队友身份常驻Slack频道 | 概念图

    Anthropic本周悄悄上线了一个新功能,可能会改变人们在企业里使用AI的方式。它叫Claude Tag,简单来说就是在Slack里放了一个永远在线的Claude,不是那种你问一句它答一句的工具,而是真的像个队友一样待在频道里,看着大家聊天,记住上下文,甚至主动跳出来提醒你。

    以前你也能在Slack里@Claude问问题,或者用Claude Code处理编程任务,但那些都是按需触发的。Claude Tag不一样的地方在于持久记忆和环境感知——它跟着频道走,慢慢学到你们团队是怎么工作的,而且如果你授权了,它还能去读别的频道,把跨组织的信息串起来。

    随着Claude跟着频道走,它对这份工作的了解会越来越多。如果获得授权,Claude还能自动从组织的其他地方收集信息。Anthropic在声明里这么写。这家公司的意思是,AI不应该只是一个工具,而应该是一个能积累上下文的协作者。

    一个频道,一个Claude身份

    Claude Tag最有意思的设计是:每个Slack频道里只有一个Claude身份,频道里所有人都能看到它之前做了什么,也能接着上一个人留下的对话继续。这和企业里现在常见的每人有自己的AI助手模式很不一样。

    管理员可以设定这个Claude能访问哪些工具、哪些频道、哪些信息。不同频道的Claude是隔离的——法务频道的Claude看不到工程频道的记忆,这算是给企业数据安全留了一道边界。


    会主动插话的AI

    Claude Tag有一个环境模式,可以主动在聊天里跳出来——比如提醒你某个跨部门的任务还没跟进,或者把组织里别的地方跟当前讨论相关的事情搬出来。Anthropic的说法是,这让你感觉是在和一个真实的同事合作,而不只是一个工具。

    当然,一个AI助手在Slack频道里主动说话,这件事本身也需要拿捏分寸。太吵了大家会烦,太沉默又失去了永远在线的意义。Anthropic现在把它放在beta阶段,应该也是在观察企业的实际使用反馈。

    这个方向不只是Anthropic在押。微软有Graph加Copilot,Snowflake和Databricks把自己定位成企业知识的后台,Glean在做模型和企数据之间的理解层。大家都在抢同一件事:让AI真正懂一家公司的上下文,而不只是会回答问题的聊天框。

  • Amazon向印度追加130亿美元,全球AI军备竞赛打到南亚了

    Amazon印度AI数据中心概念图
    Amazon宣布向印度追加130亿美元AI基础设施投资 | 概念图

    Andy Jassy这次去新德里,不只是拜访总理莫迪那么简单。6月25日,Amazon宣布将在2030年前向印度追加130亿美元的AI和云基础设施投资,重点是扩建AWS在孟买和海得拉巴的数据中心容量。

    这是Amazon三年内对印度做出的第三笔重大承诺。2023年Jassy与莫迪会面后,公司宣布到2030年投资150亿美元(其中127亿给AWS);2025年12月又追加了超过350亿美元。三笔加起来,Amazon在印度的总投资承诺现在已经到了480亿美元。

    科技公司的长期投资承诺通常既包括资本支出,也包括运营支出,并不全是新基础设施的投入。但480亿美元这个数字本身,已经足够说明Amazon对印度市场的押注力度。

    不只是Amazon在押注印度

    全球科技巨头正在排队往印度砸钱。微软去年12月说要在2029年前投175亿美元,谷歌去年10月承诺花150亿美元建AI枢纽和数据中心基础设施。除了美国公司,澳大利亚的AirTrunk承诺投300亿美元在印度建5GW的AI数据中心,加拿大养老金投资局也进来了。

    印度本土财团也没闲着。Reliance Industries今年2月公布了1100亿美元的AI投资计划,Adani Group承诺投入1000亿美元建AI数据中心。印度政府也在推政策激励,对新德里去年预算中提出的措施——对外国云厂商从印度数据中心销往海外的工作负载,提供至2047年的税收豁免。


    Amazon的另一条战线:即时零售

    基础设施之外,Amazon也在印度零售战场上加码。公司计划今年新开20多个履约中心、超过100个最后一英里配送站,同时把即时零售服务Amazon Now扩展到全国300多个城市。

    这个市场已经很挤了。Eternal旗下的Blinkit、Swiggy的Instamart、Zepto,还有沃尔玛旗下的Flipkart都在抢。Flipkart本周还说要在2026年底前在全印度开1500个微型履约中心。

    Amazon这次把AWS基建和零售物流两件事放在一起宣布,意图很明显:既要做印度AI的基础设施层,也要做面向消费者的最后一公里。这种打法在其它市场也有,但在印度同时推进,考验的是执行力和本地化深度。

  • OpenMontage:全球首个开源 AI 智能体视频制作系统,21.2K+ Stars 让 AI 编程助手变身视频工作室

    OpenMontage:全球首个开源 AI 智能体视频制作系统,21.2K+ Stars 让 AI 编程助手变身视频工作室

    🎬

    OpenMontage:全球首个开源 AI 智能体视频制作系统

    21.2K+ Stars | AGPL-3.0 | Python/TypeScript | calesthio 出品

    OpenMontage 是全球首个开源的智能体驱动(agentic)视频生产系统,包含 12 条生产管线52 个生产工具500+ 智能体技能。将你的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等)转化为完整的视频制作工作室,支持从创意到成片的端到端全流程自动化生产。

    21.2K+
    GitHub Stars

    12
    生产管线

    52
    生产工具

    500+
    智能体技能

    ⚙️
    安装要求和过程

    环境要求

    • Python 3.10+
    • FFmpeg(视频编码、字幕烧录、音频混合)
    • Node.js 18+(Remotion 合成引擎)
    • 任意支持的 AI 编码助手(Claude Code/Cursor/GitHub Copilot 等)

    快速安装

    # 一键安装(推荐)

    git clone https://github.com/calesthio/OpenMontage.git
    cd OpenMontage
    make setup

    # 无 make 手动安装

    pip install -r requirements.txt
    cd remotion-composer && npm install && cd ..
    pip install piper-tts
    cp .env.example .env

    本地 GPU 支持(免费视频生成)

    make install-gpu
    # 然后在 .env 中配置:
    VIDEO_GEN_LOCAL_ENABLED=true
    VIDEO_GEN_LOCAL_MODEL=wan2.1-1.3b # 可选 wan2.1-14b、hunyuan-1.5 等


    核心功能

    🎬

    12 条全流程生产管线

    覆盖动画讲解、动画制作、虚拟人播报、电影感剪辑、短视频批量生成、纪录片蒙太奇、混合制作、本地化配音、播客剪辑、屏幕演示、口播视频等场景。每条管线遵循「研究 → 提案 → 脚本 → 分镜 → 资产 → 剪辑 → 合成」的标准化流程。

    🎨

    双渲染引擎支持

    Proposal 阶段锁定渲染运行时,可选 Remotion(React 组件化合成,适合数据驱动讲解)或 HyperFrames(HTML/CSS/GASP 合成,适合动态图形和 SVG 角色动画)。禁止运行时静默切换,确保生产一致性。

    💰

    零成本/本地免费生产路径

    无需 API 密钥即可使用 Piper TTS 离线配音、Archive.org/NASA/Pixabay 等免费素材库、Remotion/HyperFrames 合成、FFmpeg 后期处理。还支持本地 GPU 运行 WAN 2.1、Hunyuan 等免费视频生成模型。

    🎯

    7 维评分自动选品

    所有工具选择通过「任务匹配度 30%、输出质量 20%、可控性 15%、可靠性 15%、成本效率 10%、延迟 5%、连续性 5%」的打分机制自动选择最优供应商,所有决策可追溯。

    生产级质量门禁

    包含合成前校验(阻断交付承诺不符、幻灯片风险过高的问题)、渲染后自检(ffprobe 验证、抽帧检查、音频分析、字幕校验)、决策审计日志(所有创意/技术选择留痕可查),避免输出无效内容。

    🚀
    典型使用场景

    📚

    教育内容创作

    输入「做一个 60 秒的动画讲解,主题是为什么天空是蓝色的」,AI 自动完成脚本编写、分镜设计、配音合成、字幕添加,全程无需手工操作。支持零密钥本地免费生成。

    🎬

    参考视频驱动创作

    粘贴 YouTube/Reels/TikTok 链接,智能体自动分析参考视频的节奏、结构、风格,输出 2-3 个差异化创意方案(含成本预估和效果预览),避免从零开始构思。

    📰

    纪录片/蒙太奇制作

    「做一个 90 秒的纪录片蒙太奇,主题是凌晨 4 点的城市氛围,仅使用实拍素材,无旁白,elegiac 基调。」支持 Archive.org 等免费素材库自动检索和剪辑。

    🎨

    风格化动画生成

    「做一个 30 秒的吉卜力风格动画,内容是云端的魔法浮动图书馆,黄金时段场景。」配置图像/视频 API 后,成本约 $0.15-$1.50 即可生成风格化动画。

    💡
    推荐理由

    💡

    OpenMontage 是我近期看到的最有想象力的 AI + 创意工具结合项目之一。它不只是「AI 生成视频」的工具,而是一个完整的视频生产管线系统——把 AI 编程助手变成了导演、编剧、分镜师、剪辑师、配音演员的集合体。

    最打动我的是它的「零成本路径」设计:你可以完全不花一分钱(无需任何 API Key)就生成完整的视频——使用 Piper 离线 TTS 配音、免费素材库、本地 FFmpeg 处理。对于个人创作者和学习者,这是极大的降低门槛。

    另外,它的7 维评分自动选品机制生产级质量门禁,让我看到了这个项目是「真正可用于生产」的,而不仅仅是 Demo 级别的玩具。所有决策留痕可查,合成前/后双重校验,这些设计在开源项目中非常少见。

    「如果你已经在使用 Claude Code 或 Cursor,OpenMontage 能让你用同样的工作流(写提示词 → 看结果 → 迭代)来「编程」视频,而不是去学习 PRo/Afer Effects。」

    🔧
    支持的 AI 工具与服务商

    兼容的 AI 编码助手:Claude Code、Cursor、GitHub Copilot、Windsurf、Codex(后续支持 Ollama、LM Studio 本地大模型)

    视频生成:Kling、Runway Gen-4、Google Veo 3、Grok Imagine Video、Higgsfield、MiniMax、HeyGen、WAN 2.1、Hunyuan、CogVideo、LTX-Video、Pexels、Pixabay、Wikimedia Commons

    图像生成:FLUX、Google Imagen 4、Grok Imagine Image、DALL-E 3、Recraft、Local Diffusion、Pexels、Pixabay、Unsplash、ManimCE

    文本转语音:ElevenLabs、Google TTS(700+ 音色)、OpenAI TTS、Piper(免费离线)

    音乐/音效:Suno AI、ElevenLabs Music、ElevenLabs SFX

    📥
    下载地址

    授权协议:AGPL-3.0(免费开源)
    开发语言:Python, TypeScript, Rust
    出品团队:calesthio(YC S26 孵化项目)

  • iOS 27里这些AI功能,比新版Siri更值得关注

    iOS 27里这些AI功能,比新版Siri更值得关注

    iOS 27 AI功能概念图
    iOS 27 实用AI功能散布在系统各个角落(概念图)

    WWDC本月早些时候,苹果发布了AI版Siri的重磅更新——这个说了好几年的”理解个人语境、能替你操作手机”的Siri终于要来了。但这只是台面上的大新闻。散落在iOS 27各个角落里,还有一批更接地气的AI功能,它们不需要你主动去跟Siri对话,而是在你用手机的过程中默默让事情变得更顺。

    这些功能现在在开发者测试版里已经能用,公测版很快跟上,秋天正式推送。看完清单,你大概会同意:苹果这一次对AI的理解,比”做个聊天机器人”要实在得多。

    拍张小票就能AA制

    吃完饭最烦的事之一:把小票拍下来,手动算每个人吃了什么、该均摊多少。iOS 27里,Apple Cash新增了账单拆分功能,用Apple Intelligence识别小票上的项目、数量、小费、税费,然后让你勾选自己吃了哪些菜,再群发给一起吃饭的人。每个人自己选自己的,最后用Apple Cash结算。整个过程不超过一分钟。

    这个功能妙在它不强迫你用——小票识别只在你打开Apple Cash的时候才出现,而且它懂”分一半”这种操作(比如你跟朋友合点了一份前菜)。

    密码被泄露了?AI帮你自动改

    用了密码管理器也不代表安全。数据泄露这种事,用户自己其实没什么办法。iOS 27的密码更新功能会用Apple Intelligence自动识别弱密码和被泄露的密码,然后替你打开网站、登录、把密码改成更安全的版本——整个过程不需要你手动操作。

    这比现在”系统通知你密码可能泄露、请你去改”的做法前进了一大步。当然,让AI代你登录网站这件事本身也需要信任,苹果强调这一切都在设备端完成,不上传数据。

    Messages里的一键建议

    朋友发信息让你带东西、让你分享某次聚会的照片、或者约你吃饭——iOS 27的Messages会用Apple Intelligence读懂对话内容,然后直接在输入框上方给出”一键操作”建议:把请求加到提醒事项、把照片选好让你确认发送、把饭局加到日历。

    这个设计很苹果:AI在后台跑,但界面上看起来只是”多了几个方便的按钮”,你甚至不一定意识到这是AI在帮你。不需要喊Siri,不需要切换应用,该出现的时候它就在那里。

    打电话时自动显示订单号

    打航空公司或酒店的客服电话,对方第一句通常是”请问您的确认码是?”——然后你就要手忙脚乱地去邮件里翻。iOS 27的”通话上下文”功能会从你的Mail里提取相关信息,在你拨号的时候就显示在通话界面上。订单号、确认码、预约时间,都直接呈现。

    同样,这一切在设备端完成。苹果的逻辑是:AI不一定非要以”助手”的身份出现,它也可以只是一个”刚好在你需要的时候把信息放到你眼前”的后台能力。

    用自然语言建快捷指令

    快捷指令(Shortcuts)一直是iPhone里最强大但也最难上手的 app。iOS 27里,你直接用自然语言描述想做什么,Apple Intelligence就会帮你建好这个快捷指令。比如”让我每天晚上根据明天的日程自动设闹钟”,或者”每次我下班的时候给伴侣发个预计到家时间”。以前要在快捷指令编辑器里拖半天模块,现在说一句话就行。

    其他值得提的功能还有:Safari用AI自动把打开的标签页按主题分组;家庭 app 用AI把多次触发的通知合并成一条(比如”有人到家了,车库门已关”);直接用说话的方式往日历里加事件,AI会自动提取时间、地点、参与人。

    苹果这一轮AI功能的底层逻辑跟Google和Microsoft很不一样:它不是在做一个”你跟它聊天”的AI,而是在让整个系统变得更聪明。Siri的升级是头条,但真正改变日常体验的,可能是这些散落在各个 app 里的小改动。


  • 2026年科技大裁员,AI成了最常被提到的理由

    2026年科技大裁员,AI成了最常被提到的理由

    2026年科技行业AI裁员趋势概念图
    2026年科技大裁员,AI成为最常被提及的理由(概念图)

    Oracle刚在监管文件中披露,过去12个月裁了2.1万人,占员工总数13%。公司在文件里写得很直白:AI技术的部署已经导致、并且可能继续导致员工数量减少。这句话把2026年科技行业最尴尬的现状摊开了——公司一边赚着历史级的营收,一边正大批量裁人,而AI既是增长的引擎,也是裁员的理由。

    Outplacement公司Challenger, Gray & Christmas的数据很说明问题:5月是几年来单月裁员最高的一次,AI是被提到最多的原因。这不止是某一家公司的决策,而是整个行业在集体做同一件事。

    从Oracle到亚马逊,名单还在变长

    这份名单读起来有点长。Google在整个2026年通过绩效考核和重组悄悄裁员,外部估算在1500到3000名工程师以上,而Google Cloud营收同比增长63%,首次突破200亿美元。Meta在5月裁了约8000人(10%员工),同时把约7000人转岗到AI部门——有报道说那些被塞进AI组的人并不开心,称那里像”灵魂粉碎的古拉格”。

    Cisco在同月裁了近4000人(5%),财报却好于预期。Cloudflare裁了1100人(20%),季度营收6.398亿美元,同比涨34%,是公司历史上最好的单季成绩。CEO Matthew Prince后来的解释是:被裁的”绝大多数是衡量者”——中 management、财务、法务、内审、收入确认。

    “我们绝大多数上周被裁的人,都是衡量者。”Cloudflare CEO Matthew Prince这句话,差不多把这一轮AI裁员的本质说清楚了。

    其他公司的动作也差不多。Intuit裁了约3000人(17%),PayPal宣布未来两三年裁20%员工(超4500人),理由都是”重新分配资源到AI”。Coinbase裁了700人(14%),CEO Brian Armstrong说AI让工程师”用几天时间完成过去一个团队几周才能做完的事”。Snap裁了约1000人(16%),CEO Evan Spiegel给的理由是AI进步让团队能减少重复劳动、提速度。

    不是所有公司都只用AI当借口

    有些公司的裁员确实跟AI有关系,但故事没那么简单。Block(Jack Dorsey的公司)裁了近4000人,差不多腰斩,从1万人以上降到6000人以下。Dorsey在X上写的是:智能工具加小团队正在改变”建立和运营公司的意义”。Salesforce裁了不到1000人,CEO Marc Benioff的说法是Agentforce让客服case数量下降,不再需要主动补位支持工程师——这话听起来像是真有用上AI,不只是拿AI当幌子。

    但更多情况下,这一轮裁员的背景是疫情期间的过度招聘。很多公司2020-2021年大扩招,现在以AI为由”合理化”人员调整。TechCrunch之前有一篇评论说,这个理由可能是个”火药桶”——被裁的员工并不觉得自己是被AI替代的,而是觉得公司拿了AI当幌子做他们早就想做的结构优化。

    不管怎么说,2026年这场以AI为名的大裁员还在继续。下一波会是谁?名单估计还会变长。