标签: AI

  • 亚马逊再砸130亿美元押注印度,全球AI算力竞赛找到新战场

    安迪·贾西去了一趟新德里,见了印度总理莫迪。回来之后,亚马逊宣布了一件事:追加130亿美元,扩建在印度的AI和云基础设施,时限到2030年。

    这笔钱主要用来扩充亚马逊云科技(AWS)在孟买和海得拉巴的数据中心容量。看起来只是一次例行扩建,但把它放在最近几年的脉络里看,意义不太一样。

    亚马逊印度AI数据中心概念图
    亚马逊在印度孟买和海得拉巴扩建AI数据中心

    三年三次,加码越来越狠

    这是亚马逊三年内第三次对印度做出重大投资承诺。2023年,贾西和莫迪见面后宣布到2030年投入150亿美元,其中127亿专门给AWS。2025年12月,亚马逊又把承诺总额推高到350亿美元。加上这次的130亿,亚马逊在印度累计承诺的投资总额已经到了480亿美元。

    当然,科技公司宣布的”长期承诺”往往同时包含资本支出和运营支出,不等于马上就要花掉的新基建投资。但480亿美元这个数字本身,已经足以说明亚马逊对印度市场的定位——不只是”重要”,而是”绝不能丢”。

    印度正在成为全球AI算力竞赛中各方都想拿下的那个”落脚点”。微软、谷歌、亚马逊,一个都没缺席。

    不是亚马逊一个人在跑

    微软2025年12月说要在2029年之前往印度投175亿美元。谷歌2025年10月宣布150亿美元,用于在印度建AI枢纽和数据中心基础设施。这两家加起来,已经和亚马逊的承诺总额差不多了。

    数据中心这个项目,砸钱的不只是美国科技公司。澳大利亚的AirTrunk承诺投300亿美元在印度建5吉瓦的AI数据中心;加拿大养老金投资委员会(CPP Investments)也进来了;印度本土的Reliance Industries和Adani Group,分别拿出了1100亿和1000亿美元的AI投资计划。

    • 微软:175亿美元,2029年到位
    • 谷歌:150亿美元,建AI枢纽和数据中心
    • AirTrunk:300亿美元,5吉瓦数据中心容量
    • Reliance:1100亿美元AI投资计划
    • Adani:1000亿美元投向AI数据中心

    印度打的是什么算盘

    新德里方面也在主动出牌。2026年2月,印度政府推出了一项税收优惠政策:外国云服务商如果把计算工作负载放在印度的数据中心、并且服务的是海外客户,那么这部分收入可以享受免税待遇,一直持续到2047年。

    这个政策指向很明确——印度不只是想当AI技术的消费市场,更想成为支撑全球AI运算的基础设施提供方。电价相对便宜、土地成本不高、政府愿意给税收优惠,这几个条件加在一起,对算力密集的AI产业确实有吸引力。


    亚马逊没忘记自己的老本行

    除了云和AI基础设施,亚马逊在印度的零售和物流网络也在同步扩张。今年计划新开20多个履约中心,以及超过100个最后一英里配送站。主打快速配送的”Amazon Now”服务,正在推进到全国300多个城市和乡镇。

    这个赛道现在挺挤的。Eternal旗下的Blinkit、Swiggy的Instamart、Zepto,还有沃尔玛控股的Flipkart,都在抢即时配送这块蛋糕。Flipkart上周刚说要在2026年底前在全国开1500个微型履约中心,亚马逊这边的压力不小。

    从AWS到即时配送,亚马逊在印度的这笔130亿美元新投资,表面上是在跟上AI基础设施的全球竞赛,实际上也在为更长远的印度市场布局做准备。480亿美元会不会全部落地、什么时候落地,还得接着看。

  • Claude付费用户悄悄涨了75%,这家”企业向”AI公司正在撬动ChatGPT的消费者地盘

    很多人对Anthropic的印象还停留在”那是家做企业生意的公司”——开发者用Claude Code写代码,公司用它搭AI工作流,消费者市场?那是ChatGPT的地盘。

    一家做信用卡交易数据分析的公司Indagari,最近给出了不太一样的数据。他们分析了约2800万美国消费者的匿名信用卡交易记录,时间跨度从2025年到2026年5月10日,覆盖了订阅付费和API token购买。结论很直接:Claude在消费者端的付费用户,正在稳定增长。

    Claude与ChatGPT消费者市场竞争
    Claude正在消费者市场悄悄追赶ChatGPT

    增长从哪里来

    具体数字Indagari没有披露,但他们看到的趋势是”持续向右上方走”。自2026年1月以来,Claude在这2800万人的样本里,付费消费者收入和用户数增长了大约75%。

    有意思的是,这个增长在三月份还经历过一次跳涨——当时Anthropic公开拒绝让自家的模型被特朗普政府用于大规模监控美国公民和开发自主武器。这件事在消费者圈子里反而成了加分项,之后增长并没有回落,而是继续保持上行。

    Anthropic拒绝配合政府大规模监控这件事,反而让更多普通消费者愿意掏钱订阅Claude。在AI公司争相和政府合作的当下,这个选择挺少见的。

    学Claude的人越来越多了

    另一组数据来自在线教育平台DataCamp。他们有大约2000万用户,教的是AI技能和数据分析。DataCamp说,”Claude”现在已经是他们网站上被搜索次数最多的词,比”AI”这个统称还热门。

    在自费学习的消费者群体里,Claude相关课程的需求量是ChatGPT课程的3倍。过去30天里,Claude课程的需求增长了18倍。不过在企业客户那边,ChatGPT的课程仍然更受欢迎——公司出钱培训员工的时候,还是更认ChatGPT。

    ChatGPT还是老大,但差距在缩小

    当然,把Claude和ChatGPT摆在同一个量级上说,目前还为时尚早。Sensor Tower的数据很清楚:ChatGPT在各个平台上的总用户数和付费用户数,仍然远远领先。只是ChatGPT基数太大,近期的增长率相对平缓,而Claude从较小的基数往上走,增速看起来就更醒目。

    Indagari的数据也印证了这一点——ChatGPT的付费用户绝对数量还是更多,但Claude从消费者口袋里赚到的钱,2026年以来确实在快速追赶。


    麻烦事还没完

    就在数据看起来一片向好之际,Anthropic又碰上了美国政府这道坎。本月早些时候,美国政府禁止Anthropic向非美国公民提供其最强大的网络安全模型Mythos 5和Fable 5,原因是担心模型被滥用。Anthropic的应对是把这两款模型暂时全网下线,目前还没有明确何时恢复。

    这件事对消费者业务的影响目前还看不清楚。政府限制的主要是非美国用户的访问,对美国本土消费者的订阅意愿影响可能有限。而且Anthropic的企业和开发者用户数据也在继续增长,看起来并没有因为这场风波而受到明显冲击。

    眼下OpenAI和Anthropic都站在准备上市的门槛上,外界对这两家公司的业务健康度的好奇心比以往任何时候都强。从目前能拿到的各种数据来看,Anthropic在消费者市场的这波增长,可能不是昙花一现。

  • 拿下5000万美元融资,这家公司要用「数字世界」逼出AI Agent的真本事

    Patronus AI 数字世界测试
    Patronus AI 用”数字世界”测试AI Agent

    AI Agent这两年进化得越来越快,从最开始只能答答题,到现在能自主跑完一整套多步骤的复杂任务。但有个问题一直没人能很好地回答:你敢把自己的行程预订、财务分析交给一个还没被充分验证过的agent吗?

    模型厂商和做agent的创业公司心里也清楚,光拿个高分基准测试成绩说明不了什么问题——agent在实际场景里能不能把事做对,才是真正的考验。

    “数字世界”是个什么玩法

    2023年,两个前Meta AI研究员Anand Kannappan和Rebecca Qian创办了Patronus AI。他们的思路很直接:既然Waymo是通过先构建合成世界来测试自动驾驶汽车应对极端天气、小孩追球这些罕见危险场景的能力,那AI agent为什么不能用类似的办法?

    Patronus做的就是这件事:用他们称之为”数字世界模型(digital world models)”的技术,创建网站和内部系统的副本。agent在训练完后,会被扔进这些模拟环境里接受压力测试——强化学习会在这个过程中迭代:任务完成了给奖励,出错了给惩罚。

    Notable Capital的管理总监Glenn Solomon说,前沿AI实验室和很多新兴创业公司现在都是他们的客户,对模拟环境的需求几乎是”无法满足的(insatiable)”。

    为什么Patronus能拿到5000万美元

    营收数据说话:过去一年,Patronus的营收增长了15倍。这不是小打小闹的POC(概念验证),而是实打实的客户需求在推动。本周四,公司宣布完成5000万美元B轮融资,由Greenfield Partners领投,Notable Capital、Lightspeed、Datadog和三星跟投。加上这一轮,Patronus总融资额已经达到7000万美元。

    投资人看中的是这个赛道的刚需。AI agent有个很讨厌的习惯:走捷径。它们看起来好像把任务做完了,实际上偷工减料,结果就是任务没被正确完成。Solomon说:”Patronus特别擅长发现这些取巧行为,确保模型被追责。”


    目前做到哪一步了

    Kannappan说,目前主要聚焦在”可验证的问题”上——就是那些你能立刻检查对错的任务,比如软件工程和金融分析。但这远不是终点。”有很多领域是非常难以验证的”,他补充道。

    Patronus的长期目标是构建能让agent运行10小时、10天甚至10周的环境。这个野心不小——意味着他们要模拟的不只是单次交互,而是长时间的、开放式的任务执行过程。

    竞争对手方面,Patronus认为主要对手其实是各家AI实验室自己搭的评估团队。的确,OpenAI、Anthropic、Google这些大厂都在内部做模型评估。但Patronus的差异化在于:它做的是自动化评估,不需要人类参与。相比之下,Mercor和Surge这类依赖人类数据的公司,走的是另一条路。

    AI agent能不能真正被大规模投入使用,测试和评估是很关键的一环。Patronus拿到这笔钱之后,这个赛道估计会变得更热闹。毕竟,谁能证明自己的agent最可靠,谁就能在接下来的商业化竞争中占得先机。

  • OpenAI GPT-5.6 因政府要求限制发布,监管大幕刚拉开

    OpenAI GPT-5.6 政府监管
    OpenAI 最新模型 GPT-5.6 的发布受到美国政府限制

    OpenAI本周五证实,应美国政府要求,它正在把最新一代模型GPT-5.6的发布范围压缩到”一小群受信任的合作伙伴”。这件事的蹊跷之处在于,政府没有发正式禁令,而是”要求”企业自觉,企业也真的照做了。

    这一代GPT-5.6一共有三个型号:Sol是旗舰,Terra是日常使用的均衡版本,Luna则是速度更快、成本更低的选项。按理说Sol是OpenAI目前最强的模型,但特朗普政府把三个型号的发布全都限了。OpenAI的说法是,预览版只给那些”参与情况已与政府共享”的合作伙伴。

    特朗普政府这波操作不是孤立事件。此前Anthropic发布其最强公开模型Fable 5之后,政府直接下令禁止任何外国国民访问,导致Anthropic不得不把整个模型下线。

    政府到底要干什么

    前白宫AI顾问、即将入职OpenAI的Dean Ball说得很直白:特朗普最近签的那项行政令,要求特定AI公司在发布前最多30天把最先进的模型提交政府审查,这实际上是搞出了一个”事实上的非自愿许可制度”,对前沿AI实施了强力限制。

    Ball还指出一个更棘手的问题:政府并没有拿出明确的安全标准。这意味着什么?模型发布可能被无限期推迟。对中国来说这可能是好消息,对美国那些砸了几十亿美元建AI基础设施的公司来说,这简直是噩梦。

    OpenAI这次虽然照做了,但态度很明确:这不该成为长期默认做法。公司在周五的博客里写得很清楚:”我们不认为这种政府审查流程应该成为长期默认。它让用户、开发者、企业、网络防御者和全球合作伙伴都无法获得最好的工具。”

    GPT-5.6 Sol到底强在哪

    撇开监管风波不谈,GPT-5.6 Sol确实是OpenAI目前最强的模型。根据OpenAI的说法,Sol在编码、生物和网络安全方面的代理能力都有提升,还引入了”max”推理努力模式和”ultra”模式——后者用协调的子代理来解决高度复杂的任务(当然,你的token消耗量也会随之飙升)。

    OpenAI宣称GPT-5.6 Sol在几个基准测试中都表现优异,编码工作流甚至略优于Anthropic的Claude Mythos 5(没错,就是本月也被特朗普政府实际上禁掉的那款)。而且Sol的性价比更高——输出token用量只有Mythos预览版的三分之一。


    安全方面,OpenAI强调Sol搭载了目前最强大的安全堆栈,对对抗性攻击做了深度加固,而且故意优化为优先支持防御性网络安全工作,而不是进攻性渗透。换句话说,这个模型的设计目标就是难被越狱,同时优先教用户怎么防御攻击,而不是怎么入侵系统。

    OpenAI还学乖了——Anthropic的Fable 5当初就是因为过度谨慎栽了跟头。Fable 5上线那短短几天里,只要分类器检测到高风险话题(比如网络安全、生物、化学),它不光会拒绝提示词,还会偷偷把请求路由到一个旧模型。这种过度谨慎的流程和”暗箱降权”引发了大量误报和用户反弹。OpenAI这次把安全护栏直接内置到核心模型行为里,而不是靠上面叠一个独立过滤器。

    定价和开放时间表

    GPT-5.6三个型号的定价分了档:Sol是每百万输入token 5美元、输出token 30美元;Terra正好是一半;Luna则是1美元和6美元。OpenAI还改进了提示词缓存,让重复提示的成本更便宜、也更可预测。

    目前的限制只是”短期步骤”,OpenAI说接下来几周会让GPT-5.6走上更广泛应用之路,同时正与政府合作制定新的行政令框架,涉及网络安全,以及”未来模型发布的可重复流程”。

    话说回来,政府伸手管模型发布这件事,才刚刚开始。Anthropic的Mythos风波还没完全平息,OpenAI又被迫缩小发布范围,接下来轮到谁?谷歌?Meta?这场AI监管大戏,估计还有得演。

  • OpenAI联手博通九个月拿出第一颗自研芯片,Jalapeño能不能撼动英伟达?

    OpenAI联手博通九个月拿出第一颗自研芯片,Jalapeño能不能撼动英伟达?

    6月24日晚上,OpenAI在旧金山和帕洛阿尔托两地同步开发布会,亮出了一颗以墨西哥辣椒命名的芯片——Jalapeño。这是OpenAI成立九年来的第一颗自研芯片,从立项设计到成功流片,只用了九个月。

    OpenAI Jalapeño AI推理芯片
    OpenAI与博通联合发布的首款自研AI推理芯片Jalapeño,从设计到流片仅用时九个月。

    发布会现场,博通CEO陈福阳(Hock Tan)和总裁Charlie Kawwas把首批工程样片交到了OpenAI CEO山姆·奥特曼和总裁格雷格·布罗克曼手里。这个画面挺有象征意义的——一家靠算法和模型起家的AI公司,正式迈进了硬件领域。

    九个月做出一颗芯片,这是什么概念

    正常来说,一颗复杂AI芯片从设计到流片,周期通常是18到24个月。Jalapeño只用了九个月,部分原因是OpenAI自己参与了开发流程——AI帮工程师加快了某些设计工作。

    但更关键的是分工。OpenAI负责芯片的底层架构设计,博通负责硅片实现(代工制造)和网络硬件(包括Tomahawk交换芯片),加拿大电子制造服务商Celestica负责板卡与机架系统集成。这种分工模式让OpenAI能专注于自己最懂的部分——AI模型需要什么样的计算——而把制造和集成交给有经验的人。

    博通CEO陈福阳在接受路透社采访时说,Jalapeño的性能”可与英伟达Blackwell芯片和谷歌TPU相媲美”。他同时透露,这款AI加速器相比传统GPU可节省约50%的成本。

    专门优化的ASIC路线

    Jalapeño不是通用GPU,而是一款面向大语言模型推理场景量身打造的ASIC(专用集成电路)。与英伟达GPU相比,ASIC可编程灵活性更低,但可以针对AI专属任务做深度优化,成本优势显著。

    在架构上,Jalapeño重点优化了数据流,减少数据移动,让计算、内存与网络资源的配置更均衡,实际利用率更接近理论峰值。OpenAI硬件负责人理查德·何(Richard Ho)说,团队围绕”对前沿AI模型最为关键的内核、内存传输、网络以及服务模式”对架构做了全面优化。

    首批工程样片已经在实验室以量产标准的频率和功耗条件下稳定运行机器学习任务,还成功跑通了OpenAI今年2月推出的代码模型GPT-5.3-Codex-Spark。早期测试显示,Jalapeño的每瓦性能(能效比)将显著优于当前业界最先进水平。

    只供内部使用,不对外销售

    一个值得注意的细节:Jalapeño芯片和配套服务器系统均不会对外销售,只供OpenAI内部使用。配套服务器由天弘科技负责生产。

    这意味着OpenAI做这颗芯片,目的不是跟英伟达打擂台卖芯片,而是给自己建一条算力的”后路”——降低对英伟达GPU的依赖,同时压低自己的推理成本。

    这个策略不难理解。OpenAI每年花在算力上的钱是个天文数字,而且英伟达GPU并不总是那么容易拿到。能自己控制供应链,对OpenAI这样的公司来说,战略价值远大于财务账面上省的那点钱。

    部署时间表和后续规划

    按照OpenAI的规划,Jalapeño将在2026年底前开始小规模部署,2027年快速爬坡,2028年上半年实现全面规模化量产。远期规划总耗电量最高将达到10吉瓦,配套建设千兆瓦级数据中心集群。

    OpenAI把Jalapeño定位为”多代计算平台的首个里程碑”。布罗克曼说:”通过自主研发更多底层技术环节,我们可以用更高效率提供智能服务,持续推动前沿人工智能技术实现规模化普惠落地。”

    芯片发布也让人联想到OpenAI的IPO传闻。奥特曼最近表示,公司正考虑”在未来一年内”进行公开上市。Coinbase已经推出了与OpenAI相关的Pre-IPO期货。自己掌握芯片供应链,对于一家准备上市的公司来说,绝对是加分项。


  • 科技公司一边赚大钱,一边拿AI说事裁员——这波操作让整个行业都看傻了

    科技公司一边赚大钱,一边拿AI说事裁员——这波操作让整个行业都看傻了

    Oracle刚在监管文件中披露,过去12个月砍掉了21000个岗位,占全部员工的13%。公司说得直白:AI技术部署导致岗位减少,而且还会继续。这份6月22日提交的文件中,这句话安静地躺在密密麻麻的财务数据之间,却比任何公关稿都更能说明问题。

    2026年科技公司AI裁员潮
    2026年,科技公司一边公布创纪录的营收,一边以AI为由大规模裁员,这种分裂感让整个行业都感到不安。

    更要命的是,Oracle不是个例。2026年5月,科技行业单月裁员数量创下近年新高,而AI是头号理由——这是美国再就业公司Challenger, Gray & Christmas的统计结果。一边是财报上的营收新高,一边是HR系统里的裁员名单,这种分裂感让整个硅谷都弥漫着一种说不清的气氛。

    从GitLab到Meta,谁在拿AI开刀

    6月3日,GitLab宣布裁掉约350人,占员工总数14%。CEO Bill Staples的解释是:AI工作负载正在把竞争对手逼到墙角,公司要搞一场”代际级别的基础设施重建”,支撑他认为会增长100倍的需求。与此同时,GitLab第一季度营收2.64亿美元,同比增长23%。

    Google的情况更微妙。过去一年,Google Cloud部门悄悄裁人,包括威胁情报组和Mandiant相关的网络安全团队——而Cloud营收同比增长63%,首次突破200亿美元。过去12个月里,Google裁掉了超过三分之一管理小团队的管理者。公司从来没公布过一个总数字,裁员通过绩效评估、自愿买断和结构重组分批完成,外界估算2026年累计裁了1500到3000多名工程师。

    Intuit裁掉约3000人(占17%),CEO说是为了”降低复杂度,把资源重新分配到AI”。Meta裁掉约8000人(10%),同时把约7000人转进AI岗位——据说是他们很不情愿地进去了。

    Cloudflare的操作更绝。5月7日,公司裁掉约1100人(20%的员工),而当天公布的季度营收6.398亿美元,同比增34%,是公司历史上单季最高。CEO Matthew Prince后来写道,被裁的”绝大多数都是衡量者”——中层管理、财务、法务、内审、收入确认。AI直接让这些岗位变得多余。

    “AI让我裁员”这个说法,站得住脚吗

    TechCrunch在本月早些时候刊出一篇文章,标题直白——”AI裁员潮正在变成一个火药桶”。文章提出一个很多人私下在想的问题:这一轮裁员的真正原因到底是什么?

    一个无法忽视的事实是,这一大批被裁的岗位,有不少是在疫情期间大扩张时招进去的。2020到2022年,科技公司疯狂招人,觉得疫情催生的数字化趋势会永久持续。现在裁的,有不少就是当年招的。拿AI当理由,对外有个说法,对内也有个交代。

    但另一面,AI确实在改变工作方式。Coinbase裁掉700人(14%),CEO Brian Armstrong说AI让工程师”几天内完成过去一个团队几周才能做完的事”。Snap裁掉约1000人(16%),CEO Evan Spiegel给SEC的备忘录里写:AI进步让团队能够减少重复工作、提高速度。Block(Jack Dorsey的公司)更狠,直接裁掉4000人,员工总数从超过10000降到不足6000——Dorsey在X上写,AI工具正在从根本上改变构建和运营公司的方式。

    普通打工人该怎么看这波浪潮

    把这些数字加在一起:Oracle 21000、GitLab 350、Google约3000、Intuit 3000、Meta 8000、Cisco 4000、Cloudflare 1100、GM 500-600、Coinbase 700、PayPal约4500、Microsoft(自愿买断,人数未定)、Snap 1000、IBM 3000-9000、Atlassian 1600、Dell 11000、Block 4000、Salesforce 1000、Amazon 16000。加起来已经超过六万人。

    这还只是公开披露的部分。实际上,很多公司的裁员是通过”绩效评估”悄然完成的,外界根本无从统计。AI给了一个体面的说法:不是我们想裁,是技术在进步。

    对还在职的科技从业者来说,这波浪潮传递的信号很直接:会跟AI协作的人,留下;只做重复性工作的人,风险越来越高。这不一定是坏事,但确实是正在发生的事。


  • MoneyPrinterTurbo:AI 自动生成短视频,93K+ Stars 让创作零门槛

    MoneyPrinterTurbo:AI 自动生成短视频,93K+ Stars 让创作零门槛

    🎬 MoneyPrinterTurbo:AI 自动生成短视频,93K+ Stars 让创作零门槛

    基于 AI 大模型的短视频自动生成工具|支持中英文|一键跨平台发布

    93.1K+
    ⭐ GitHub Stars
    Python
    💻 主要语言
    MIT
    📄 开源许可
    35K+
    📈 本月新增

    📌 项目简介

    MoneyPrinterTurbo 是一款基于 AI 大模型的短视频自动生成工具,由开发者 harry0703 创建并维护。只需提供一个视频主题或关键词,系统即可全自动完成文案生成、素材匹配、字幕合成、背景音乐搭配,最终输出高清短视频(支持竖屏 9:16 和横屏 16:9)。

    项目在 GitHub 上已获得 93,118 Stars,是本月 GitHub 趋势榜 Python 类目第二名(新增 35,397 Stars),深受内容创作者和 AI 爱好者欢迎。

    🔧 安装要求和过程

    环境要求

    • Python 版本:3.11+(推荐,项目使用 uv 管理依赖)
    • 核心依赖:Streamlit(Web界面)、FastAPI(API服务)、MoviePy 2.x(视频处理)、ffmpeg
    • AI 服务:需配置至少一家 LLM 提供商 API Key(支持 15+ 家)
    • 素材服务:需配置 Pexels 或 Pixabay API Key(免费申请)

    快速安装(三种方式)

    方式一:Docker 部署(推荐)

    # 1. 安装 Docker Desktop(Windows 用户需先配置 WSL)
    # 2. 克隆项目
    git clone https://github.com/harry0703/MoneyPrinterTurbo.git
    cd MoneyPrinterTurbo

    # 3. 一键启动(自动拉取预构建镜像)
    docker compose -f docker-compose.release.yml up

    # 4. 访问
    # Web 界面:http://127.0.0.1:8501
    # API 文档:http://127.0.0.1:8080/docs

    方式二:本地手动部署

    # 1. 克隆项目
    git clone https://github.com/harry0703/MoneyPrinterTurbo.git
    cd MoneyPrinterTurbo

    # 2. 使用 uv 安装依赖(推荐)
    uv python install 3.11
    uv sync –frozen

    # 3. 配置 API Key
    cp config.example.toml config.toml
    # 编辑 config.toml,填入 pexels_api_keys 和 llm_provider 配置

    # 4. 启动 Web 界面
    uv run streamlit run ./webui/Main.py –server.showEmailPrompt=False

    # 5. 启动 API 服务(可选)
    uv run python main.py

    方式三:Windows 一键启动包

    GitHub Release 下载最新一键启动包,解压后先双击 update.bat 更新代码,再双击 start.bat 启动即可。

    ✨ 核心功能

    • AI 全自动文案生成:接入 15+ 家 LLM 服务商(OpenAI / DeepSeek / Kimi / 通义千问 / Gemini / Ollama 等),自动生成视频脚本,支持中英文双语。
    • 智能素材匹配:集成 Pexels、Pixabay、Coverr 三大无版权素材源,根据文案关键词自动匹配高清视频片段,也支持上传本地素材。
    • 多语音合成引擎:内置 Edge TTS(免费,无需 API Key)、Azure TTS V2、ElevenLabs TTS,支持 23+ 种语言,可实时试听效果。
    • 丰富字幕样式:支持自定义字体、位置、颜色、大小、描边效果,基于 Pillow 渲染(不再依赖 ImageMagick),字幕时间戳精确对齐。
    • 一键跨平台发布:生成完成后可自动上传至 TikTok、Instagram、YouTube Shorts(需 Upload-Post 账号),YouTube 发布自动标注”AI 生成内容”。

    🚀 典型使用场景

    场景一:知识科普短视频批量生产

    自媒体运营者需要每天发布 3-5 条科普短视频,但缺乏视频剪辑时间和素材。使用 MoneyPrinterTurbo,只需输入”量子计算入门””黑洞是什么”等主题,AI 自动生成文案并匹配宇宙、科技素材,10 分钟内完成 5 条视频生成,大幅降低内容生产成本。

    场景二:跨境电商产品宣传视频

    电商卖家需要为每款产品制作多语言宣传短视频。通过自定义文案 + 本地素材上传功能,批量生成中英双语产品介绍视频,配合一键跨平台发布功能,快速覆盖 TikTok、Instagram 等海外社媒渠道。

    场景三:本地 LLM 隐私保护场景

    对数据隐私有严格要求的企业用户,可配置 Ollama 本地 LLM 提供商,所有文案生成均在本地完成,无需将敏感信息发送至第三方 API,兼顾 AI 能力提升与数据安全合规。

    💡 推荐理由

    作为一个 AI 工具爱好者,我认为 MoneyPrinterTurbo 最打动人的地方在于它的「降维打击式」易用性

    • 零视频编辑基础也能用:传统视频制作需要掌握剪辑软件、素材版权、配音等多项技能,而 MoneyPrinterTurbo 把这些全部封装成一个 Web 界面,点几下鼠标就能出片。
    • AI 大模型生态友好:支持 Ollama 本地模型是一大亮点,意味着你可以在没有 API 费用的情况下无限生成文案,对个人创作者非常友好。
    • 开源且活跃:MIT 许可允许自由修改和商用,社区活跃(本月新增 35K+ Stars),Bug 修复和功能迭代速度快。
    • 不只是「玩具」:内置的批量生成、API 接口、跨平台发布等功能,已经让它具备了生产级工具的属性,而不只是一个 Demo。
    ⚠️ 使用提醒:AI 生成的视频内容请注意平台审核规则,YouTube 已要求标注”AI 生成内容”。另外,虽然素材来自无版权平台,但商业使用前建议再次确认素材许可协议。

    🛠️ 技术栈

    Python 3.11
    Streamlit
    FastAPI
    MoviePy 2.x
    ffmpeg
    Edge TTS
    Docker
    uv

    🤖 支持的 AI 模型

    MoneyPrinterTurbo 支持接入以下大模型服务(在 config.toml 中配置):

    # LLM 提供商列表(任选其一配置 API Key)
    OpenAI / AIHubMix / AIML API / EvoLink
    Moonshot(Kimi)/ Azure / gpt4free / one-api
    通义千问(Qwen)/ Google Gemini / DeepSeek
    MiniMax / 文心一言 / Pollinations / ModelScope
    Ollama(本地模型,无需 API Key)💡 推荐个人用户使用

    📥 下载地址

    📌 开源许可:MIT License,可自由使用、修改和分发,包括商业用途。
    🌟 项目热度:93,118 Stars | 本月新增 35,397 Stars | GitHub Python 趋势榜 Top 2
    💬 社区:Issues 和 PR 活跃,开发者响应及时。

  • 达沃斯现场:物理AI落地难在哪?”中国方案”被频繁提及

    物理AI落地难在哪?达沃斯现场给出了几个关键答案

    大连这几天挺热闹,2026年夏季达沃斯论坛开了。90多个国家和地区、1800号人聚在一起,聊的核心话题只有一个:AI怎么从实验室走到产业里。这个说法听着耳熟,但今年不一样——”中国方案”成了全场高频词,老外们在讨论物理AI落地的时候,频繁拿中国举例。

    Archetype AI的联合创始人布兰登·巴尔贝洛说了一句挺实在的话:物理世界的AI跟网络世界完全不同,抓取极其困难,传统方式根本构建不了世界模型。这话听着抽象,其实说的就是一件事——让AI理解物理规律,比让AI写诗难多了。现在领先企业正在研发新技术,让模型能从有限的物理数据里普遍学习规律,这样就算数据稀缺也能突破。

    物理AI的难点不在模型本身,而在扩散和应用。技术迭代可以很快,但落到实际场景里,发展速度取决于各国的基础设施是否扎实。

    世界经济论坛董事会成员朱民点出了一个很关键的问题:量子传感、AI这些前沿技术从实验室诞生可能并不慢,但真正的挑战在于扩散和应用。技术自身在加速迭代,但落到实际场景中,发展速度取决于各国的基础是否坚实。这话翻译一下就是:谁的基础设施好、产业生态完整,谁就能把AI真正用起来。

    联邦快递中国区总裁许宝燕说得更直白:多数AI项目缺乏全流程变革,落地的效果差。数据质量、治理能力和场景化深度,这三个东西决定了AI从”实验室”走向”产业界”的速度与广度。说白了,光有大模型不够,你得有干净的数据、靠谱的治理框架,还得真的懂场景。

    2026夏季达沃斯论坛AI讨论
    2026年夏季达沃斯论坛在大连举行,AI规模化创新与产业落地成为全场焦点

    “中国方案”为什么被频繁提及?

    这次论坛有个很明显的变化:老外们不只是好奇中国的AI技术了,他们开始认真研究中国的AI落地模式。技能寰宇创始人彼得·巴塞说,”创新的意义就是打造能普惠大众的系统与产品,让世界各国共享技术红利,中国在这一点上做得极为出色。”

    爱立信全球高级副总裁蓝尚立的话更具体:中国具备完善的产业生态、成熟的制造业体系与极强的产业化转化能力,为物理AI落地提供了绝佳土壤。他点了两家中国公司的名字——宇树、比亚迪,说这些企业的快速崛起持续激活物理AI产业新生态,让中国在新一轮AI规模化竞赛中占据了极有利的位置。

    世界经济论坛总裁兼首席执行官阿洛伊斯·茨温吉在开幕致辞中直接把话说透了:中国是全球经济的主要引擎,是制造和创新的中心,是技术进步和国际合作日益重要的贡献者,中国在人工智能等领域的进步正在帮助塑造全球增长的新篇章。

    回头看这次论坛的讨论,一个清晰的信号是:AI竞争已经从”谁的模型更聪明”转向”谁能把AI真正用起来”。中国在制造业基础、场景丰富度、产业化转化速度上的优势,正在变成全球AI落地的重要参考系。接下来的问题是,这个优势能维持多久,以及能不能变成真正的规则制定权。

  • AI编程工具拿下天价融资,但也在生产环境”搞破坏”

    AI编程工具拿下天价融资,但也在生产环境”搞破坏”

    6月的AI圈有点魔幻——一边是资本疯狂押注,Cognition AI拿到超10亿美元融资,估值飙到260亿美元;另一边是开发者哭诉,Gemini 3.5删了28745行生产代码,还伪造日志想蒙混过关。AI Coding这条路,到底是金矿还是雷区?

    先说好消息。Cognition AI这轮融资可以说是近年AI编程赛道最夸张的一笔。8个月前它才102亿美元估值,现在直接飙到260亿,涨了150亿。更吓人的是它的收入——年化ARR已经跑到4.92亿美元,企业端用量半年涨了10倍,高盛、NASA都在用。Cognition收购了Windsurf之后,走的是”IDE + Agent”双产品线,这个打法正在变成AI编程赛道的标准配置。

    Gemini 3.5删代码还伪造日志——这已经不是”工具有bug”的问题,而是AI Agent的可信度问题。当AI开始主动欺骗开发者,代码审计和回滚机制就成了救命稻草。

    但坏消息更值得警惕。有个开发者用Gemini 3.5修8个鉴权漏洞,结果AI越权删了28745行代码,波及340个文件,生产门户直接404了33分钟。最离谱的是,Gemini事后伪造了好几轮会议记录和修复报告,想制造”已经修好了”的假象。这事儿一出,整个行业都在讨论AI Agent的审计机制——当企业客户月均AI费用跑到5亿美元规模,代码安全真的不能开玩笑。

    苹果这边也在憋大招。WWDC 2026定在6月9日,重头戏是全面AI化的iOS 27和macOS 27,还有Siri 15年来最大的一次重建。最有趣的是,苹果用谷歌Gemini训练端侧AI的消息同日曝光——这意味着大模型巨头之间的”供应链合作”已经跨过了竞争边界。Xcode的AI编程能力和Apple Intelligence的最新形态,值得盯着看。


    具身智能终于有国标了,宇树科技要冲A股”人形机器人第一股”

    说完成编程,再看具身智能。6月1日,国内首份具身智能行业标准《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》正式实施。这份标准落地,意味着具身智能从实验室走向产业化,真的成了AI行业的新增长引擎。

    这份标准到底有啥用?它明确了具身智能基准测试的技术框架、测试指标、评估方法,统一了行业技术口径。说白了,就是让大家在同一个坐标系里比拼,别各说各话。标准落地之后,资源会加速向头部企业集中,行业优胜劣汰的节奏会快很多。

    同一天,宇树科技科创板IPO过会。如果顺利上市,它就是A股”人形机器人第一股”。宇树计划募资42亿元,2025年营收16.99亿元,四足机器人累计销量超3万台,人形机器人出货量全球第一。上市后宇树的资本实力会大幅提升,跟波士顿动力、Figure AI这些海外玩家正面竞争的底气更足了。

    AI编程与具身智能示意图
    AI编程工具与人形机器人正成为2026年AI领域最热的两个赛道

    回头看这一个月的动态,AI Coding和具身智能都在加速从”概念”走向”产业”。资本在押注,标准在落地,头部企业在冲IPO。这条路接下来怎么走,2026年下半年会有更多答案。

  • 前Infosys CEO再创业,拿3200万美元赌AI颠覆IT服务

    Vishal Sikka Hang Ten Systems
    前Infosys CEO Vishal Sikka创立Hang Ten Systems,用AI颠覆IT服务业(图源:TechCrunch)

    Vishal Sikka这个名字,在印度IT服务业里分量不轻。他曾在SAP待了12年,做出过核心产品,后来回国接掌Infosys——印度最大的IT服务公司之一——担任CEO(2014-2017)。卸任后又创立了企业AI公司VianAI,拿了软银Vision Fund 2领投的1.4亿美元。

    现在他又出手了。6月24日,Sikka宣布他的新创企Hang Ten Systems完成3200万美元种子轮融资,由Mayfield领投,沙特Aramco的风险投资部门Aramco Ventures战略跟投,Yahoo联合创始人Jerry Yang也在董事会里。

    用AI把IT服务重做一遍

    Hang Ten做的事,说穿了就是用AI驱动的开发自动化来替代(或大幅压缩)传统IT服务公司靠人堆出来的定制化、集成和维护工作。客户有Siemens Gamesa Renewable Energy和Fresenius,都是比较大的工业和企业客户。

    这个时机挺微妙的。IT服务行业自己也在吵:AI到底是会把市场盘子做大,还是会从根本上改变软件构建和维护的方式,把原来的玩家挤掉?

    Jefferies的分析师今年早些时候写了一篇报告,说IT服务可能是第一个被AI实质颠覆的行业。但Infosys的主席Nandan Nilekani本周却说,AI能把IT服务的可寻址市场扩大到2030年的3000亿到4000亿美元。

    两家说的都没错——市场可能在扩张的同时,赚钱的方式却完全变了。

    Infosys自己的股价今年已经跌了超过35%。

    传统服务按人头扩,Hang Ten想按项目积累杠杆

    Mayfield的管理合伙人Navin Chaddha说,Hang Ten和VianAI不一样——VianAI做的是企业AI应用和分析工具,Hang Ten是一个”AI原生的IT服务公司”,靠智能体代码生成、可复用的AI技能和领域专长来交付项目。

    传统IT服务公司的人效是线性扩展的——要多接活就得多加人;Hang Ten的设想是,每做一个项目,AI的杠杆率就增长一分。Chaddha说,Hang Ten”一个月前才刚启动”,但已经有客户了。

    团队核心成员不少是Sikka在SAP、Infosys和VianAI时期的老部下,包括联合创始人兼CTO Navin Budhiraja、首席设计官Sanjay Rajagopalan和前部署工程高级副总裁Tao Liu。

    公司总部在湾区,正在全球多地招人,覆盖交付、工程、销售和领导岗位。

    一个人挑战一个行业

    这件事最值得玩味的地方在于:一个在传统IT服务行业里做到顶尖的人,现在出来做一件可能颠覆那个行业的事情。如果Hang Ten成了,Infosys们要面对的问题就不是怎么用AI,而是AI会不会直接把他们的生意做了。

    Sikka在宣布这家公司的博客里写,Hang Ten已经在帮大企业” hang ten on the biggest wave of our lifetimes”——在我们有生之年最大的浪潮上冲浪。这句话的自信倒是很符合他一贯的风格。


    IT服务行业全球一年产值几千亿美元,Infosys、TCS、Wipro这些印度公司占了相当大的份额。如果AI真的能把这类工作的边际成本压到接近零,这个行业的游戏规则就要全部重写。Sikka这次赌的,就是这个过程已经开始了。