标签: AI

  • 贝索斯悄悄砸了120亿美元,这次不是火箭也不是电商

    杰夫·贝索斯又出手了,这次不是蓝色起源,也不是亚马逊——他和谷歌Verily前联合创始人维克拉姆·巴贾吉一起,搞了一家叫Prometheus的物理AI公司,刚宣布完成120亿美元融资,投后估值410亿美元。

    Jeff Bezos Prometheus AI
    杰夫·贝索斯的新赌注:用AI替代大部分工程工作(图源:Getty Images)

    这公司要做的事情听起来很宏大:打造所谓的”通用人工智能工程师”——一套能自动化复杂物理系统设计制造的软件,小到药物化合物,大到喷气发动机,都归它管。

    贝索斯的AI就业观:短缺,不是失业

    贝索斯对AI的看法跟硅谷很多人大不一样。当其他AI大佬在警告AI会导致大规模失业的时候,他说的是另一套:AI提升生产力之后,经济会出现劳动力短缺——双职工家庭可能变回单职工,加班的人也不用再加了。

    “经济的显著生产力提升将提高生活水平。如今的双职工家庭将变成单职工家庭,一些加班的人或许就不再需要加班了。”——杰夫·贝索斯

    这轮融资的投资方名单很长:贝索斯本人、摩根大通、高盛、贝莱德都在里面。去年底Prometheus才完成62亿美元的首轮融资,不到一年又来了120亿,而且大部分钱要拿去满足算力需求。

    物理AI,下一个防御性赛道?

    公司目前在旧金山、伦敦和苏黎世设有办公室,150名员工,具体产品细节还没披露。但可以肯定的是,这是目前为止物理AI领域最大的一笔单轮押注。

    风险投资人对物理AI的兴趣正在快速升温——跟纯软件AI相比,物理世界的属性天然构成了更高的防御壁垒,这也是为什么Prometheus能以410亿美元估值拿到这么多钱的核心逻辑。


  • 【开源推荐】CopilotKit:34.8K+ Stars!面向AI Agent与生成式UI的前端技术栈

    【开源推荐】CopilotKit:34.8K+ Stars!面向AI Agent与生成式UI的前端技术栈

    ⭐ GitHub 34.8K+ Stars · MIT 开源

    CopilotKit

    The Frontend Stack for Agents & Generative UI

    📌 项目简介

    CopilotKit 是专为 AI Agent生成式 UI 打造的前端技术栈,支持 React、Next.js、Angular、Vue、React Native 及 Slack 等多端场景。它不仅是 SDK,更是 AG-UI 协议 的发起方,已被 Google、LangChain、AWS、Microsoft 等主流厂商采用。

    🚀 核心功能

    ① 全场景聊天 UI

    完全可定制的聊天界面组件,支持消息流式传输、工具调用可视化、Agent 响应实时渲染,接入仅需几行代码。

    ② 生成式 UI(Generative UI)

    Agent 可在运行时根据用户意图动态生成、更新 UI 组件,支持三种模式:静态模式(AG-UI 协议)、声明式模式(A2UI)、开放式模式(MCP Apps)。

    ③ 共享状态层

    Agent 和 UI 组件可同时读写同一份状态,实现真正的双向交互——UI 可以驱动 Agent,Agent 也可以更新 UI。

    ④ 人在回路(Human-in-the-Loop)

    Agent 执行过程中可暂停,等待用户确认、修改输入后再继续,确保关键操作始终在人的掌控之下。

    ⑤ 自学习 Agent(Beta)

    基于人类反馈的持续学习(CLHF)能力,无需微调模型即可通过用户交互自动优化行为,支持按用户偏好个性化适配。

    ⚙️ 安装要求与步骤

    环境要求

    • Node.js 18+(React/Next.js 项目)
    • 一个 LLM API Key(OpenAI / Anthropic / Gemini 等)
    • 现有前端项目或新建 Next.js 项目

    ① 快速初始化项目(5分钟内启动)

    npx copilotkit@latest create

    按提示输入 LLM 密钥,自动完成项目脚手架搭建。

    ② 安装 Agent 技能包(支持 Claude Code / Cursor / Codex)

    npx copilotkit@latest skills install

    可重复运行,随时更新到最新版技能包。

    💡 典型使用场景

    🤖

    AI 聊天助手集成

    为现有 SaaS 产品嵌入智能聊天界面,支持流式输出和工具调用展示,用户体验媲美 ChatGPT。

    📊

    动态数据仪表盘

    Agent 根据用户问题动态生成图表和可视化组件,用户可与生成的内容实时交互。

    🔄

    跨平台 Agent 应用

    同一套 Agent 后端同时支持 Web、移动端和 Slack,无需重复开发,大幅降低维护成本。

    🌐 AG-UI 协议:Agent 与原生 UI 的桥梁

    CopilotKit 是 AG-UI 协议的发起方。该协议定义了 Agent 与工作流如何与用户端应用无缝连接,已被 Google、LangChain、AWS、Microsoft、Mastra、PydanticAI 等主流厂商采用。

    npx create-ag-ui-app my-agent-app

    ✨ 推荐理由

    如果你正在开发 AI Agent 产品,CopilotKit 几乎是前端层的最佳选择。它解决了 Agent 与 UI 之间的核心痛点——如何让 LLM 的推理过程优雅地呈现在用户界面上。

    最打动我的是它的 生成式 UI 能力:Agent 不再只能返回文字,而是可以动态生成真正可交互的 UI 组件。结合 AG-UI 协议,你的 Agent 可以无缝对接任意前端框架。

    另外,CopilotKit 对 人在回路 的支持也非常完善,这对于企业级应用场景至关重要——让 AI 处理繁琐操作,关键决策点由人确认,既提高效率又保障安全。

    适合人群:AI 产品前端开发者、SaaS 创业者、企业数字化转型团队。

  • 亚马逊首次披露数据中心用水量:一年25亿加仑,AI烧的不只是电

    亚马逊首次披露数据中心用水量:一年25亿加仑,AI烧的不只是电

    AI数据中心的水电消耗问题,最近几个月一直是舆论焦点。西雅图刚通过了一年的数据中心建设暂停令,亚马逊自己的员工也站出来支持这项禁令。就在这个节骨眼上,亚马逊第一次对外公布了它的年度用水数据。

    亚马逊数据中心
    亚马逊首次公开数据中心用水数据,引发行业热议 | 图片来源:The Verge

    数字是这样的:2025年,亚马逊全球数据中心总共消耗了25亿加仑水,换算过来大约是每千瓦时电力消耗0.12升水。这个数字比2024年下降了2%——注意,这是在亚马逊持续扩张运营规模的背景下实现的。

    亚马逊说自己比竞争对手更省水

    亚马逊在报告里放了一张对比图,显示微软、谷歌和Meta每千瓦时用水都比自己多。看上去确实不错,但细看就会发现比较方式有点取巧——谷歌的数据只涵盖了Gemini AI专用数据中心,而亚马逊报的是全部运营数据。

    更关键的是,亚马逊的数据没有把发电厂间接消耗的用水量算进去。数据中心用的电,发电过程本身也要消耗大量水。如果把这个因素考虑进来,真实的用水数字可能会大不少。

    那么亚马逊的数据中心到底是怎么降温的?根据报告,90%的时间里,亚马逊数据中心使用风冷散热,只有在”一年中最热的那些天的那几个小时”才会启用蒸发式水冷。同时,亚马逊还提高了服务器能承受的工作温度上限,减少不必要的冷却。

    亚马逊声称,自己的数据中心用水效率是行业平均水平的7倍。这个数字来自一篇去年发布的同行评审论文,亚马逊对它做了一些调整。至于调整得合不合理,外界暂时还没法验证——毕竟这是亚马逊第一次公布用水数据,独立研究人员还没有机会仔细审查。

    为什么用水数据这么敏感

    训练一个大语言模型需要多少水?这个问题过去几年被不少研究人员算过,答案因计算方法而异,但方向是一致的:AI的规模越大,消耗的水和电就越多。随着微软、谷歌、Meta、亚马逊纷纷加码AI基础设施投资,数据中心的建设速度已经超出了许多社区的承受能力。

    西雅图的数据中心暂停令就是一个信号。当地居民和环保团体担心,数据中心的密集建设会对区域水资源和电力供应造成过大压力。亚马逊员工公开支持这项暂停令,也说明公司内部的环保意识在上升。

    亚马逊选择在这个时候公布用水数据,时机颇为微妙。可以解读为透明的姿态,也可以解读为在监管压力来临之前主动出击、抢占叙事。不管动机如何,这些数据至少让外界第一次有机会对大科技公司的水资源消耗做一个粗略的横向比较。接下来,微软、谷歌和Meta会不会也跟着公布更详细的数据?值得关注。


  • Spotify联手环球音乐,让粉丝用AI翻唱歌曲

    Spotify联手环球音乐,让粉丝用AI翻唱歌曲

    AI音乐生成工具Suno和Udio过去两年一直走在灰色地带——它们用大量 copyrighted 音乐训练模型,让用户生成翻唱和混音,然后被各大唱片公司轮番起诉。现在,Spotify打算做一件不一样的事:先拿到授权,再让粉丝玩AI翻唱。

    Spotify应用图标
    Spotify宣布与环球音乐达成AI翻唱授权协议 | 图片来源:Getty Images

    5月21日,Spotify宣布与环球音乐集团(UMG)达成合作协议,允许粉丝使用生成式AI技术对自己喜欢的歌曲进行翻唱和混音制作。这个功能将作为一个付费插件,仅向Spotify Premium订阅用户开放,参与项目的艺术家将从中获得收入分成。

    “先征得同意,而不是先做了再道歉”

    这句话是Spotify去年预告AI音乐计划时说的,明眼人一看就知道在讽刺谁。被讽刺的对象正是Suno和Udio——这两家AI音乐生成工具的先驱者,在没有任何授权的情况下就用唱片公司的音乐训练模型,然后被三大唱片公司轮番告上法庭。

    Suno去年底以5亿美元与华纳音乐集团达成和解,Udio也先后与华纳和环球达成和解,但两家公司至今仍在应对来自环球音乐、索尼音乐等多方的版权诉讼。

    Spotify的路径截然不同。它直接去找唱片公司谈,拿到授权再做产品。环球音乐董事长兼CEO Lucian Grainge在声明中表示,这项合作能让艺术家与粉丝建立更深层次的联系,同时创造额外的收入机会。目前尚不清楚有哪些环球旗下的艺术家同意参与这个项目。

    Spotify的AI大扩张

    AI翻唱工具只是Spotify本周投资者日发布的众多AI功能之一。同期亮相的还有:基于ElevenLabs的AI有声书创作工具、面向播客制作者的AI问答和摘要生成功能、用于制作个人播客的桌面应用,以及为顶级粉丝预留演唱会门票的粉丝 engagement 功能。

    这一系列动作释放出明确信号:Spotify不打算让Suno和Udio独吞AI音乐生成市场。它手里握着全球最大的音乐用户群体,又有唱片公司的正式授权,这场竞争的天平正在发生倾斜。

    对于普通用户来说,能用AI翻唱自己喜欢的歌当然是个有趣的玩法。但真正值得关注的是这套商业模式:艺术家自愿参与、平台负责授权、收入按比例分成。如果这条路走通了,Suno和Udio那些还在打官司的案子,可能就彻底失去了意义——谁还会用一个随时可能被封禁的灰色工具,当有合法的替代品摆在面前的时候?


  • OpenAI、Anthropic、DeepMind罕见联手,致信国会要求严管合成DNA

    AI圈里难得见到OpenAI、Anthropic和DeepMind坐到同一张桌子上。这次它们没有在比谁的模型强,而是联名写了一封信给美国国会,说的是一件听起来有点远、但细想挺吓人的事:用AI设计新型病原体,然后通过商业渠道合成DNA。

    AI生物安全
    AI安全警示(资料图)

    致信的三个人分别是OpenAI的Sam Altman、Anthropic的Dario Amodei,以及Google DeepMind的Demis Hassabis。微软AI负责人Mustafa Suleyman和Meta首席AI官Alexandr Wang也签了名。这份信由智库”进步研究所”和”美国创新基金会”牵头协调,算是业界一次比较罕见的集体发声。

    AI降低了什么门槛?

    信里的核心逻辑其实不难理解。过去,要设计一种危险的新型病原体,你需要多年的分子生物学训练,还要能接触到专业的实验设备和试剂,这些天然形成了很高的知识壁垒。

    但现在AI模型在科学和医学领域的能力一直在涨。一个有一定技术背景的人,理论上可以用AI辅助设计序列,然后去找商业基因合成服务商下单,让他们把这段DNA做出来。现有的筛查机制主要针对已知的危险序列,对AI设计出来的全新序列,覆盖面是不够的。

    联署人在信里写得很直白:AI工具可能被用于设计新型病原体,并指导用户绕过生物安全筛查。这话不是危言耸听,而是对现有技术能力的一个冷静评估。

    行政命令不够用

    白宫之前签过一份行政命令,涉及AI对生物安全的潜在风险。但联署人认为,行政命令的约束范围有限,下一任总统上台完全可以推翻重来。只有国会立法,才能确立一个硬性的、跨政府的监管门槛。

    他们要求的具体措施是:强制基因合成服务商在接单时筛查序列,同时核验客户身份。这个要求在技术层面并不难实现,基因合成行业本身也有自律规范,但一直没有法律层面的硬性要求,这就留下了空白。

    为什么是现在?

    这个问题值得问。AI能力不是一天两天涨上来的,为什么偏偏在2026年中期,三家竞争对手选择联手致信国会?

    一个可能的解释是,模型能力正在跨过一个临界点。过去大家讨论AI风险,更多是理论层面的;现在有人开始认真评估”如果有人真的用AI干了坏事怎么办”。特别是生物安全这个方向,一旦出事,代价不是赔钱能解决的。

    另一个角度,这三家公司主动出来推动监管,某种程度上也是在抢占”负责任的AI公司”这个叙事。在监管即将到来的时候,做规则制定的参与者,比做被动的遵守者要主动得多。

    立法会顺利吗?

    美国国会的立法效率,懂的都懂。这份信能不能真的推动立法,还要看多方博弈的结果。基因合成行业可能会支持,因为合规成本相对可控;但也会有人拿”创新阻碍”和”政府过度监管”来说事。

    更大的背景是,AI监管的整体走向在美国仍然不明朗。一边是业界呼吁”管一管生物安全”,另一边是”别管太多、别拖慢创新”的声音。这次三家公司的联名信,至少让生物安全这个细分方向,进入了更多决策者的视野。

    不管立法结果如何,AI公司和生物安全之间的这条线,已经被画出来了。以后类似的风险预警,估计会越来越频繁。


  • OpenAI秘密递交上市申请,AI双雄IPO竞速正式打响

    OpenAI本周悄悄向美国SEC提交了IPO申请,把”上市”这件事从传闻变成了实锤。这家公司过去一年半载都在各种场合暗示”我们会上市”,但一直没给出明确时间表,现在看来是坐不住了。

    OpenAI IPO
    OpenAI总部(资料图)

    有意思的是,Anthropic上周也刚递了上市材料。两家公司的IPO竞速,就这样毫无预兆地拉开了帷幕。

    高盛和摩根士丹利已经进场

    据彭博社援引知情人士消息,OpenAI已经拉着高盛和摩根士丹利在忙活了,目标是最快今年秋季完成上市。不过公司官方的话说得留有余地:”有些事在私有状态下更好办,上市这事我们还在权衡,可能需要一段时间。”

    翻译一下就是:文件递了,但别催,我们在看风向。

    还有一个细节值得注意。OpenAI计划在上市前几周启动一轮股票回购,给员工提供流动性。这说明公司手里是有钱的,回购不是问题,关键是把员工利益理顺,别让IPO变成内部矛盾爆发的导火索。

    Anthropic抢先了一步

    Anthropic上周递交IPO申请的时候,估值已经跳到了9650亿美元——这个数字第一次超过了OpenAI。而且Anthropic的收入增速也很猛,最新一轮私募融资里拿到的估值,直接把OpenAI挤到了第二的位置。

    两家公司的节奏现在完全错位了。Anthropic是先私募估值压过OpenAI,再抢先递表;OpenAI则是直接走IPO流程,试图用公开市场的溢价把估值追回来。

    这里面有一个微妙的变化:AI赛道里的公司,过去比的是谁的模型强、谁的用户多,现在开始比谁先上市、谁在公开市场上更值钱。融资竞赛已经从私募市场烧到了公开市场。

    OpenAI的压力比想象中大

    表面上看,OpenAI还是AI的代名词,ChatGPT的月活和数据摆在那里,没人能否认它的地位。但公司内部的问题,外界知道的可能只是一部分。

    据报道,OpenAI有几次内部的收入和用户增长目标没达到。多位核心高管过去一年离职或者退居二线,产品线也在不断收缩和整合。Anthropic的Claude在编程场景里抢走了一大块用户,Google的Gemini则在多模态上紧咬不放。

    IPO某种程度上是一次”强制体检”。所有财务数据、风险因素、竞争格局,都要摊开给监管机构和公众看。这对OpenAI来说,既是融资的机会,也是压力测试的关口。

    马斯克又多了一个对手

    如果OpenAI真的在今年上市,奥特曼和马斯克之间的较量就又多了一个维度。SpaceX计划本周上市,估值约1.8万亿美元;OpenAI单轮融资就拿了1220亿美元,估值8520亿美元,在融资额上已经超过了SpaceX的IPO募资规模。

    这两人之间的恩怨从OpenAI的创立一路延续到现在,诉讼、口水战、理念分歧,样样不落。现在连上市都要撞在一起,也算是某种宿命感。

    钱去哪儿了?

    各大AI公司现在都在拼命囤钱,名义是买芯片、建数据中心、训练下一代模型。OpenAI今年2月跟投资者说,公司计划到2030年在AI基础设施上投入大约6000亿美元。

    6000亿美元是什么概念?相当于每年要花1000多亿美元在算力上。这个数字已经不是一家科技公司正常的资本支出了,而是一个国家级的基建计划。IPO能帮OpenAI补上这个资金缺口,也可能让外界更清楚地看到,这场AI竞赛的真实成本到底有多高。


  • 亚马逊借了175亿美元搞AI,这笔钱能烧多久?

    亚马逊借了175亿美元搞AI,这笔钱能烧多久?

    亚马逊刚刚从银行拿到了175亿美元贷款。这个数字是什么概念?相当于一个中等国家的GDP,或者大约1200亿人民币。而亚马逊拿这笔钱的用途只有一个:砸进AI里。

    这不是亚马逊第一次为AI借钱。就在拿到这笔贷款前不久,亚马逊刚在加拿大发了一笔债券,规模大到创了加拿大企业债券发行的历史纪录。两笔融资加起来,亚马逊正在为它的AI野心准备一个巨大的资金池。

    亚马逊AI基础设施
    亚马逊在北弗吉尼亚的AI数据中心(图源:Pymnts)

    2000亿美元要花在哪里

    亚马逊2026年的资本支出预算是2000亿美元。比2025年的1318亿美元猛增了超过50%。这笔钱主要流向两个方向:AWS数据中心扩建,以及AI算力基础设施。

    你能想象2000亿美元堆在一起是什么样子吗?这笔钱可以买下大约40艘航空母舰,或者建造200个大型国际机场。而亚马逊计划把它全部投进服务器、GPU、数据中心和电力设施里。

    亚马逊CEO安迪·贾西在最新一季财报电话会上说得很直白:”我们正在尽可能快地安装产能,把产能变成收入。”翻译一下就是:钱先砸进去,后面再想办法赚回来。

    亚马逊2025年第四季度AWS营收同比增长24%,是近13个季度以来的最高增速。云业务还在涨,但钱也确实在往里砸。

    不是亚马逊一家在借,整个科技圈都在举债

    如果你觉得亚马逊借175亿美元很多,那你可能没看过整个科技行业的账单。2026年,亚马逊、Alphabet(谷歌母公司)、微软、Meta这四家公司的资本支出加起来预计会达到7250亿美元。

    7250亿美元。这个数字比很多国家的全年GDP还高。而这些钱,绝大部分都会流向AI。

    为什么大家都在借钱搞AI?因为AI军备竞赛的逻辑很简单:你不砸,别人就砸了;别人砸了,你就落后了;你落后了,之前的投入可能就打水漂了。这个正反馈循环让每家科技公司都不得不往里砸钱,哪怕这意味着公司债务会飙升。

    国际清算银行在2026年3月出了一份报告,说AI投资已经进入了”更危险的阶段”。超大规模云厂商把创纪录比例的经营现金流投进了资本支出,对外部融资的依赖度持续上升。翻译成人话:大家都在透支未来,赌AI能赚回这笔钱。

    这笔钱能换来什么

    亚马逊借钱砸AI,到底能不能赚回来?这个问题现在没有人能给出确定答案。

    乐观的人会说:你看AWS还在高速增长,AI需求只会越来越旺,现在砸的钱,未来会变成持续几十年的现金流。亚马逊现在是全球最大的云服务商,市场份额超过30%,AI浪潮只会让它更赚钱。

    悲观的人会说:2000亿美元砸进去,什么时候能回本?AI现在看起来很热闹,但真正赚大钱的应用还没出现。如果AI的商业化不及预期,亚马逊这笔债可能要还得非常辛苦。

    摩根士丹利的分析师算了一笔账:亚马逊2026年的自由现金流可能会变成负170亿美元。也就是说,经营活动赚的钱,还不够覆盖资本支出的窟窿,需要靠借钱来补。

    这种模式能维持多久?取决于两件事:第一,AWS的增长能不能持续;第二,AI能不能真的变成一门好生意。如果这两件事都发生,亚马逊的债务会变成未来收入的垫脚石;如果没发生,这些债务就是一颗定时炸弹。

    小公司已经玩不起了

    亚马逊这笔175亿美元贷款,给行业释放了一个很清晰的信号:AI的竞争门槛已经高到中小公司玩不起的程度了。

    你想做一个AI创业公司?先准备个几十亿美元的资金储备吧。没有这个体量,你连跟亚马逊、谷歌、微软、Meta竞争的资格都没有。这不是在比谁的产品更好,而是在比谁的融资能力强、谁敢借更多的钱。

    这对创业生态意味着什么?意味着AI领域的创新,会越来越集中在少数几家巨头手里。创业公司要么被收购,要么就专注做细分领域的小生意,再也别想挑战巨头的地位了。

    亚马逊愿意承担这么高的债务,本质上是在押注:AI是未来十年最重要的技术底座,谁先建立起算力优势,谁就能在未来的AI经济里占据最好的位置。这笔赌注有多大?175亿美元,加上之前借的,加上未来还要借的,可能要到上千亿美元的规模。赌赢了,亚马逊会变得更不可替代;赌输了,这笔债务的利息就能压得公司喘不过气。


  • 印度人做视频AI,价格打到国际大厂的二十分之一

    印度人做视频AI,价格打到国际大厂的二十分之一

    你有没有想过,为什么AI视频生成这么贵?用Veo、Kling、Runway这些工具生成几秒钟的视频,每秒收费动辄0.1美元以上,一个月下来账单能让你怀疑人生。但在印度,一群创业者正在用完全不同的思路做这件事。

    班加罗尔的Avataar AI最近推出了一个名为Varya的视频生成模型。他们的定价是每秒0.005美元——换算下来,只有国际主流视频AI模型的二十分之一。如果你用Veo生成一段10秒的视频要花1美元,用Varya只需要花5美分。

    Avataar Varya视频AI生成示例
    Avataar Varya的视频生成界面(图源:TechCrunch)

    不是从零训练,而是站在巨人肩膀上

    Varya并不是从零开始训练的大模型。它的底层基于阿里巴巴开源的Wan 2.2视频生成模型,然后做了一件事——模型蒸馏。

    简单来说,他们把Wan 2.2原本需要50步才能完成的生成流程,压缩到了4步。结果是什么?生成速度提升了10倍。在NVIDIA H200 GPU上,生成一段5秒的720p视频,Wan 2.2需要1230秒(超过20分钟),而Varya只需要45秒。

    这就像你把一辆车的发动机拆了,重新设计了一套更轻量、更高效的动力系统,结果跑得比以前快10倍,油耗还只有以前的二十分之一。

    专门给印度人做的AI,不会把节日搞错

    Varya有个很有意思的特点:它针对印度本土文化做了专项训练。你让它生成一个印度婚礼的场景,它能准确地画出新娘穿的红色纱丽、桌上的糖果摆盘、背景里的彩灯装饰。而用通用的AI视频模型,经常会出现文化刻板印象——比如把印度节日生成得像中东的庆典,或者把印度传统服饰画错。

    “我们的模型能理解印度文化的细微差别,这是通用模型做不到的。”——Avataar AI团队

    这个细节其实很重要。印度有14亿人口,说着22种官方语言,文化多样性极高。一个能真正理解本地文化的AI工具,和那种”差不多就行了”的通用模型,在实际使用中差距巨大。

    为什么要做这么便宜的AI?

    答案很简单:因为印度市场用不起那些昂贵的AI工具。

    印度是一个”视频优先”的市场。普通消费者刷YouTube、Instagram、WhatsApp Status的时间远超阅读文字内容。但对于印度的小企业主、内容创作者、教师来说,每个月花几十美元订阅一个AI视频工具,是一笔不小的开支。

    Avataar的创始人算了一笔账:如果一个印度小企业主每个月想用AI生成50段产品宣传视频,用Veo要花大约300美元(假设每段视频6秒),而用Varya只需要花15美元。这个价格差距,决定了AI视频能不能在印度真正普及。

    而且Avataar还做了一个很聪明的决定:把Varya的模型权重和训练数据完全开源,放在印度政府主办的AI Kosh平台上。任何开发者都可以免费下载、自行部署、根据自己的需求修改模型。这种开放策略在印度AI圈里越来越常见——既然在基础大模型上拼不过美国和中国,那就从应用层和开发者生态入手。

    印度AI的另一种玩法

    Varya的出现,其实反映了印度AI产业的一个有趣转向。过去几年,印度科技圈一直在纠结:我们要不要砸钱做自己的大模型?能不能在AI基础研发上追上美国?

    现在看起来,答案越来越清晰:不必硬刚。印度有庞大的开发者群体、有全球规模最大的IT外包产业、有14亿人口的本地市场需求。基于开源模型做蒸馏优化、针对本地需求做定制化、把价格打到能让普通人也用得起——这条路可能比烧钱训练基础大模型更实际,也更有商业价值。

    Avataar拿到了Peak XV(就是原来的红杉印度)的投资,还入选了印度政府”印度AI使命”计划的扶持名单。这个计划拿出了约12亿美元,专门补贴入选的AI初创企业,给他们提供便宜的GPU算力。政府的逻辑也很清楚:先让一批本土AI公司跑起来,再通过他们带动整个生态。

    Varya现在的体验入口已经在Avataar官网上线,你可以用文字描述想要的视频内容,也可以上传一张参考图让它生成视频。企业客户可以直接对接他们的API。接下来,Avataar计划跟Higgsfield、Adobe Firefly这些视频工具做集成,让Varya嵌入到更多创作者的工作流里。

    印度有14亿人,每年有上千万新人进入劳动力市场,有数千万小企业需要更便宜的营销工具。如果Varya真的能把AI视频的价格打到人人都用得起的程度,它不一定需要跟Veo在正面对决中赢,光是服务好印度这一个市场,就足够撑起一家有价值的公司了。


  • 【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    crawl4ai - LLM友好网页爬虫工具

    crawl4ai – 专为LLM和AI Agent设计的网页爬虫工具 @reference_1@

    📌 项目简介

    crawl4ai 是一款专为LLM和AI Agent设计的开源网页爬虫工具,能将任意网页内容转换为干净的Markdown格式,可直接用于RAG、AI Agent、数据管道等场景,无需依赖任何付费API。

    68.3K+
    GitHub Stars

    Python
    开发语言

    v0.6+
    最新版本

    ⚙️
    安装要求和过程

    环境要求

    • Python ≥ 3.10
    • Playwright(用于异步浏览器控制)
    • 支持 Windows / macOS / Linux

    快速安装(4步搞定)

    # 第1步:安装 crawl4ai
    pip install -U crawl4ai
    # 第2步:配置浏览器依赖
    crawl4ai-setup
    # 第3步:验证安装
    crawl4ai-doctor
    # (可选)如 Playwright 报错,手动安装浏览器
    python -m playwright install chromium

    Docker 部署(生产推荐)

    # 拉取官方镜像
    docker pull unclecode/crawl4ai:latest
    # 启动容器
    docker run -d -p 11235:11235 –name crawl4ai –shm-size=1g unclecode/crawl4ai:latest
    # 访问监控面板
    http://localhost:11235/dashboard


    核心功能

    ① 智能 Markdown 生成

    生成结构清晰、格式准确的干净 Markdown,支持 Fit Markdown 启发式过滤,自动剔除无关噪音内容。支持 BM25 算法过滤,可提取核心信息,更适合 AI 处理。

    ② LLM 驱动的结构化数据提取

    支持所有 LLM(开源/闭源)驱动的结构化数据提取。内置多种分块策略,支持基于用户查询的语义内容匹配,可通过自定义 Schema 从重复页面模式中批量提取结构化 JSON。

    ③ 浏览器深度集成

    支持托管用户自有浏览器,通过 Chrome DevTools 协议实现远程浏览器控制。支持浏览器配置文件持久化(保存认证状态、Cookie),完美支持需要登录的网站爬取。

    ④ 动态页面与反爬对抗

    支持执行 JavaScript、等待异步动态内容加载、处理无限滚动页面。提供隐身模式模拟真实用户行为,支持自定义请求头、Cookie、User-Agent 和代理认证,有效绕过常见反爬限制。

    ⑤ Docker 一键部署 + API 服务

    提供优化后的 Docker 镜像,内置 FastAPI 服务,开箱即用。内置 JWT 令牌认证保障 API 安全,支持大规模生产环境部署,是构建数据采集基础设施的最佳选择。

    💡
    典型使用场景

    场景1:RAG 知识库数据准备

    将网页内容转换为干净 Markdown,作为 RAG 系统的知识库来源。crawl4ai 的 Fit Markdown 功能可自动过滤导航栏、广告、页脚等噪音,只保留核心正文,避免无关内容干扰大模型输出。配合深度爬取(BFS/DFS策略)可批量采集整个网站。

    场景2:AI Agent 实时信息获取工具

    将 crawl4ai 封装为 AI Agent 的工具函数,让 Agent 能够自主爬取所需网页内容。比如用户问”今天有哪些 AI 新闻?”,Agent 可自动爬取新闻网站并提取结构化信息,真正实现 AI 联网能力。

    场景3:大规模数据采集管道

    结合 Docker 部署、浏览器池、缓存机制,搭建大规模高并发网页数据采集系统。内置的浏览器配置文件持久化能力,可保存登录状态实现需要认证的网站批量采集,适合构建企业级数据采集基础设施。

    🚀 30秒快速开始

    Python 代码方式:
    import asyncio
    from crawl4ai import *

    async def main():
    async with AsyncWebCrawler() as crawler:
    result = await crawler.arun(url=”https://example.com”)
    print(result.markdown) # 获取干净 Markdown

    if __name__ == “__main__”:
    asyncio.run(main())

    CLI 命令行方式:
    crwl https://example.com -o markdown
    # 深度爬取,最多10个页面
    crwl https://docs.crawl4ai.com –deep-crawl bfs –max-pages 10

    💝
    推荐理由

    如果你正在构建 RAG 系统或 AI Agent,crawl4ai 是目前开源界最值得关注的网页数据采集工具。它解决了传统爬虫的两个核心痛点:

    第一,真正为 LLM 优化。 传统爬虫输出的是原始 HTML 或杂乱文本,需要大量后处理才能喂给大模型。crawl4ai 直接输出干净、结构化的 Markdown,内置的 Fit Markdown 功能可以智能过滤导航、广告等噪音,让 RAG 召回质量大幅提升。

    第二,对动态页面和反爬场景的支持非常完善。 基于 Playwright 的浏览器控制,可以处理 React/Vue 等前端框架渲染的页面,支持等待异步内容加载、处理无限滚动。隐身模式和浏览器指纹自定义功能,让我在采集一些有反爬机制的网站时也能稳定获取数据。

    最让我惊喜的是它的 Docker 部署方案。 几分钟就能搭建一个带 API 服务的爬取引擎,内置 JWT 认证,可以直接集成到现有数据管道中。对于需要大规模采集的场景,这比手写 Scrapy 爬虫效率高太多了。

    ⭐ 总之,如果你需要为 AI 应用添加网页数据获取能力,crawl4ai 是目前最成熟的开源选择,没有之一。

    📥 下载地址

    License: Apache 2.0 | 作者: UncleCode | 最近更新: 2026年6月

    💡 关注【开源推荐】系列,每周带你发现最值得关注的 AI 开源项目
    ⭐ 如果这篇文章对你有帮助,欢迎在 WordPress 点赞留言!

  • 贝索斯又出手了,这次是120亿美元砸向「通用人工工程师」

    贝索斯又出手了,这次是120亿美元

    杰夫·贝索斯悄悄布局AI这几年,这次的动作大得有点离谱。他跟谷歌旗下Verily的前联合创始人维克拉姆·巴贾杰一起搞了个物理AI公司,叫Prometheus,刚完成120亿美元融资,投后估值410亿美元。这个估值什么概念?这是有史以来估值最高的AI初创公司之一。

    这已经是Prometheus的第二轮融资了。去年年底成立的时候拿了62亿美元,这次直接翻倍还多。投资方名单读起来像全球金融圈的点名:摩根大通、高盛、贝莱德,再加上贝索斯本人。

    Jeff Bezos
    杰夫·贝索斯,来源:Getty Images

    “通用人工工程师”是个什么玩意

    Prometheus要做的东西,他们自己叫”通用人工工程师”(Artificial General Engineer)。说白了,就是一套能自动搞定复杂物理系统设计和制造的软件——从喷气发动机到药物化合物,都算。

    这个野心大到有点吓人。他们想用AI替代大部分工程类工作。但贝索斯在接受CNBC采访时表示,AI带来的生产力提升会产生他所说的”劳动力短缺”——意思是未来对劳动力的需求会超过供给。这个观点跟科技圈很多人的判断正好相反。不少人觉得AI会导致大规模失业,贝索斯不这么看。

    “经济的显著生产力提升将提高生活水平。现在很多双职工家庭会变成单职工家庭,有些加班的人也会不再需要加班。”贝索斯是这么说的。

    410亿美元估值,钱要花在哪

    Prometheus目前在旧金山、伦敦和苏黎世设有办公室,一共150名员工。贝索斯说,这轮融资的大部分资金将用于满足公司的大规模算力需求。这个信息很直白——物理AI很烧钱,尤其是训练模型和运行仿真。

    410亿美元的估值让Prometheus站在了物理AI赛道的最前面。但这个赛道不是只有它一个。近几个月,风险资本家正越来越多地向物理AI领域投钱。这个赛道被投资者和创业者认为比纯软件赛道更具防御性——因为物理世界能产生仅靠代码无法构建的护城河。

    贝索斯对大规模劳动力运作有深刻认知。在亚马逊,他担任执行董事长,也是最大的个人股东,亚马逊在全球拥有超过150万名员工。过去一年,随着公司加速自动化进程,亚马逊已经裁员数万人。所以他说”劳动力短缺”,多少有点讽刺——他自己的公司正在用自动化减少劳动力。

    Prometheus目前尚未披露其已有的具体研发成果。150人,120亿美元,410亿估值——这些数字摆在一起,外界难免好奇他们到底做出来了什么。接下来几个月,应该是Prometheus从神秘走向公开的关键期。


    • Prometheus完成120亿美元融资,投后估值410亿美元
    • 由Jeff Bezos和Verily前联合创始人Vik Bajaj创立
    • 开发”通用人工工程师”软件,目标替代大部分工程类工作
    • 贝索斯预测AI将导致”劳动力短缺”,与主流观点相反
    • 融资主要用于算力需求,公司在旧金山、伦敦、苏黎世设有办公室