作者: hiyoho

  • Firecrawl:120k Stars!让AI轻松抓取任意网页的利器

    Firecrawl - Web数据API for AI

    你有没有遇到过这种情况:想用AI分析某个网站的内容,结果发现爬虫根本抓不到数据,要么是JavaScript渲染的SPA页面,要么就是被反爬虫拦住了?

    我之前做竞品调研的时候,就经常被这个问题困扰。传统爬虫要么需要配置代理,要么需要手动处理各种反爬机制,光是数据清洗就占了大半天时间。

    直到我发现了 Firecrawl —— 这是一个专门为AI时代打造的网页数据抓取工具,它可以轻松把任何网站转换成LLM-ready的格式。


    🚀 项目简介

    Firecrawl 是一款开源的 Web 数据抓取 API,能够将任何网站转换为干净的 Markdown 或结构化数据,特别适合 AI Agent 和 LLM 应用使用。项目已获得 120k+ GitHub Stars,被 Apple、Shopify、Canva、Replit 等知名企业信赖使用。


    ⚙️ 安装要求和过程

    📋 环境要求

    • Python 3.8+ / Node.js 18+ / Go / Rust / Java
    • Docker(可选,用于本地部署)
    • API Key(可从 firecrawl.dev 免费获取)

    🚀 快速安装

    通过 pip 安装 Python SDK:

    pip install firecrawl-py

    或者使用 npm:

    npm install firecrawl-py

    Docker 本地部署:

    docker pull mendableai/firecrawl
    docker run -p 3002:3002 mendableai/firecrawl

    💡 核心功能

    • 🔍 智能搜索:输入关键词,直接返回包含完整内容的搜索结果,无需二次抓取
    • 📄 专业抓取:将任意网页转换为干净的 Markdown、JSON 或 HTML,自动处理 JavaScript 渲染
    • 🗺️ 站点映射:生成网站结构地图,快速了解站点架构
    • 🔗 智能爬取:从起始 URL 自动追踪链接,爬取整个站点,支持深度限制
    • 💬 页面交互:支持点击、滚动、输入、截图等操作,可与页面动态交互

    📦 典型使用场景

    🔬 场景1:AI 研究助手

    让 AI 代理自动搜索和抓取最新论文、新闻、行业报告,汇总成结构化的研究报告。

    📊 场景2:竞品情报监控

    自动监控竞品官网、定价页面、产品更新,抓取关键信息用于市场分析和决策支持。

    🤖 场景3:RAG 应用数据源

    为 RAG(检索增强生成)应用提供实时、准确的网页数据源,提升 AI 回答的质量。


    ⭐ 推荐理由

    说实话,用了 Firecrawl 之后,我做竞品调研的效率至少提升了三倍。以前需要花半天时间手动抓取和清洗的数据,现在几行代码就能搞定。

    最让我惊喜的是它的 JavaScript 渲染能力 —— 以前那些用 React/Vue 写的 SPA 页面,传统爬虫根本拿它没办法,现在只要一个 API 调用就能搞定。而且输出格式非常干净,几乎不需要额外清洗。

    配合 MCP 服务器使用效果更佳,可以直接在 Cursor、Claude 这些 AI 工具里调用 Firecrawl,真正实现”让 AI 替你上网搜资料”。


    📧 下载地址

  • 谷歌发布Googlebook AI笔记本:Magic Pointer登场,2026秋季正式上市

    谷歌在5月12日悄悄投下了一颗炸弹——Googlebook,一个从零开始围绕Gemini Intelligence设计的笔记本品类,2026年秋季正式上市。宏碁、华硕、戴尔、惠普、联想全部进场,各种尺寸和形态都会有。

    这不是Chromebook的升级版,而是一次底层换代。Chromebook走了15年,在学校和办公场景扎下了根,但它的时代正在被AI重新定义。谷歌没有直接说”Chromebook死了”,只说现有设备会继续得到支持,很多Chromebook也有资格升级到新的Googlebook体验——至于怎么升、升完长啥样,现在还没说清楚。

    Googlebook笔记本宣传图
    Googlebook官方宣传图 | 图源:Google / TechCrunch

    Magic Pointer:光标变成AI助手

    Googlebook最让人眼前一亮的功能叫Magic Pointer。传统光标只能点选和拖动,Magic Pointer内置了Gemini,晃一晃光标,它就能识别屏幕上可交互的元素,然后给你推情境化的操作建议。

    举个例子:光标指向邮件里的日期,它会建议你直接创建日历会议;选中两张图——比如你家的客厅照片和一张新沙发的图——它能把沙发”摆”进客厅里让你预览效果。谷歌的产品总监说,这个设计理念是”内置但不打扰”,AI在后台等着,你晃光标它才出来。

    这不是在光标旁边加个AI按钮,而是让”指”这个动作本身变聪明。区别在于:前者是工具,后者是直觉。

    手机App直接跑在笔记本上

    Googlebook和Android手机的深度联动也是重点。你不用在笔记本上装Android模拟器,手机App直接就能在Googlebook上运行。想做Duolingo每日打卡,手边没有手机?直接在笔记本上点开就行。

    文件也能跨设备无缝访问。手机里存的图、下载的PDF,在Googlebook的文件浏览器里直接就能看到、搜到、插到你的文档里。这个体验和苹果生态的接力(Handoff)有点像,但谷歌的打法是打通Android和这个新的笔记本操作系统。

    Create your Widget:说一句话生成桌面组件

    还有一个挺有意思的功能叫”Create your Widget”。你用自然语言跟Gemini描述你想要什么,它就能给你生成一个自定义桌面组件。更实用的是,Gemini能抓网页信息,也能连上你的Gmail和谷歌日历,把这些数据揉在一个个性化仪表盘里。

    比如你在筹划一次柏林的家庭聚会,这个组件能自动汇总你的航班和酒店信息,推附近的餐厅预订选项,还能加个倒计时。听起来就是把Google Now的野心重新用AI做一遍,但这次是嵌在桌面里的。


    这不只是换了个笔记本,是换了个平台

    谷歌做这件事的真正意图不是卖几台笔记本,而是把ChromeOS慢慢退场,换上这个基于Android、AI从底层就内置的新系统。硬件厂商已经全部就位,这是一次平台级的押注,直接对标微软从2024年开始推的Copilot+ PC。

    微软那边Copilot+ PC打的是”本地运行AI模型”这张牌,谷歌这边Googlebook打的是”Gemini深度集成+Android生态联动”。两边的方向其实差不多:让AI从”一个App”变成”操作系统的一部分”。

    2026年秋季正式上市后,你会看到Acer、Asus、Dell、HP、Lenovo各家都会出自己的Googlebook产品。价格和具体配置目前还没公布,但按照谷歌的打法,入门款应该会走量,高端款去和MacBook Pro、Surface竞争。

    ChromeOS用了15年才走到今天,Googlebook能不能在AI时代走通这条路,秋季见了分晓。

  • Claude AI找回丢失11年的比特币钱包:3.5万亿次尝试后,5个BTC失而复得

    有个国外小伙把自己给坑了——大学时候手欠改了比特币钱包密码,改完就忘了,而且改密码那会儿还”high”着。这一忘就是11年,钱包里锁着5个BTC,按现在的价格大概是40万美元。

    他不是没努力过。开源工具btcrecover跑了无数次暴力破解,能试的密码组合都试了,就是打不开那个加密钱包文件。真正的痛点在这:早期的比特币钱包和现在不一样,那时候助记词生成的是HD密钥树,但钱包经常混用非HD密钥和导入密钥,这些密钥没法通过助记词恢复,只能靠钱包文件本身加密码才能解锁。

    转机出现在几周前,他在大学旧笔记本里翻到了当年记下的助记词。把助记词导入后,恢复出来的地址和他电脑里某个钱包文件对上了——就是那个存着5个BTC的文件,但它依然是加密的,密码还是不对。

    比特币钱包示意图
    丢了11年的比特币钱包,被Claude帮忙找回来了 | 图源:Getty Images

    绝望之下,他把整个大学时期的电脑文件一股脑全丢给了Claude。然后事情开始变得离谱——Claude在数据包里翻出了一份2019年12月的旧钱包备份,这个备份是在他改密码之前做的。更关键的是,Claude发现btcrecover在组合共享密钥和密码的时候有个bug,导致之前的所有破解尝试全部白费。

    修好那个bug,换上改密码之前的旧备份,Claude带着btcrecover跑完,私钥解出来了。5个BTC,失而复得。

    3.5万亿次尝试,AI找到了人类遗漏的bug

    按照用户在X上的说法,整个破解过程累计尝试了约3.5万亿个密码组合。Claude没有直接”猜”出密码,它的真正价值是帮人类找到了那个被忽略的关键问题——工具本身的bug。这件事做完,用户直接在X上发了疯,说要给自己的孩子取名叫Dario(Anthropic CEO的名字)。

    类似的事件之前也有过。2024年有研究人员花了至少半年时间,破解了一个忘记20位密码的比特币钱包,里面约有160万美元的BTC。但那次是纯人工+脚本硬跑,这次Claude的介入方式不太一样——它不是暴力算力的比拼,而是帮人看见了盲点。


    当然,不是所有人都有这样的运气。英国有个哥们儿丢了8000个BTC(现在值约78亿美元),硬盘被扔进了垃圾填埋场,2025年法院还判了他败诉,彻底没戏。所以这篇不是鼓励大家指望AI来救场,而是想说:AI现在能帮你看见你漏掉的东西,但前提是你得先把”所有东西”都给它看。

  • Meta收购ARI机器人AI团队:具身智能的抢人大战开始了

    Meta砸钱买下一个20人的机器人AI团队,这步棋下得挺准

    5月1日,Meta悄悄宣布了一笔收购——把人形机器人AI初创公司Assured Robot Intelligence(简称ARI)整个团队拿了过来。具体价格没披露,但按AI研究领域种子阶段收购的惯例来估算,大概在5000万到1.5亿美元之间。ARI整个公司才成立约12个月,约20个人,全在加州圣地亚哥。

    这个时机选得相当精准。就在收购前一个月,Amazon刚把Fauna Robotics收入囊中——而Fauna的联合创始人Lerrel Pinto,恰好也是ARI的联合创始人。人才圈的窗口正在关闭,Meta抢在ARI开A轮之前把它拿下了,估值还没被市场炒到天上去。

    “人形机器人正在从硬件竞赛转向智能捕获。Meta收购ARI是最清晰的信号——大科技公司已经从围观这个赛道,转向直接买入场券。”

    ARI到底在做什么

    ARI对外声称在做”机器人的前沿AI”,但产品宣传很少,真正有价值的信息在它的创始人背景里。两位联合创始人都是学术圈的人:

    • Xiaolong Wang——UC San Diego教授,研究方向是视觉运动控制和机器人灵巧操作,论文发表在CVPR、NeurIPS、ICLR这些顶会上
    • Lerrel Pinto——同为UC San Diego出身,联合创立了Fauna Robotics(被Amazon收购),在机器人学习领域有扎实的积累

    ARI的核心方向是给人形机器人做基础模型,特别强调在非预设环境下的全身控制和灵巧操作——这恰恰是现在大部分人形机器人最薄弱的地方。它们能走个直线、挥个手,但要让机器人像人一样在动态环境里做复杂操作,模型还差得很远。

    值得注意的是,ARI强调”自学习”——模型通过物理交互来改进,而不是只靠离线数据集训练。这直接针对当前VLA(视觉-语言-动作)模型架构的一个已知局限:泛化能力不足。


    为什么是ARI,不是别的公司

    其实市面上做机器人智能层的初创公司不止ARI一家。Physical Intelligence(PI)融了6亿美元以上,Skild AI估值140亿美元——但这些公司要么太大太贵,要么已经走上独立发展的轨迹,买起来不划算。

    ARI的巧妙之处在于:它足够小,可以干净地吸收进Meta的组织架构;它的人才足够顶尖,直接补充Meta Superintelligence Labs的短板;它的估值还没被炒高,收购成本低。

    Meta在2025年成立了Reality Labs内部的机器人工作室,编制齐全,但缺的就是基础模型研究人才。ARI填的不是一块模糊的野心,而是一个精确的缺口。

    大厂抢人大战才刚开始

    把视野拉宽一点,这场收购其实是整个行业的一个缩影。Amazon在2025-2026年间连续拿下Fauna、Rivr,还投资了Agility;Tesla在全栈自研路线上上越走越深;NVIDIA坐在平台层,给所有人提供芯片和仿真工具,稳稳抽取margin。

    Meta的策略和Amazon形成鲜明对比:Amazon是”广撒网”——连续收购,布局 warehouse、配送、家庭三大场景,但没有一个统一的平台叙事;Meta是”精准打击”——先在内部定义好机器人智能的路线图,再去买最匹配的人才来填空。

    这两种路径哪个更有效,接下来两三年会见分晓。但至少从目前来看,Meta这步棋下得挺准——在种子阶段的机器人智能公司变成”不得不买”的独立巨头之前,先把人拿到手。

  • OpenAI推出Daybreak:用AI找漏洞、验补丁,三层模型架构首次曝光

    OpenAI悄悄上线Daybreak,用AI把漏洞发现和补丁验证打包搞定

    OpenAI这周干了件挺有意思的事——推出一个叫Daybreak的新项目,专门帮企业用AI找漏洞、验证补丁。说白了,就是让AI扮演”超级安全研究员”的角色,在代码里翻箱倒柜找安全隐患,顺带告诉你补丁好不好使。

    这个东西的核心逻辑其实不复杂:把OpenAI现有的前沿模型能力、Codex Security这个代码智能体工具、再加上一堆安全合作伙伴的生态整合在一起。防御方可以在日常开发流程里直接用上安全代码审查、威胁建模、补丁验证、依赖风险分析、检测和修复建议——软件从写出来的那一刻就变得更结实。

    OpenAI的原话是这么说的:”Daybreak把OpenAI模型的智能、Codex作为智能体框架的可扩展性、以及我们在安全飞轮上的合作伙伴整合在一起,让全世界变得更安全。”

    三层模型架构,分工明确

    Daybreak不是拿一个通用模型硬上,而是搞了三层架构,各有各的用处:

    • GPT-5.5:标准版,带通用护栏,适合一般用途
    • GPT-5.5 + Trusted Access for Cyber:经过验证的防御性工作,在授权环境中使用
    • GPT-5.5-Cyber:高权限模型,用于红队演练、渗透测试和受控验证

    这三层设计其实很聪明——不同安全级别的任务用不同”火力”的模型,既保证能力够用,又不至于让高权限模型被滥用。OpenAI这次还拉上了一堆巨头一起玩:Akamai、Cisco、Cloudflare、CrowdStrike、Fortinet、Oracle、Palo Alto Networks、Zscaler,都在Trusted Access for Cyber框架下接入这些能力。

    AI找漏洞太快,补丁跟不上了

    这里有个真实的矛盾:AI工具把发现漏洞的时间压缩到了以前根本不敢想的程度,但补丁的开发和验证流程还停留在”人类节奏”上。结果就是——漏洞被发现的速度远超补丁发布的速度。

    HackerOne今年3月干脆暂停了互联网漏洞赏金计划,理由就是AI辅助研究导致新漏洞报告量暴增,开源维护者们根本处理不过来。这还带来一个副作用叫”分流疲劳”——维护者要在一大堆漏洞报告里翻找,其中有些报告看着像模像样,其实是AI模型编出来的幻觉。


    安全研究员Himanshu Anand上周写了篇文章,标题很犀利:”90天披露政策已死”。他的论点是:当10个互不相干的研究员在6周内找到同一个bug,而AI可以在30分钟内把补丁差异变成可用漏洞利用代码,那个90天窗口期到底在保护什么?答案是:什么也保护不了。

    Daybreak目前还是限量访问状态,OpenAI建议有需求的组织申请漏洞扫描或联系销售团队。这个克制挺明智的——这种能力的扩散速度如果失控,后果可能比漏洞本身还麻烦。

  • 微软与OpenAI终止独家云协议——AI版图重新划分

    2026年4月27日,微软和OpenAI悄无声息地改写了过去几年的AI版图。双方 restructured 了合作关系——Azure不再是OpenAI的独家云供应商,同时去掉了与AGI(通用人工智能)相关的条款。这件事的意义,比表面上看起来要大得多。

    独家协议为什么说不续就不续了?

    其实不难理解。OpenAI想要更大的基础设施选择权,而微软也不想被绑定在一个越来越贵的合作协议上。去掉AGI条款更是关键——之前的说法是,一旦OpenAI实现AGI,某些合作协议会自动失效,现在这条被拿掉了,双方的绑定关系变得更加”务实”。

    Azure仍将是OpenAI的”主要”云伙伴,但不再是”独家”。这给了OpenAI和其他云厂商(比如Google Cloud、AWS)合作的空间,也意味着微软在AI基础设施上的垄断地位被打破了。

    AI阵营正在重新划分

    这件发生的同一时间段,另一个信号同样值得关注:Google计划向Anthropic投资最高400亿美元。也就是说,微软-OpenAI这对老搭档的关系在松动,而Google-Anthropic这对”反OpenAI阵营”却在加深绑定。

    站在OpenAI的角度,摆脱Azure独家限制之后,可以更加灵活地选择基础设施伙伴,这对训练和部署下一代模型至关重要。站在微软的角度,Azure依然是OpenAI的优先选择,但不再有排他性保护,这也意味着微软需要在AI服务上靠实力竞争,而不是靠合同。


    这对普通开发者和企业意味着什么

    短期内可能感受不明显,但中长期来看,OpenAI的API和模型部署会有更多基础设施选项,成本和延迟都有可能优化。而对整个行业来说,AI基础设施的”阵营化”正在减弱,更加市场化的竞争对所有人都有好处。

  • AI五月风暴:模型军备竞赛、Agent落地与电力危机

    四月刚过,AI圈没有丝毫放缓的迹象。GPT-5.5-Cyber开始推送,Claude Mythos在约50家合作伙伴中只有受限预览,DeepSeek V4带着开源权重和低价策略强势入场——模型竞赛正在进入一个新阶段:不再比谁的模型最通用,而是比谁更专业、更便宜、更能落地。

    专业模型来了,通用模型不香了?

    GPT-5.5-Cyber的发布释放了一个清晰信号:厂商开始针对特定高价值场景推出专业模型,而不再只靠一个通用大模型打天下。网络安全、漏洞发现、防御分析——这些场景正在成为前沿AI厂商的必争之地。

    Claude Mythos的神秘感更是拉满。现在只有约50家机构能用到它,传言说它在高级推理、编码和漏洞发现上有巨大飞跃。Anthropic这种”限量供应”的打法,摆明了要把下一个阶段的AI变成门槛更高、管控更严的游戏。

    DeepSeek V4则是另一条路——它把前沿级别的性能直接拉到低价+开源的组合上。对企业来说,成本改变 adoption 曲线,成本改变哪些应用场景变得经济可行。

    Agent从概念到落地,2026是分水岭

    Gartner有个预测被反复引用:到2026年底,40%的企业应用将嵌入AI Agent,而2025年这个数字还不到5%。先不管这个预测准不准,它反映出的行业共识是真实的——Agent正在从demo走向生产环境。

    开发者社区里的讨论也在变。大家不再争论Agent有没有用,而是开始认真讨论:用什么框架?CrewAI还是LangGraph?MCP协议怎么接入?怎么防止Agent乱跑把事情搞砸?这些是非常实操的问题,说明这个品类真的在进入落地阶段。


    电力危机:6500亿美元也买不来的瓶颈

    最有意思的矛盾来了:大型科技公司今年在AI基础设施上的资本开支合计超过6500亿美元,但约一半的美国数据中心项目却因为电力基础设施短缺而被推迟或取消。钱不是问题,电才是问题。

    AI数据中心 campus 动辄需要几百兆瓦的电力容量,变电站、变压器、电网接入——这些现实世界的物理约束,比发布一个大模型要慢得多。Gartner还预测,到2027年,电力短缺将限制约40%的AI数据中心。这意味着,AI的下一个瓶颈不是芯片,不是模型,而是现实世界的部署能力。

  • Anthropic产品负责人:AI的下一站,是在你开口前就猜到你要什么

    Anthropic最近风头正劲。估值940亿美元、企业客户数超越OpenAI、ARR突破440亿美元——这家公司正在AI领域快速崛起。而它的产品负责人Cat Wu最近在Code with Claude大会上分享了一个观点,我觉得挺有意思:AI的下一件大事,是”主动性”。

    从”有问必答”到”未问先答”

    Cat Wu在采访中回顾了AI助手的演进路径:去年是”同步开发”时代,人问AI答;现在是”自动化流程”时代,比如自动回复客服工单。而下一步,AI要理解你的工作内容,主动帮你搭建自动化流程。

    “The next big thing is proactivity. Claude will understand what you work on, and just sets up some of these automations for you.” —— Cat Wu,Anthropic产品负责人

    换句话说,未来的AI不会等你提问,它会预判你的需求,在你意识到之前就把事情做好。这个画面有点像有个特别懂你的助手,总是提前一步想到你接下来要做什么。

    管好Agent,其实和管理员工差不多

    有意思的是,Cat Wu还回应了一个很多人关心的问题:AI Agent会不会取代人类工作?她的观点是:不会完全取代,但会改变工作方式。

    她说,管理AI Agent其实和管理员工很像——你得是那个领域的专家。当Agent犯错时,你得能debug,得知道是指令没说清楚还是需求描述不够具体。这是一种新技能,但本质上是管理能力的延伸。

    Cat Wu在Code with Claude大会
    Cat Wu在Anthropic年度Code with Claude大会上分享AI未来趋势

    不追竞品,只追前沿

    Cat Wu还透露了Anthropic的产品哲学:从不根据竞品动态来规划路线图。她说,如果总是盯着竞争对手,团队的执行速度永远会落后两周到一个月。Anthropic的策略是专注于技术前沿,让产品自己说话。

    这种思路从他们最近的”Glasswing”项目也能看出端倪。Glasswing是一个网络安全AI模型,可以扫描代码库查找漏洞。Anthropic没有公开发布它,而是只给了亚马逊、苹果、微软等合作伙伴早期访问权限——因为他们认为这个模型”太强大”了,不想让它落入坏人之手。

    AI的价值:把人从繁琐中解放出来

    聊到AI对工作的影响,Cat Wu举了自己的例子:她最讨厌的事情是回邮件。AI的价值不在于取代她的工作,而在于接手那些重复繁琐的部分,让她有时间去做”真正想做的事情”。

    “The idea is that everyone can get a lot more done. I think that, for everyone’s job, there’s always this percentage of it that’s really tedious.”

    这个观点挺实在的。AI的目标不是让人失业,而是提升每个人的产出效率——用更少的时间做更多有价值的事。


  • Notion转型AI Agent中心:200万团队已入局,企业工作流正在被重塑

    Notion最近搞了个大动作——他们刚刚发布了全新的开发者平台,直接把自己从”协作文档工具”升级成了”AI Agent调度中心”。说实话,这个转变比我预想的来得更快。

    从笔记软件到AgentHub

    事情的起因是Notion在2月份推出的Custom Agents功能。当时很多团队用上了,但局限性也很明显——这些Agent没法连接外部数据、没法运行自定义逻辑、也没法和第三方AI Agent联动。说白了,就是个”加强版自动回复”。

    新平台一口气解决了这些问题。它带来了四个核心能力:

    • Notion Workers:云端安全沙盒环境,团队可以直接部署自定义代码,不用依赖外部基础设施
    • Database Sync:实时同步外部数据源,包括Salesforce、Zendesk、Postgres等,直接拉进Notion数据库
    • 外部Agent集成:直接在Notion里和Claude Code、Cursor、Codex这些第三方Agent聊天、派任务、看进度
    • 开发者工具:Notion CLI现在全平台免费使用

    “Any data, any tool, any agent — that’s the big picture for the Notion Developer Platform.” —— Notion联合创始人兼CEO Ivan Zhao

    数据很吓人

    从2月推出Custom Agents到现在,Notion用户已经构建了超过100万个自定义Agent。这个数字很能说明问题——市场需求是真实存在的。

    Notion还宣布了一个福利:Workers在2026年8月之前免费给开发者试用。这显然是借鉴了云厂商早期的”先用后付费”策略,先培养生态再说。

    Notion开发者平台
    Notion开发者平台将工作空间打造为AI Agent枢纽

    这意味着什么

    我觉得这代表了SaaS工具的一种演进方向——从”人用工具”变成”人指挥AI用工具”。Notion不再只是一个写文档的地方,它正在变成企业AI工作流的”操作系统”。

    当然,这也意味着Notion要和n8n、Zapier这些老牌自动化平台正面竞争了。能不能打过,还得看实际体验。但有一点可以确定——AI Agent的风口,每个玩家都想抓住。


  • DeepSeek V4 发布:1.6万亿参数开源,百万上下文成标配,价格比 GPT-4 便宜70倍

    DeepSeek 这次真的把天花板给顶破了。4月24日,他们正式发布 DeepSeek-V4 预览版,同步全量开源,上线 Hugging Face 和 ModelScope,附带580G 开源权重。消息一出,资本市场立刻有了反应——SMIC 和华虹半导体在香港双双大涨。

    1M 上下文,标配了

    V4 系列最直观的升级是上下文窗口直接拉到100万 token,所有官方服务默认配置。用大白话讲,就是你扔给它一部长篇小说让它分析,它一口气全吞下去,中间不需要你翻页或者重新喂。

    但这还不是最厉害的。他们搞了一套 Token-wise 压缩加上 DSA 稀疏注意力机制,推理时的 FLOPs 直接降低了73%,KV 缓存大小减少了90%。说白了,不是粗暴地堆算力,而是在工程层面做了精细优化。

    DeepSeek V4
    DeepSeek-V4 发布,百万上下文成标配

    两个版本怎么选?

    V4-Pro 总参数1.6万亿,激活参数490亿,性能定位是”开源最强、接近顶级闭源”。内部员工体验说比 Sonnet 4.5 强,交付质量接近 Opus 4.6 的非思考模式。API 价格做到了 GPT-4 的七十分之一,每百万 token 输入0.14美元、输出3.48美元。

    V4-Flash 走的是经济路线,2840亿总参数、130亿激活参数,API 价格低到离谱——输入每百万 token 只要3美分,比 Claude Opus 4.7 便宜99%以上。简单任务用它完全够用,高难度任务建议开思考模式、强度拉满。

    国产算力这波秀肌肉

    更值得关注的是 DeepSeek V4 对国产算力的适配程度。官方数据显示,在华为昇腾 950PR 上推理速度比 V3 版本快了整整35倍,能耗还降低了40%。他们还适配了寒武纪芯片,MXFP4 低精度格式降低了对 NVIDIA CUDA 生态的依赖。

    这意味着什么?DeepSeek 不再只是”开源模型里很强”,而是真正在国产硬件上跑出了能打的体验。对国内企业来说,部署成本和使用门槛都在大幅下降。开源协议用的是 MIT,完全开放商用。


    DeepSeek V4 把百万上下文、开源和低成本三个事情同时做到位了。开源社区等了这么久的东西,终于来了。