标签: AI突破

  • OpenAI声称解决80年数学难题,这次有数学家背书

    七个月前,OpenAI前副总裁Kevin Weil在X平台上高调宣布GPT-5解决了10个未解的Erdős问题,结果被证明那些”解”早就写在公开文献里。Yann LeCun和DeepMind的Demis Hassabis纷纷嘲讽,Weil只好默默删帖。

    这次OpenAI学乖了。2026年5月20日,他们声称新的推理模型推翻了Paul Erdős在1946年提出的几何猜想,而且这次找来了数学家Noga Alon、Melanie Wood和Thomas Bloom背书——正是Bloom上次公开批评OpenAI”严重误导”。

    Erdős数学问题示意图
    OpenAI称其模型发现了全新的几何构造族,推翻了近80年的数学共识(图源:OpenAI)

    不是专用系统,是通用推理模型

    OpenAI特别强调,这次产出证明的不是专门为数学设计的系统,而是一款通用推理模型。这意味着AI现在能处理更长的推理链,还能把不同领域的想法串起来——这种能力对生物学、物理学、工程和医学都有意义。

    “近80年来,数学家们一直认为最佳的可能解法大致类似于平方网格。现在OpenAI的一个模型推翻了这一认知,发现了一种全新的构造族,性能更优。”——OpenAI官方声明

    Thomas Bloom说:”人工智能正在帮助我们更全面地探索几个世纪以来我们建造的数学大教堂。还有哪些未被发现的美妙事物在等待着我们?”这位数学家上次可是OpenAI的批评者,他能出面背书,可信度比上次高多了。


    为什么这次可能真不一样

    上次翻车之后,OpenAI这次显然更谨慎了。除了发布公告,他们还专门拉来了几位数学家的支持性评论,其中Bloom运营的Erdős问题网站正是上次戳穿OpenAI夸大宣传的那位。

    如果这次真的站得住脚,这会是AI第一次自主解决数学领域核心的知名开放问题。但数学界向来谨慎,最终还得经过同行评审才能定论。OpenAI把详细证明放在了官网上,感兴趣的可以去扒一扒。

  • 2026年AI领域最值得关注的10件事

    2026年AI领域最值得关注的10件事

    MIT Technology Review最近发了篇文章,总结了当下AI领域最值得你盯着的10个方向。他们的记者和编辑盯了AI这么多年,这次第一次把答案浓缩成一份清单。

    这份榜单的灵感来自他们每年的《10项突破性技术》,但这次把视角投向了当下推动AI进步、改变权力格局的东西。我挑几个最有意思的跟你聊聊。

    AI Trends 2026
    MIT Technology Review总结的2026年AI十大重要趋势(图片来源:MIT Technology Review)

    人形机器人需要大量训练数据

    就像我们的文字成了大语言模型的训练数据一样,记录人类动作的海量视频现在正被收集起来,用来训练人形机器人。有些公司在搞庞大的”训练中心”,让工人重复完成任务;还有些公司让海外的陌生人远程操控”傀儡”机器人。这是个疯狂的尝试,而且没人能保证一定能成功。

    大语言模型还有很大挖掘空间

    大语言模型(LLM)曾经席卷全球。现在所有AI从业者都在追逐下一个重大突破。虽然容易实现的目标已经所剩无几,但大语言模型不会就此消失,这项技术还有很大的挖掘空间。

    AI让诈骗变得更容易了

    AI正在降低诈骗分子和黑客的作案门槛,让入侵目标的尝试变得比以往更快、更便宜、更容易。这件事值得所有人警惕。

    “AI无处不在,铺天盖地。这让你有怎样的感受?”——MIT Technology Review编辑Mat Honan

    世界模型:让AI理解物理世界

    AI公司想要构建能够理解外部世界的系统。如果它们成功,就有可能克服大语言模型的局限性,帮助AI进入物理环境。这是个很有意思的方向。

    AI已经进了作战室

    算法很早就实现了军事杂务的自动化,但现在生成式AI已经在作战室拥有了席位,指挥官会认真采纳它的建议。它正在重塑军队的情报共享方式、和大型科技公司的合作模式,以及致命决策的制定方式。

    深度伪造被武器化了

    随着生成式AI的改进、Grok大规模生成非自愿色情图像,以及美国政府用这项技术进行宣传,人们长期预测的武器化深度伪造威胁已经到来。


    智能体协作:从单打独斗到团队合作

    第一代AI智能体只能运行浏览器或者编写代码片段,而且只能单独行动。接下来将出现的是能够协作完成复杂得多的目标的智能体团队。这个方向对自动化和生产力提升很有意义。

    中国的开源押注

    免费开放前沿模型让中国实验室赢得了全球信誉,也获得了开发者的大量好感。这种模式的财务可持续性无人知晓,但全世界已经在基于中国的模型基础进行构建了。

    人工智能科学家:AI自己搞研究

    学术界和企业都在开发能够自主完成研究任务、作为真正的合作者和科学家共事的智能体。有人认为,这些AI合作科学家终有一天会取得足以获得诺贝尔奖的成果。这个说法有点大胆,但也不是完全没可能。

    全球范围内的AI抵制浪潮

    在多年的AI无限制发展之后,全球范围内正在形成一股强大的抵制浪潮。从保守派到自由派,从艺术家到工会,活动人士的势头越来越猛,已经开始取得一些小胜利。


    我的看法:这10个方向里,我觉得最值得关注的是”智能体协作”和”世界模型”。智能体协作如果能做好,对提升生产力会有很大帮助;世界模型则是让AI从屏幕后面走到物理世界的关键一步。至于AI诈骗和深度伪造武器化,这两个方向让人担心,但也说明AI的能力确实在快速提升。

    另外,中国的开源押注这个方向也很有意思。免费开放前沿模型确实能赢得开发者的好感,但怎么赚钱这是个问题。不过,全世界已经开始基于中国的模型进行构建了,这说明开源策略确实有效。

  • 7亿美元砸向’隐身’AI公司:Hark想要做什么






    7亿美元砸向”隐身”AI公司:Hark想要做什么

    要做出一款人人必备的AI消费级产品,到底需要多少钱?Hark的答案是:至少7亿美元。

    这家处于”隐身模式”的AI实验室周四宣布完成7亿美元A轮融资,投后估值达到60亿美元。光看这个数字,你可能会以为这家公司已经拿出了什么惊为天人的产品,但事实是——他们几乎什么都没对外披露过。

    Hark AI界面概念图
    Hark宣传视频截图,具体产品形态仍未公开

    谁是Brett Adcock?

    要理解Hark,得先认识它的创始人Brett Adcock。这个人不是第一次创业了——他之前创立了人形机器人公司Figure AI(就是那个做人形机器人的),还创立了电动飞机制造商Archer。2025年底,他用自己的1亿美元资金创立了Hark。

    Adcock的创业轨迹挺有意思:从电动飞机到人形机器人,现在又杀进AI。这三件事其实有一个共同点——都是”硬科技”,都需要软硬件结合,都不是靠写个App就能搞定的事情。


    投资方阵容:芯片巨头全来了

    这轮融资的投资方名单读起来像一份”科技圈名人录”:

    • 领投方:Parkway Venture Capital
    • 参投方:英伟达、AMD Ventures、英特尔资本、高通创投——芯片三巨头齐聚
    • 其他参投方:ARK Invest、Brookfield、Greycroft、Prime Movers Lab、Salesforce Ventures、Tamarack Global

    看到英伟达、AMD、英特尔都来了,你大概能猜到Hark要做的事情可能不只是软件。这三家可是竞争对手,能让他们同时掏钱,说明这个项目确实有点东西。

    芯片巨头们押注的,可能不只是模型,而是下一代AI原生硬件。


    Hark到底在做什么?

    这是最神秘、也最让人好奇的部分。根据公开信息,Hark正在开发两样东西:

    1. 模型和软件:一款作为”与数字世界通用接口”的智能体AI系统。预计今年夏天发布首批多模态模型,这些模型将为可与现有产品和服务协同工作的个人AI平台提供动力。

    2. 硬件:公司预计在模型发布之后,推出专门为这些系统打造的硬件设备。设计总监Abidur Chowdhury是苹果前产品高管,这个人事安排已经说明了很多问题。

    “通用接口”这个词很耐人寻味。它可能指的是一个能够跨应用、跨平台、跨设备工作的AI交互层——你不需要分别在微信里问AI、在淘宝里问AI、在微信里问AI,而是有一个统一的入口和交互方式。


    团队和产品设计:苹果基因

    Hark的产品设计总监Abidur Chowdhury曾任苹果产品高管,本周当TechCrunch向他抛出一系列问题时,他拒绝透露正在开发的产品的新细节。但他表达了一个很直白的看法:

    “我还没见过任何感觉真正能帮助普通人的产品。人们确实在开发帮助人们制作软件的东西,这很有效,也很有影响力,但我们还没看到真正面向普通人的产品。”

    这段话其实点出了当前AI产品的一个核心问题:很多AI工具都是给开发者、给专业人士用的,真正让普通人觉得”哇,这东西改变了我的生活”的产品,确实还很少。

    Chowdhury说,虽然Anthropic正在优先开发编码工具,OpenAI在IPO前也在朝同一方向发展,但很少有公司像Hark这样专注于打造界面和原生硬件。


    未知的挑战:隐私与接受度

    当然,疑问远多于答案。其中一个核心挑战是:如何在不让周围人感到不适或侵犯他们隐私的情况下,向AI助手提供用户生活的上下文信息?

    Meta的眼镜、谷歌即将推出的安卓眼镜,都还在摸索这个问题的答案。当被问及Hark如何解决这个特殊难题时,Chowdhury只是笑了笑,没有回答。

    这个沉默其实很能说明问题。隐私、接受度、社交礼仪——这些都不是靠技术就能搞定的事情。你可以做出最强的AI,但如果大家觉得戴个摄像头在脸上很怪,或者觉得AI太侵入自己的生活,那产品再强也没用。


    资金用途:抢人、抢算力

    新资金将主要用于三件事:

    • 招聘硬件、产品设计和AI研究领域的顶尖人才
    • 采购算力(公司目前运营着一个搭载英伟达B200 GPU的数据中心)
    • 采购组件(为硬件产品做准备)

    公司目前有70名员工。对于一个拿了7亿美元A轮的公司来说,这个人数不算多。也说明他们还在组建核心团队的阶段,产品可能还需要一段时间才能亮相。


    写在最后

    Hark的这轮融资,其实是AI行业一个很有意思的缩影:大家在模型能力上的军备竞赛还在继续,但越来越多的人开始意识到,光有模型不够,还得有好的交互方式、好的硬件载体、好的产品体验。

    Brett Adcock之前的创业经历表明,他不是一个只停留在PPT上的人。Figure的人形机器人、Archer的电动飞机,都是实打实造出来的东西。如果Hark真的在做AI硬件,那这7亿美元可能只是个开始。

    当然,现在下结论还太早。Hark选择隐身模式,说明他们知道自己还在早期。但芯片三巨头同时押注,至少说明了一件事:下一代AI终端的争夺战,已经悄悄打响了。


  • SpaceX IPO招股书曝光:火箭、AI算力与火星殖民的赌局

    火箭还能赚钱,但马斯克的棋盘远不止于此

    SpaceX终于把IPO招股书摆上了台面。这家24年前由马斯克创立的航空航天公司,计划在纳斯达克上市,股票代码定为”SPCX”。估值1.75万亿美元——如果不是后续马斯克的薪酬包里藏着7.5万亿美元的市值目标,这个数字已经够夸张了。

    招股书里写得很直白:SpaceX已经找到了”人类历史上最大的可落地总目标市场”,规模28.5万亿美元,其中22.7万亿归功于AI的”企业应用场景”。这句话基本把底牌亮出来了——火箭是手段,轨道AI算力枢纽才是棋盘。

    SpaceX火箭发射
    SpaceX的火箭业务只是开始,AI算力枢纽才是终极目标(图源:Getty Images)

    星链养活了现在,星舰押注未来

    招股书披露了一些硬数据。星链订阅用户已达1000万,年营收超过110亿美元,占SpaceX总营收的一半以上。但另一边,SpaceX 2025年亏损约49亿美元,成立以来累计亏损已超过370亿美元。

    钱主要烧在两个地方:星舰(Starship)和AI。2025年航天业务板块为星舰项目投入30亿美元,2026年第一季度又砸了9.3亿美元。SpaceX的判断是,星舰有望把进入轨道的成本降低99%以上——如果这事成了,轨道AI数据中心、太空制造、月球基地这些现在看起来像科幻的东西,才有规模化的可能。

    星舰最早本周将进行第12次试射。SpaceX在招股书中表示,预计2026年下半年开始执行轨道载荷投送任务,如果顺利,同年下半年用星舰发射下一代V2移动卫星,2027年发射月球版星链。

    xAI并入之后,AI部门的亏损还在扩大

    2025年马斯克把xAI并入了SpaceX,Grok聊天机器人也随之进入上市公司体系。结果不算理想:2025年SpaceX约60%的资本支出投向了AI部门,金额约200亿美元。这块业务去年仍亏损数十亿美元,营收增长约22%,远低于一线AI实验室的公开增速。

    但招股书里的叙事是另一套逻辑:轨道AI算力、太空数据中心、月球和火星的制造设施——这些设想被打包成了”28.5万亿美元总目标市场”的一部分。投资者买不买账,取决于信不信这套叙事能在未来十年落地。

    马斯克的薪酬包:2万亿美元只是中途站

    IPO之后,马斯克将担任SpaceX的CEO、CTO和董事会主席,持有93.6%的B类股(每股10票投票权),掌握85.1%的投票权。IPO后这个比例会下降,但仍将保持在50%以上。

    今年年初马斯克获得了一份新的薪酬包:如果SpaceX市值达到7.5万亿美元,并且在火星建立拥有至少100万居民的永久人类殖民地,他将最多获得10亿股B类股。如果公司建成每年可提供”100太瓦计算能力”的太空数据中心,他还能拿到更多股份。

    这些目标听起来像在开玩笑,但招股书白纸黑字写着的。这份IPO招股书里既有很具说服力的商业数据(星链1000万用户、110亿美元营收),也有很度超前的设想(星舰地面交通系统、太空旅游、小行星采矿)。市场买不买账,几个月内就能见分晓。


  • OpenAI声称解决80年数学难题,这次好像是真的

    80年前,匈牙利数学家保罗·厄多斯(Paul Erdős)提出了一个几何猜想,数学家们围绕它研究了大半个世纪。现在,OpenAI站出来说:我们的模型推翻了它。

    Erdős数学问题示意图
    厄多斯猜想相关数学问题示意图 | 图片来源:TechCrunch

    听到这个消息,第一反应可能是:又来了。7个月前,OpenAI前副总裁凯文·韦尔(Kevin Weil)在X平台上高调发文,说GPT-5找到了10个此前未解的厄多斯问题解决方案。结果被打脸了——那些”解决方案”早就存在于已有的学术文献中。竞争对手杨立昆和DeepMind首席执行官哈萨比斯都出来嘲讽,韦尔很快删了那条帖子。

    “近80年来,数学家们一直认为最优的解决方案大致类似方形网格。OpenAI的模型现在已经推翻了这一认知,发现了一种全新的构造家族,其表现更优。”

    这次有什么不同

    上次是野生宣传,这次OpenAI学乖了。随声明一同发布的,有数学家诺加·阿隆(Noga Alon)、梅兰妮·伍德(Melanie Wood)和托马斯·布鲁姆(Thomas Bloom)的支持性说明。布鲁姆是”厄多斯问题网站”的维护者,上次韦尔发那条不实帖子时,正是布鲁姆站出来说那是一条”严重歪曲事实”的声明。

    也就是说,这次站在OpenAI背后的,是上次亲手拆穿他们谎言的同一个人。如果连布鲁姆都认可了,可信度确实高了不少。

    OpenAI表示,这次给出证明的不是专门为解数学题训练的系统,而是一个新的通用推理模型。这意味着AI系统现在更有能力维持长链条的复杂推理,并且以研究人员此前未探索过的方式跨领域连接不同的想法。

    为什么这件事重要

    OpenAI在声明里说,这标志着”AI首次自主解决了一个数学领域核心的知名开放问题”。这话听起来有点自卖自夸,但背后的逻辑是成立的——如果一个AI系统能在纯数学领域给出人类未曾发现过的原创证明,那么它在生物学、物理学、工程学和医学领域的应用潜力就变得非常真实了。

    托马斯·布鲁姆说了一句挺有意思的话:”AI正在帮助我们更全面地探索我们数百年来建造的数学殿堂,还有哪些看不见的惊喜在等待我们去发现?”这话听起来有点文艺,但指向的问题很硬核:人类数学研究受限于人脑的推理链长度和信息整合能力,AI如果真的能突破这个瓶颈,整个基础科学的研究节奏都会被改写。


    当然,科学圈向来谨慎。OpenAI说它解决了,和数学界公认它解决了,是两回事。同行评议和程序化验证还在路上。但至少这次,OpenAI没有像上次那样提前开香槟。

  • OpenAI推理模型推翻80年数学猜想,AI数学能力真的起飞了

    5月20日,OpenAI宣布了一个在数学圈炸锅的消息:他们的一款内部推理模型,成功推翻了保罗· Erdős在1946年提出的「单位距离猜想」。这个问题困扰了数学界将近80年,现在被AI给解了。

    如果你对Erdős这个名字不太熟悉——他是20世纪最多产的数学家之一,一生发表了1500多篇论文,提出的开放问题多得数不清。这个「单位距离猜想」说的是:在平面上放一堆点,如果任意两个点的距离都是1(单位距离),那么这种点的排列方式有没有上限?

    Erdős猜想的答案可能是「没有上限」——你可以构造任意大的点集,使得所有点对的距离都是1。OpenAI的模型给出了一个新的构造方法,证明了Erdős的直觉是对的。

    为什么这次值得认真看待

    今年2月,OpenAI前副总裁Kevin Weil曾经宣称「GPT-5解决了10个Erdős问题」,结果被数学界集体打脸——那些「证明」经不起推敲,有些甚至是错的。

    但这次不一样。OpenAI找了Noga Alon和Melanie Wood这两位顶级数学家独立验证,结论是对的。这种级别的同行评议,基本等于把「AI证明」这件事从「噱头」提升到了「科研工具」的层次。


    菲尔兹奖得主也下场了

    就在OpenAI官宣的前几天,剑桥大学数学教授Timothy Gowers(菲尔兹奖得主)发了一篇博客,详细记录了他用ChatGPT 5.5 Pro做数学研究的经历。他的评价是:「这是我第一次真正感受到AI在数学推理上的突破。」

    Gowers用ChatGPT 5.5 Pro处理了几道博士级别的原创性数学问题,模型大约花了一个小时就给出了完整的解答过程。他自己动手验算了一遍,逻辑是通的。

    菲尔兹奖得主的背书分量很重。如果连Gowers都觉得「这玩意儿真的能干活」,那AI在数学领域的应用可能比我们想象的要快得多。

    对AI研究的启示

    这次突破的意义,不只是「AI会做数学题」这么简单。它说明了一点:大模型的推理能力已经开始触及「原创性思维」的边界

    过去我们觉得AI擅长的是「模式识别」——给它看成千上万道微积分题,它能学会做题的规律。但Erdős猜想这种问题,没有「题库」可以刷,需要的是真正的数学直觉和构造能力。

    • OpenAI的模型用的是「推理链」机制——它会自己分解问题、尝试不同的构造方法、反复验证每一步的正确性
    • 这种能力如果迁移到软件工程、芯片设计、药物发现这些领域,影响会是系统性的
    • 当然,目前还停留在「辅助研究」阶段,离「AI独立做科研」还有距离

    写在最后

    从2月被数学界打脸,到5月拿出经得起验证的证明,OpenAI用了大约三个月。这个节奏,比很多人预期的要快。

    AI会不会在不久的将来成为数学家的「标配工具」,就像现在的数学家离不开Latex和Mathematica一样?这个答案,可能比我们想象的更早到来。