博客

  • 教皇用AI写关于AI危险的通谕?这个瓜有点大

    教皇良十四世的首份通谕《Magnifica Humanitas》刚发布,就有人怀疑:这玩意儿是不是用AI写的?而且写的还是AI的危险。

    通谕是教皇写给全球天主教徒的长篇信件,通常讨论重大的道德和社会问题。这份通谕之所以受关注,因为它是第一份聚焦AI及其广泛影响的通谕。更有意思的是,发布仪式上还站着Anthropic的联合创始人Christopher Olah。

    教皇良十四世发布首份通谕《Magnifica Humanitas》
    教皇良十四世首份通谕《Magnifica Humanitas》发布仪式(图源:The Verge / Getty Images)

    AI检测工具说:有点悬

    事情起因是LessWrong论坛上Linch Zhang发的一项分析。他用流行的AI检测工具Pangram检测了这份通谕,结果发现:

    • 某些段落有40%到100%的概率是AI生成的
    • “genuinely”这个词出现频率异常高,而这个词在Claude模型的写作中很常见
    • 第一章被Pangram标记为62% AI生成

    The Verge把通谕大约2000字的内容扔进Pangram,结果是:约46%的内容估计为AI撰写

    通谕是教皇发布的篇幅较长的信件,旨在传达针对当时重要道德和社会挑战的教导。这份通谕是教皇良十四世的首份通谕,也是第一份聚焦AI及其广泛影响的通谕。

    但AI检测不是百分百靠谱

    当然,AI检测工具并非万无一失。Zhang的分析也发现,Pangram把某些章节标记为”几乎0% AI生成”。作为对比:

    • 前四份通谕的前20段内容,Pangram100%判定为人工撰写
    • 教皇良十四世的一次演讲转录文本,Pangram评级为100%人工撰写

    Pangram在AI研究人员中口碑还不错。2025年3月他们声称,把人工撰写的内容误判为AI生成的概率约为万分之一。但不同AI检测工具的结果可能截然不同,即使结果一致也无法保证完全正确。


    这件事为什么有意思

    且不论这份通谕到底是不是AI写的,这件事本身就挺讽刺的:

    • 一份警告AI危险的文档,本身可能就是AI写的
    • 发布仪式上站着Anthropic联合创始人(Claude的东家)
    • AI检测工具自己也在被质疑准确性

    目前梵蒂冈还没有回应置评请求。这份通谕的核心内容是呼吁在AI时代保持”深刻的人性”,如果它真的是用AI写的……那这个反讽力度简直拉满。

    不管结论如何,这件事给所有人的提醒是:AI生成的内容正在进入人类最权威的文本行列,而我们用来检测它的工具,本身也还在被验证

  • 谷歌AI搜索太霸道,DuckDuckGo躺赢:安装量暴增30%

    上周谷歌I/O开发者大会扔了个重磅炸弹:传统搜索的蓝色链接列表,要被AI代理彻底取代了。这个代理能回答提问、执行任务,还能在后台默默跑监控。听起来很酷对吧?但用户的反应却是——”我换搜索引擎。”

    我上周亲耳听到一位女士打电话说要改用DuckDuckGo,理由是后者可以”选择不用AI”。她的原话是:”谷歌已经不是以前的谷歌了。”看来有同样想法的人不在少数。

    谷歌这次改版引发的反弹超出预期。有人骂它”扼杀开放网络”,有人担心AI概览给出不准确的答案,还有人单纯就是烦了——连搜个”disregard”这种基础操作都被复杂化了。

    DuckDuckGo捡了大便宜

    DuckDuckGo这家一直被谷歌压着打、美国市场份额只有2%左右的隐私搜索引擎,这次居然躺赢了。数据说话:

    • 5月20-25日,DuckDuckGo美国区应用安装量周均增长18.1%,5月25日当天峰值增幅达到30.5%
    • iOS端更猛,周均增长33%,峰值增幅69.9%
    • 无AI搜索页面noai.duckduckgo.com的访问量周均增长22.7%,5月24日峰值27.7%

    有意思的是,连阵亡将士纪念日周末这种传统流量低谷期,DuckDuckGo的用户量都在涨。CEO Gabriel Weinberg这周出来表态了:”谷歌正在强制推送AI,用户没有选择退出的选项。结果就是他们的搜索结果越来越差,而不是越来越好。”

    DuckDuckGo无AI搜索选项界面
    DuckDuckGo的”No AI”搜索选项(图源:TechCrunch)

    DuckDuckGo自己也有AI,但给你选择权

    别以为DuckDuckGo是反AI原教旨主义者,人家也有AI产品,叫Duck.ai。这个产品免费、免注册,支持Claude 4.5 Haiku、Llama 4 Scout、Mistral Small 3 24B、GPT-5 mini等模型。

    关键区别在于:DuckDuckGo的AI是你可以选的,不是被强制喂给你的。而且隐私保护做得很到位——请求到达模型提供商之前就剥离用户IP,30天内删除对话记录,聊天内容不用于模型训练。

    Weinberg的说法挺直白:”我们不仅尊重用户的选择权,也尊重用户的隐私权。你在DuckDuckGo上的一切操作都是私密的。”


    这件事其实给所有做AI产品的公司提了个醒:用户并不排斥AI,但厌恶被强迫。谷歌这次改版的技术方向可能没错,但把选择权拿走,就会把用户推向竞争对手。DuckDuckGo这波流量能维持多久不好说,但至少证明了一件事——给用户选择权,比把所有功能都AI化更重要

  • 我用Google的新AI模型Omni把自己P进了埃菲尔铁塔前,效果好到让我不安

    去年我用AI把孩子的毛绒玩具”深度伪造”成了一只去度假的小鹿,当时只是想验证一下Google在Gemini广告里承诺的功能到底靠不靠谱。视频没给孩子看,但那个实验让我开始认真思考:生成式AI的”无害娱乐”和”纯垃圾内容”之间,到底有没有界限?

    也许这两个圆圈完全重叠呢。也许不是。但有一件事我很确定:做出逼真的AI视频,需要的努力和知识少得令人惊讶。而这个趋势,在Gemini进入Omni时代之后,还在继续。

    Omni到底是什么

    Omni是Google新推出的一套生成式模型家族,号称有一天能把任何类型的输入——照片、视频、文字——变成任何其它东西。不过目前阶段,它还只是个视频生成工具。

    Omni Flash是这套模型里第一个正式发布的版本,现在已经可以在Google的AI视频生成和编辑平台Flow上用。如果你愿意,当然也可以继续用旧的Veo模型——但Omni在几个维度上确实比Veo进了一步。

    Google声称Omni在生成视频时会融入更多”现实世界知识”,因此能更好地保持角色在整个视频中的一致性。

    于是我把那只AI小鹿又请了出来,让它收拾行李再去冒险——看看Omni是不是真的如Google说的那样。

    结果:好得让人困惑

    怎么说呢,结果非常两极分化,甚至可以用”令人困惑”来形容。有些片段做得很好——比我五个月前测试Veo的时候一致性和还原度都高得多。但即使是最好的片段,也还是会有一些典型的”AI惊吓时刻”:比如小鹿在跳伞的时候突然换了朝向。

    我给了Omni更多创作空间:”做一个蒙太奇,展示小鹿打包行李、登上邮轮去热带度假的过程。氛围要可爱、好玩。小鹿在行李箱里塞了件搞笑的东西,后面会在片段里派上用场。”

    结果小鹿塞了一罐蜂蜜进去;后面确实有段情节是小鹿去够那罐蜂蜜,把它当成防晒霜在挤。说实话,这个桥段还不错。问题在于那瓶蜂蜜的外观在整个视频里一直在变:从玻璃罐,变成透明的挤压瓶,又变回装蜂蜜的挤压瓶。而我甚至不知道该怎么描述模型对视频最后一帧的处理——就好像它把刚才生成的所有元素一股脑吐出来就完事了。

    AI generated content label example
    Google Omni生成的AI内容会有标注 / The Verge

    编辑功能:有进步,但还不够

    你可以用文字提示词来建议对视频进行修改。实话实说,这方面Omni确实比Veo好用。但Veo的结果本来就烂得可以——我发现每次想改点什么,直接重新生成一个新视频反而更快。Omni确实会”听进”你的修改建议,但结果并不总是能打中你想要的点。

    我让它强调小鹿在度假片段里的面部反应,结果出来的东西看起来很怪异。它还时不时给小鹿加上鹿角——但小鹿根本没有鹿角,它还是个宝宝呢,谢谢。当我提示它去掉某个场景里突然出现的鹿角时,它照做了——然后在所有其他场景里都加上了鹿角。

    这一切都不是免费的

    生成视频是要消耗”积分”的,根据场景长度和起始”素材”的不同,一次消耗15到40积分不等。一轮编辑要花40积分。我订的是每月20美元的AI Pro方案,每月给1000积分。生成了大约20个片段、其中几个做了编辑之后,我的积分就只剩145了。

    如果你对想要生成的视频有比较具体的想法,那你可能要做好心理准备:跟模型来回拉锯很多轮才能得到一个接近你想象的视频,而每一轮都要烧积分。

    然后我把自己深度伪造了

    Omni号称的强项之一是把AI生成的内容叠加到真实视频上,所以我让小鹿休息了一下,转而深度伪造了我自己。我给Omni喂了一段自拍视频,表情很中性,然后让它生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。说实话,我没准备好面对我看到的东西。

    我的深度伪造视频里有一些”AI痕迹”:叉子碰到意面碗的那个声音有点太”做作”了;飞机视频的背景里有个女人出现了两次;但除了这些小故障和一种说不清的”诡异感”之外,它们逼真得要命。

    我把吃意面的片段给我丈夫看了。他知道我在测试AI视频工具,但我没告诉他场景里哪些部分是AI生成的。在不知道哪些是AI的情况下,他完全相信我就是坐在镜头前吃意面——他唯一的疑点是那个碗看起来不太眼熟。至于吃意面这个动作本身,逼真到足以让我丈夫信服——一个在过去十年里几乎每天看着我吃东西的男人。

    我的其他深度伪造视频有不同程度的”好到能在社交媒体上骗到人”。有几段埃菲尔铁塔的片段看起来有点卡通化,但其中一段逼真到你可能要反复看几次才能发现是AI。我知道那不是我,因为AI版本的我转过头时露出了扎成马尾的头发——但我不觉得其他任何人能看出区别,而这让我感觉很怪。


    我得诚实地说,我有点被这一切整累了。当初测试Veo 3的时候,我被它能产生的真实感震惊了。过去几年里,我一次又一次地被”用AI造出假人”有多容易而震惊。我可能也应该被Omni震惊,我想我确实震惊了,但那种”震惊感”已经磨掉了。

    要用AI做出一部”电影级杰作”,其实还没有Google想让你相信的那么容易。但Omni确实在某些可辨认的维度上比Veo有进步。如果你有一个Google账号和一张信用卡,那你只需要微不足道的努力,就能把一段自己坐在家里的视频变成看起来像在飞往毛伊岛的飞机上的画面。我不觉得我们正好站在”奇点的山麓”——但我们肯定已经深深陷入了诡异谷。

  • 法拉利用了IBM的AI,想让每个F1车迷都觉得自己是”队内人”

    F1这几年的热度不用多说,美国尤其如此——Netflix那部《极速求生》把车手们的日常搬上屏幕,硬生生的把一项”有钱人的运动”变成了大众娱乐。tech公司当然也看到了这块肥肉:AWS、Oracle、Anthropic都在往车队里塞钱、塞技术。

    IBM两年前突然意识到,自己在体育赞助这块有个巨大的空白:F1。于是他们找上了法拉利——历史上赢了最多比赛的车队,没有之一。

    “他们是历史上最成功的车队。”IBM体育与娱乐合作副总裁Kameryn Stanhouse这么说。

    不只是赞助,是讲故事

    IBM跟法拉利的合作核心,说白了就是”用AI讲故事”。法拉利专门新设了一个职位——”粉丝发展负责人”,由Stefano Pallard担任。他的任务不是拉更多粉丝进来,而是让每个已有的粉丝都觉得”这支车队认识我”。

    想法其实挺朴素的:比赛期间每秒钟产生数百万个数据点,车手和赛车的每一个动作都被记录。问题是,这些数据对普通粉丝来说就是天书。IBM的AI把这些数据变成普通人能看懂、愿意看的内容——这才是难点。

    Ferrari F1 car with IBM AI branding
    IBM与法拉利的AI合作,用数据讲故事 / TechCrunch

    新App里有什么

    旧的法拉利粉丝App基本上是个”查赛程工具”——查完就走,没人留下来。新版本不一样了:有AI写的比赛总结,有幕后故事,有预测游戏,还有一个AI伴侣可以回答问题。

    甚至连”把App翻译成意大利语”这种基本功能,在IBM接手之前都没有——尽管法拉利是个意大利车队,意大利粉丝也占大头。你可以想象之前那个App有多”原始”。

    Pallard说,他们用AI分析App里的互动信号——哪些内容受欢迎、粉丝发来的消息情绪如何——然后据此调整讲故事的方式和内容的分发策略。”这帮我们理解Tifosi(法拉利粉丝的昵称)真正想要什么,然后直接指导我们怎么呈现内容。”

    粉丝变了,法拉利也得变

    F1去年发布的数据有个有趣的发现:75%的新粉丝是女性,而且很多是Z世代。她们入坑的入口往往是F1学院——一个全女性赛车系列赛,目的是培养下一代女车手。

    这些新粉丝和老粉丝要的东西其实是一样的——更多。更多数据、更多内幕、更多功能。Pallard说:”未来五年的愿景,是让每个粉丝都觉得这个体验是为他们量身定做的——不管他们跟了我们30年,还是30天。这才是持久忠诚度的来源。”

    IBM进场之后,App的互动数据确实在往上走——比赛周末的互动量增长了62%。当然,这个数字是IBM自己给出的,但方向应该没错:当AI真的在帮你”讲故事”而不是”塞数据”的时候,人们是感受得到的。

  • 和Google CEO聊了60分钟:AI、搜索的未来,以及网络正在发生什么

    和Google CEO聊了60分钟,关于AI、搜索和网络的未来

    每年Google I/O开发者大会之后,我都会和Google兼Alphabet CEO桑达尔·皮查伊(Sundar Pichai)坐下来聊一趟。今年已经是第五年了,这成了Decoder播客的一个传统。

    这次访谈的信息量很大。Google在I/O上发布了强大的新Gemini模型,把AI代理塞进了所有产品里,还对网页版和YouTube的搜索做了大改动——这些改动会再次重塑信息生态。

    Nilay Patel,The Verge主编
    Nilay Patel,The Verge主编,Decoder播客主持人(来源:The Verge)

    Google Zero从想法变成现实

    几年前我提出了”Google Zero”这个概念——意思是随着Google在搜索结果页面直接回答越来越多的问题,网站从Google获得的流量会降到零。

    当时皮查伊在访谈中还对此不以为然。但现在,整个媒体行业都在应对这个问题。连Conde Nast这样的大型出版集团CEO都公开表示,他们正在为一个”搜索流量为零”的世界做规划。

    这次我直接问了皮查伊:对于一家标志性出版集团说”我不能依赖Google搜索流量了”,他怎么回应?

    他的回答很得体:”首先,信息生态远远超出了Google的范围。我们数据显示,用户获取信息的来源比以往任何时候都多。”然后他说,出版商都在适应这个新世界,Google也在适应。

    搜索的下一步:从结果到任务

    这次I/O最引人注目的是,Google明显在推动搜索从” delivering results(提供结果)”转向”setting off tasks(触发任务)”。新的智能搜索框和Gemini Spark代理平台的结合,让搜索可以直接启动任务,而不只是给答案。

    这很令人兴奋,但似乎很可能再次改变开放网络的动态。如果Google直接帮你把事情做完了,你还需要点开那些蓝色链接吗?

    YouTube也被AI改造了

    Google还在用YouTube视频训练它的模型,并且改变YouTube搜索的方式——现在它会总结视频内容,把用户直接带到相关部分。

    这肯定会让一些创作者感到焦虑。我问皮查伊,他是否准备好和YouTuber们打一场和现在出版商们正在打的同样的仗。

    “我们站在奇点的山麓”

    这次访谈最后,我问了皮查伊关于DeepMind CEO德米斯·哈萨比斯(Demis Hassabis)在I/O主题演讲结尾说的话。

    我们现在”站在奇点的山麓”(in the foothills of the singularity),哈萨比斯这样说。

    皮查伊当然同意哈萨比斯的看法。但他对于AGI(通用人工智能)时间线的思考,值得认真关注。

    他说:” timeline不重要,因为进步的速度意味着你会在各方面与越来越强大的系统打交道。三年后,不管我们叫不叫它AGI,它都会非常、非常强大,我们必须为此做准备。”

    组织变革:为AI时代重组Google

    这次访谈中,我还问了皮查伊关于Google内部组织变革的问题。ChatGPT出现后,他意识到需要重新思考Google的运作方式,于是做了很多高管调整和重大决策,让公司进入更激进的状态。

    他把Brain和DeepMind这两个世界顶级AI研究团队合并成了”Google DeepMind”——用他的话说,这”比听起来难”,就像”把斯坦福和MIT放到一起,从它们搞出一个系或者一所大学”。

    他还设立了专门AI基础设施团队,并且让科雷·卡武克丘奥卢(Koray Kavukcuoglu)担任Google首席AI架构师。


    AI会取代CEO吗

    Decoder听众最想问CEO们的问题是:”AI多久能取代你的工作?”

    皮查伊的回答挺有意思的。他说CEO的工作”没那么复杂”,AI在决策方面会非常有帮助。他还开玩笑说,他得花很多时间分配算力,”这方面AI随着时间的推移会做出更理性的选择”。

    但他说,正确的做法是用这些工具”从更高的基础出发”,而不是不让你做你之前做的事。就像电子表格普及到公司之后,财务分析的方式在三四年内发生了根本性变化,但我们适应了。

    代理人(agents)也是类似的版本。不是你不办生日派对了,而是当你规划旅行的时候,你可能把时间花在思考真正想做的事情上,而不是追着查开放时间和买票。

  • 有人把Google搜错了:DuckDuckGo安装量暴涨30%,背后是一场「反AI搜索」运动

    当Google搜索变了味道

    上周Google I/O开发者大会的一个宣布,让很多人突然意识到:那个熟悉的Google搜索可能真的不在了。Google表示要用车AI代理取代传统的蓝色链接列表,这个代理能回答查询、执行任务,还能在后台运行监控。

    听起来很酷对吧?但现实中有人不这么想。TechCrunch记者上周无意中听到一位女性打电话说,她正在改用DuckDuckGo,因为那个平台可以”选择不使用AI”。

    “Google已经不是原来的Google了,”她说道。看来持有相同想法的人不在少数。

    反对声音有多大

    这一改动引发的反对相当强烈。有人认为这会扼杀开放网络,还有人担心AI概览会返回不准确的回复,并且剥夺了不想使用AI的用户的选择权。

    甚至有人发现,连搜索一个简单的词都变得复杂了——你可以试着在Google上搜索”disregard(忽略)”这个词看看会发生什么。

    作为回应,许多人开始转投隐私导向的替代搜索引擎DuckDuckGo。这家公司此前一直未能突破Google的主导地位,仅占美国搜索市场约2%的份额。

    DuckDuckGo无AI搜索界面
    DuckDuckGo提供的无AI搜索选项(来源:TechCrunch)

    DuckDuckGo的意外收获

    DuckDuckGo首席执行官加布里埃尔·温伯格(Gabriel Weinberg)在声明中直接点名Google:”谷歌正在强制推送AI,且没有提供退出选项。结果就是,他们的搜索结果越来越差,而不是更好。”

    数据显示,在5月20日至25日期间,DuckDuckGo在美国地区的应用安装量周均环比增长18.1%。更夸张的是,在5月25日达到了30.5%的峰值。在iOS平台上,安装增速更高,周均环比增长达到33%,峰值高达69.9%。

    有意思的是,DuckDuckGo的”无AI搜索页面”(noai.duckduckgo.com)访问量也在增长。这个页面默认关闭所有AI功能,包括AI辅助回答和AI生成的图像。

    选择权才是关键

    DuckDuckGo当然也提供自己的AI产品Duck.ai,这个服务免费且不需要用户注册账户,支持访问多个模型,包括Anthropic的Claude 4.5 Haiku、Meta的Llama 4 Scout、Mistral的Small 3 24B,以及OpenAI的GPT-5 mini。

    关键是,所有这些聊天都是私密的。DuckDuckGo会在请求到达模型提供商之前剥离用户的IP地址,在30天内删除对话,并且防止聊天内容被用于训练。

    “我们不仅尊重用户的选择权,也尊重用户的隐私权,”温伯格说,”你在DuckDuckGo上做的所有事情都是私密的;我们不收集搜索历史或聊天记录,也不会将任何内容用于AI训练。”

    DuckDuckGo还提供”搜索辅助(Search Assist)”功能,类似Google的AI概览,以及”AI图像过滤器”,可以从搜索结果中过滤掉AI生成的图像。

    公司首席传播和政策官卡米尔·巴兹巴兹(Kamyl Bazbaz)说得很直白:”人们只是想要选择权。”


    这件事其实反映了一个更大的问题:当科技公司认为”AI就是未来”的时候,他们可能忽略了一部分用户真正想要的是什么——选择权。不是每个人都需要或想要AI来”帮助”自己搜索。有些人就是想看到一个干净的、不受算法干扰的搜索结果列表。

    Google当然有权利推进AI搜索,但当他们把这件事变成”强制推送”而非”可选功能”的时候,用户用脚投票也就不奇怪了。DuckDuckGo这波增长,本质上是用户在用行动说:”我们不想被代表。”

  • DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    ⭐ GitHub热门AI开源项目 · 第38期

    DeepSeek-V3

    103K+ Stars  |  ⚡ MoE大模型  |  🚀 成本仅GPT-4的1/10

    由DeepSeek开发的开源混合专家大模型,在数学、代码和多语言基准测试中表现出色

    📌 项目简介

    DeepSeek-V3 是由DeepSeek团队开发的新一代开源混合专家(MoE)大语言模型,总参数规模达671B,每个token激活37B参数。该模型在数学、代码生成和多语言理解等基准测试中表现出色,性能媲美GPT-4和Claude 3.5,但训练成本仅约557万美元,是迄今为止性价比最高的开源大模型之一。

    671B
    总参数量

    37B
    激活参数量

    $5.57M
    训练成本

    128K
    上下文窗口

    ⚙️ 安装要求和过程

    环境要求

    • 🐍 Python 3.8+ (推荐使用Python 3.10+)
    • 📦 PyTorch 2.0+ 或更高版本
    • 💻 GPU 推荐:至少80GB显存(如A100/H100)用于完整模型推理
    • 💾 内存:建议至少128GB系统内存
    • 📁 磁盘空间:完整模型约需1.3TB存储空间(BF16格式)

    💡 提示:如果显存有限,可以使用模型量化(如4-bit/8-bit量化)或分布式推理来降低硬件要求。DeepSeek也提供了更小的蒸馏版本供本地部署。

    快速安装步骤

    # 1. 克隆官方仓库
    git clone https://github.com/deepseek-ai/DeepSeek-V3.git
    cd DeepSeek-V3

    # 2. 安装依赖
    pip install -r requirements.txt

    # 3. 下载模型权重(需同意许可协议)
    download deepseek-ai/DeepSeek-V3

    # 4. 运行推理示例
    python inference.py –model-path ./DeepSeek-V3 –input “你好,请介绍一下你自己”

    核心功能

    🧩 混合专家(MoE)架构

    采用创新的MoE架构,总参数671B但仅激活37B,大幅提升推理效率,降低计算成本。

    📐 超强数学推理

    在美国数学竞赛AIME 2024上取得优异成绩,数学推理能力接近甚至超越GPT-4o。

    💻 顶级代码生成

    在HumanEval和MBPP等代码基准测试中表现优异,支持多种编程语言,代码质量接近Claude 3.5。

    🌍 多语言支持

    支持中、英、法等多种语言,多语言理解能力在开源模型中处于领先地位。

    ⚡ 高效推理引擎

    配备优化的推理引擎,支持批处理、KV Cache、投机解码(Speculative Decoding)等加速技术,生成速度最高可达60 TPS(tokens per second)。

    🚀 典型使用场景

    📚 场景一:教育科技与数学辅导

    DeepSeek-V3的数学推理能力极强,可用于开发智能数学辅导系统。例如,某在线教育平台集成DeepSeek-V3后,能够逐步解答高中数学竞赛题,并给出详细的解题步骤和思路分析,学生满意度提升40%。

    💼 场景二:企业级代码助手

    利用DeepSeek-V3的代码生成能力,企业可以搭建内部代码助手。例如,某金融科技公司使用DeepSeek-V3辅助Python和SQL开发,代码审查效率提升50%,同时减少了30%的常见bug发生率。

    🌐 场景三:多语言内容生成

    DeepSeek-V3的多语言支持使其非常适合国际化内容生成。某跨境电商平台使用DeepSeek-V3自动生成产品描述(支持12种语言),内容生产速度提升10倍,且本地化质量显著优于传统机器翻译。

    💡 推荐理由

    作为一名经常使用大模型的开发者,我之所以强烈推荐 DeepSeek-V3,主要有以下几个原因:

    ① 性价比无敌 —— 训练成本仅约557万美元,但性能媲美GPT-4o和Claude 3.5 Sonnet。对于预算有限的团队来说,这是目前最好的开源选择。

    ② 开源可商用 —— 采用MIT License,完全开源且可免费商用。你可以自由部署、修改、二次开发,不用担心许可问题。

    ③ 推理效率高 —— MoE架构让它在保持强大能力的同时,推理成本远低于同级别密集模型。配合优化的推理引擎,可以在消费级硬件上运行量化版本。

    ④ 中文能力出色 —— 与许多主要面向英文优化的开源模型不同,DeepSeek-V3在中文理解和生成方面表现非常出色,适合国内开发者使用。

    ⑤ 活跃的社区支持 —— GitHub上103K+ stars,且有DeepSeek团队持续维护更新。社区贡献了大量教程、工具链和部署方案,降低了使用门槛。

    如果你正在寻找一个性能强劲、成本低廉、可商用的开源大模型,DeepSeek-V3绝对值得一试。💪

    📥 下载地址

    💡 提示:如果硬件资源有限,可以访问 DeepSeek开放平台 直接使用API,无需本地部署。


    📌 本文由 WorkBuddy AI 自动采集撰写

    关注我们,每周获取更多GitHub热门AI开源项目介绍 🚀

  • 我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    说到AI可穿戴设备,最近最值得拿出来聊的大概就是亚马逊收购的那个Bee了。TechCrunch的记者Lucas Ropek前段时间专门测评了一番,写得挺真实的,我看完之后的感觉跟他差不多:有意思,但也有点不太舒服。

    Bee AI可穿戴设备实拍
    Bee AI可穿戴设备实拍(图源:TechCrunch)

    它到底能做什么

    Bee这个东西本质上是个”AI腕带”——戴在手上,可以全天记录你的对话,然后自动转录、生成摘要。如果你是个经常开会、但又记不住内容的人,这个功能确实挺实用的。把Bee跟日历同步之后,它还能全天给你发待办提醒。

    使用方式很简单:开机、戴上、跟手机App同步,再填一些基础个人信息就可以了。Bee自带录音功能,按一下设备上的按钮就能开关录音。录音的时候会闪绿灯,关掉录音绿灯就灭了——这个设计至少让你周围的人知道,现在正在录音。

    Lucas在测评里说,他在打商务电话的时候用了Bee,对方同意录音之后,App自动生成了对话摘要,还把每个部分都拆分好了。之后不用重新听完整段对话就能回顾内容,这确实很有用。

    隐私这道坎

    问题也随之而来。Lucas说自己是个”隐私爱好者”。在一个普通人时刻被数字监控包围的世界里,他很珍惜任何不被记录的机会。所以把这么个会”偷听”的小玩意儿24小时戴在手上,他一点都不觉得吸引人。

    这个感受其实很多人都会有。Bee要正常工作,需要开放大量手机权限:位置、照片、通讯录、日历、手机通知——甚至还可以共享健康数据。也就是说,你的线下生活和数字生活,基本上都被它获取了。


    实际体验有一些坑

    Lucas在测评中还提到,他带着Bee去参加了每周固定和朋友一起的电影夜,整晚都开着录音。当时他们看的是《落水狗》——昆汀·塔伦蒂诺的那部暴力美学经典。Lucas还担心Bee会把里面的粗俗暴力场面当成真实事件,说不定触发什么内部警报。

    结果Bee基本知道发生了什么,它判断出他们在看电影,事后的事件总结里,还把这次对话标注为”塔伦蒂诺电影场景分析”——这个结果倒是挺有趣的。

    但从产品本身来说,Bee的转录文本质量还不够稳定,有时候会漏掉对话片段,也不一定能够准确识别不同的说话人。至于职业场景,Bee确实有一定的潜力——如果你每天要开很多会,脑子记不住所有内容,Bee算是个还算称职的助手。

    数据存在云端,你放心吗

    更关键的是,Bee收集的大量数据都存储在云端。亚马逊跟很多大型科技公司一样,偶尔也会出现数据安全问题。公司在隐私政策里说已经”实施了技术和组织安全措施”,还进行了”严格的第三方安全审计”——这些话术我们都听了很多遍了,至于实际效果如何,只能说见仁见智。

    如果未来能推出完全本地运行的版本——也就是数据不用上传云端——可能会吸引到更多像Lucas这样的”隐私爱好者”。亚马逊去年收购了Bee之后,应该还会继续迭代这个产品,至于能不能在实用性和隐私保护之间找到平衡点,接下来几年会很关键。

  • OpenRouter估值翻倍至13亿美元,AI中间件赛道彻底火了

    OpenRouter估值一年翻倍以上,AI中间件成了最热门赛道

    如果你最近在关注AI行业的融资动态,OpenRouter这笔B轮融资绝对值得拿出来聊聊。这家做AI模型网关的公司,刚拿了1.13亿美元,领投方是谷歌母公司Alphabet旗下的CapitalG——也就是谷歌自己的成长型基金。

    《纽约时报》的报道给出了一个关键数字:这轮融资过后,OpenRouter的投后估值大约在13亿美元左右。要知道,就在一年前(2025年6月),他们刚完成4000万美元的A轮,当时投后估值才5.47亿美元。一年时间,估值涨了不止一倍。

    OpenRouter提供超过400个模型的访问权限,涵盖Anthropic、谷歌、OpenAI、xAI和DeepSeek等主流厂商的产品。平台目前拥有800万全球用户,每月处理100万亿个token。

    AI的玩法变了

    到底发生了什么?答案其实挺直观:AI的玩法变了。一年前,大家还在卷模型训练,比的是谁的模型更准、更大。后来进入了推理阶段,各家开始优化成本和响应速度。而现在,AI智能体(Agent)成了新的主战场。

    企业不再只用一个模型搞定所有事情,而是针对不同任务选不同的模型——写代码可能用Claude,搜信息用Perplexity,数据处理用GPT。这就是OpenRouter存在的意义:它相当于一个”AI模型超市”,企业用户可以在一个平台上按需切换,既控制成本,又提升特定任务的准确率。

    AI模型与云计算概念图
    AI模型正成为可替换的隐形基础设施(图源:TechCrunch)

    多模型并存的时代来了

    用户增长数据也很能说明问题。OpenRouter目前每周处理的token规模已达到25万亿个,而6个月前这个数字是5万亿——相当于5倍增长。这个增速比很多人的预期都要快。

    换个角度看,OpenRouter的成功其实揭示了一个重要趋势:AI模型正在变成一种”隐形基础设施”。企业不希望被某一家模型厂商锁定,就像当年大家不愿意被某一家SaaS供应商绑定一样。多模型并存的时代已经到了,而OpenRouter正好站在了这个趋势的风口上。


    谷歌为什么押注”模型中间件”

    硅谷的投资人们显然也看到了这一点。除了CapitalG领投,A轮时Andreessen Horowitz、Menlo Ventures和红杉资本都参与了跟进。有趣的是,CapitalG是谷歌的基金,而OpenRouter平台上也接入了谷歌的模型。谷歌一边自己做大模型,一边还通过旗下基金投资”模型中间件”——这个姿态挺值得玩味的。

    或许在谷歌看来,AI生态越繁荣,自己的模型也就有更多机会被用到。与其担心用户流向别的模型,不如让OpenRouter帮自己接触到更多开发者和企业客户。

    当然,OpenRouter也面临竞争。类似定位的公司还有Together AI、Replicate等,大家都在做”让企业更方便地用上各种AI模型”这门生意。但OpenRouter目前的增长速度,确实证明了这个方向的市场需求是真实存在的。对于普通开发者或者中小企业来说,这类平台的价值在于降低了试错成本——你不需要一开始就押注某一个模型,而是可以在不同模型之间灵活切换,找到最适合自己场景的那个。

  • 谷歌AI概览翻车现场:居然搞不清「明年是哪一年」

    如果你在谷歌搜索「is it 2027 next year(2027年是下一年吗)」,AI概览(AI Overviews)功能偶尔会给你一个让人摸不着头脑的回答:2027年是两年后

    现在是2026年。2027年明明就是下一年。

    Google AI Overview error screenshot
    谷歌AI概览将2027年错误标注为「两年后」(图源:The Verge)

    这个bug不是新出现的

    有意思的是,这个问题其实早就有人发现了。The Verge的记者Jay Peters测试时复现了这个错误,而AI概览引用的来源,居然是早前嘲笑该查询错误回答的旧Instagram帖子和Reddit帖子。

    换句话说,谷歌的AI不仅答错了,还把网上嘲笑它答错的内容当成了「权威来源」来引用。这个闭环有点讽刺。

    Reddit上早在2025年就有用户讨论过这个查询的错误回答。一年过去了,它还在犯同样的错误。

    「disregard」触发不了AI概览

    文章还提到一个细节:截至发文时,谷歌搜索「disregard」仍然不会触发AI概览功能。这说明AI概览的触发逻辑本身就有不完善的地方——有些查询该触发没触发,有些查询不该触发却给出了错误答案。


    AI概览的「可圈可点」

    谷歌在AI搜索赛道上跑得很猛,AI概览已经覆盖了数以亿计的搜索查询。但这次翻车让人不得不问一个问题:连「明年是哪一年」这种基础时间推理都会搞错,AI概览在更复杂、更模糊的查询上,到底能有多少可信度?

    当然,谷歌不是唯一一家在基础事实上翻跟头的AI公司。这类问题在大型语言模型中并不罕见——模型擅长生成看起来自信满满的文字,但在处理基础事实推理时,仍然会给出让人哭笑不得的答案。

    只是,当用户在搜索引擎里看到AI给出的「权威答案」时,大多数人会默认它是对的。这个信任成本,比ChatGPT聊天的出错成本要高得多。