分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • 亚马逊要直接卖AI芯片了,英伟达迎来最重磅挑战者

    亚马逊要卖芯片了,英伟达的日子不好过了

    上个月,亚马逊CEO Andy Jassy在年度股东信里写了一句话,让整个芯片行业都竖起了耳朵:”如果把我们的芯片业务单独拿出来,今年卖给AWS和其他第三方的芯片,年运行率大概有500亿美元。”

    500亿美元是什么概念?差不多是Intel一年的营收。而现在,亚马逊真的打算把这块业务做大——直接把自家的AI芯片卖给其他公司,而不只是放在AWS云平台上自己用。

    亚马逊AI芯片
    亚马逊的Trainium芯片正在挑战英伟达的主导地位(图源:TechCrunch)

    Trainium到底是什么?

    亚马逊的AI芯片叫Trainium,是专门为训练大型AI模型设计的。目前用的是Trainium3,下一代Trainium4要等到明年才能量产。

    这块芯片之前只提供给AWS的客户——你想用Trainium,就得在AWS上跑。这也是为什么亚马逊一直不愿意对外卖芯片:反正你用了我的芯片,就得用我的云,存储、安全、网络这些服务我都能收钱,干嘛要把芯片单独卖给你?

    Jassy在股东信里说,现在的Trainium芯片产能一上线就卖光了,连明年的Trainium4产能也已经被预订一空。需求旺盛到这种程度,亚马逊才动起了对外销售的念头。

    亚马逊的底气从哪来?

    第一个底气是需求。AI芯片现在是全球最紧缺的资源之一,英伟达的GPU虽然强,但产能跟不上,价格也高得离谱。很多公司愿意尝试替代品,只要性能差不太多。

    第二个底气是客户。Anthropic、OpenAI、甚至苹果都在用AWS的Trainium芯片。这些公司愿意用自己的业务给亚马逊的芯片”背书”,说明Trainium确实能打。

    第三个底气是生态。亚马逊不只是卖芯片,它还提供全套的软件工具,让开发者能把自己的AI模型从英伟达GPU迁移到Trainium上。这套东西英伟达有,亚马逊现在也有了。

    英伟达会怕吗?

    短期来看,不怕。英伟达现在的年营收运行率是3260亿美元,亚马逊的500亿芯片业务就算全吃下来,也才英伟达的六分之一。更何况,英伟达不止卖GPU,它还在进军CPU市场,黄仁勋刚刚说要开辟一个2000亿美元的新市场。

    但长期呢?不好说。芯片这个行业,一旦有人做出了靠谱的替代品,客户就会开始分散风险——不会把所有鸡蛋放在一个篮子里。谷歌的TPU、亚马逊的Trainium、AMD的Instinct,都在瓜分英伟达的市场。

    而且,亚马逊如果真的开始对外卖芯片,它面临的第一个难题可能是制造产能。Trainium是台积电代工的,而台积电现在的头号客户是英伟达,不是亚马逊。亚马逊要想拿到足够的产能,得先说服台积电给它腾地方——这可不容易。


  • 诺贝尔奖得主John Jumper离开DeepMind,加入对手Anthropic

    诺贝尔奖得主跳槽,DeepMind失去一位核心科学家

    上周五,2024年诺贝尔化学奖得主John Jumper在X上宣布,在Google DeepMind工作了近9年之后,他要跳槽去Anthropic了。这条消息在AI圈子里炸开了锅——毕竟,能和诺贝尔奖得主扯上关系的公司不多,DeepMind和Anthropic现在居然成了”对手戏”。

    Jumper在帖子里的语气倒是很温和。他特意感谢了DeepMind CEO Demis Hassabis,说对方在自己博士毕业仅六个月的时候就敢让他领导AlphaFold团队,这确实冒了不小的风险。他还说,DeepMind是个特别的地方,以后也会很期待看到他们接下来能搞出什么大新闻。

    Demis Hassabis和John Jumper在Breakthrough Prize Ceremony上
    Demis Hassabis和John Jumper在Breakthrough Prize Ceremony上(图源:TechCrunch)

    AlphaFold到底有多厉害?

    要说Jumper为什么这么抢手,得先说说AlphaFold。这个AI模型能根据基因的序列,预测蛋白质的3D结构——听起来很专业?打个比方,就像是你给你一个字符串,它能告诉你这根绳子最后会折成什么形状。蛋白质的结构决定了它的功能,而搞清楚蛋白质结构,对理解疾病、开发新药都有关键意义。

    2024年,Jumper和Hassabis因为这个工作拿到了诺贝尔化学奖。诺贝尔奖官网当时说,AlphaFold”解决了困扰科学界50年的问题”。这话一点不夸张——以前科学家要用X射线晶体学这种实验方法,花几年时间才能搞清楚一个蛋白质的结构,现在AlphaFold几个小时就能给出预测。

    AlphaFold的开源让全世界的研究者都能用上这个工具。截至目前,AlphaFold预测的蛋白质结构已经超过2亿个,覆盖了几乎所有已知的蛋白质编码基因。

    为什么是Anthropic?

    Jumper为什么要走?目前还没有详细的公开说明。不过Bloomberg的报道提供了一个线索:Jumper是Google开发编码工具团队的关键成员,而这块业务在公司内部推得并不顺利,卖给企业客户的时候遇到了不少阻力。

    Anthropic这边呢,一直在招兵买马。这家公司由前DeepMind和OpenAI的研究人员创立,主打”安全可靠的AI”,目前是AI领域最受关注的公司之一。Claude就是他们家的产品。能把Jumper这样的顶尖人才挖过来,对Anthropic的基础研究能力绝对是加分项。

    顺便说一句,这周离开DeepMind去竞争对手的,不止Jumper一个人。Character AI的联合创始人Noam Shazeer也宣布离开,不过他是去了OpenAI。AI人才争夺战,现在是越来越热闹了。

    这对AI格局意味着什么

    短期来看,这对DeepMind是个损失,但对整个AI领域不一定是坏事。人才在不同机构之间流动,往往会带来新的思路和碰撞。Jumper去了Anthropic,说不定能把AlphaFold的思路带到新问题上——比如,蛋白质结构预测和大型语言模型之间,有没有可能擦出火花?

    再说,DeepMind本身也不是吃素的。Hassabis带领的团队依然是世界上最强的AI研究组之一,人才储备厚实得很。一个研究员离开,不会动摇根本。


  • 美国能源监管层大开绿灯,AI数据中心接电不再排队

    AI数据中心电网接入
    美国联邦能源监管委员会为AI数据中心开辟电网接入快速通道

    美国AI竞赛里最卡脖子的不是芯片,是电。

    6月18日,美国联邦能源监管委员会(FERC)做了一件AI行业盼了很久的事:下令六大电网运营商,给数据中心的并网申请开“快速通道”。以后AI公司想接电,不用再跟传统电厂排同一条队了。

    等了又等,AI公司快撑不住了

    电网接入的队伍有多长?到2023年底,全美国待接入的发电项目总容量,已经超过了现有电网的总供电能力。换句话说,排队等接电的项目,比电网能承载的极限还多——这条队,本质上永远排不到头。

    AI公司等不起。数据中心的需求预计2035年前要翻近三倍,电网运营商过去二十年习惯了需求零增长,突然被这波AI浪潮砸懵了,有些电网(比如全美最大的PJM)已经乱到有几家大公用事业公司威胁要退群了。

    讽刺的是,等不到电网接入的科技公司,被迫自己掏钱搞”表后发电”——在自己数据中心旁边自建电站。这比接公网更贵、更麻烦,但总比没电用强。

    FERC的新规到底放了什么大招

    FERC的指令主要有几层意思。第一,六大电网运营商必须在30天内上报自己还有多少富余的供电能力;60天内为数据中心”辩护或修改”电价方案。第二,电网运营商必须考虑”替代输电技术”——比如固态变压器或超导输电线,这些都是能让现有电网跑得更猛的新玩意儿。

    第三,也是最有实质意义的:数据中心要为并网成本自己买单,但作为交换,他们不用再跟发电项目一起排长队了。

    这个决定的背后推手是能源部长Chris Wright。他去年10月就公开表态,说数据中心接电的延误已经威胁到美国在全球AI竞赛中的竞争力。话音刚落,FERC就动起来了。

    电价已经在疯涨,这道绿能解多少渴?

    一个无法忽视的现实是:批发电价已经比五年前飙涨了最多267%。数据中心疯狂抢电,推高了所有人的用电成本。FERC开了快速通道,但并没有变出新电厂来——发电容量短缺这个根本问题,依然存在。

    更有意思的是时机。就在FERC出台新规的前两天,特朗普政府刚宣布掏7.65亿美元,让可再生能源开发商Invenergy取消加州、缅因州和纽约州附近的四个海上风电租约。Invenergy转而要用这笔钱在中西部建天然气电厂。

    到目前为止,特朗普政府已经花了大约26亿美元来拆海上风电的台。AI要电,政府给数据中心开绿灯,但同时又在对清洁能源使绊子——这其中的矛盾,恐怕日后还要找补。


  • 《大西洋月刊》把AI音乐训练的“底牌”掀了

    AI音乐训练数据透明度
    AI训练用了谁的歌?现在谁都能查到了

    你有没有想过,你随手发在YouTube或Spotify上的一首歌,会不会悄无声息地被人拿去训练AI了?

    这个念头听着像阴谋论,但它真的发生了。《大西洋月刊》的调查记者Alex Reisner最近做了一件让整个AI音乐圈睡不着觉的事——他把四个被用于训练AI模型的音乐数据集,原原本本地做成了可公开搜索的数据库,任何人都能上去查自己的作品是不是在里面。

    1200万首歌,免费摆在互联网上

    这四个数据集的规模大到离谱。两个最大的分别包含1200万900万首曲目,剩下两个”小”的也有10万首以上。这些数据集在互联网上可以被自由下载,已经被下载了数千次。

    Google和Stability AI都曾在研究论文中确认,他们用了其中的数据集来训练自己的AI音乐模型。换句话说,这些”免费”的音乐,已经变成了Suno、Google Lyria等AI音乐生成器的”教材”。

    有意思的是,有些数据集的来源(比如Free Music Archive)允许个人免费收听,但商业使用需要授权。AI公司拿去训练商业模型,版权归属是个大问题。

    Lady Gaga、Radiohead,一个都跑不了

    在这四个数据集里能搜到名字的音乐人,跨度简直离谱——流行天后Lady Gaga、电子音乐鬼才Aphex Twin、摇滚天团Radiohead和Wu-Tang Clan、摇滚教父Bruce Springsteen,甚至实验音乐作曲家Hainbach,统统在内。

    更值得玩味的是这些数据是怎么被”拿”到的。Reisner发现,其中三个数据集本质上是一堆YouTube和Spotify的链接列表。AI开发者用自动化工具批量下载音频,有些工具还能绕过登录、跳过广告——这些操作明显违反了平台的服务条款。

    也就是说,音乐人被”投喂”给AI的过程,本身可能就踩在了灰色地带甚至违法的边缘。

    《大西洋月刊》为什么较这个真?

    《大西洋月刊》专门开辟了一个叫”AI Watchdog”的栏目,系统性地追踪AI训练数据的来源。这次把音乐数据集公开可查,等于是把AI公司的”锅底”彻底掀了——以后哪家公司用了谁的音乐训练模型,版权方一点进去就能找到证据。

    这个搜索库不只包含音乐,还有用于训练AI的书籍和其他媒体。对版权持有者来说,这是一把迟来的”知情权”的钥匙。

    目前AI训练数据的版权诉讼已经在全球遍地开花,这次《大西洋月刊》的动作,相当于是给这些诉讼又添了一把柴火。音乐人们终于有一个地方可以去证实:没错,我的歌确实被拿去训练AI了。


  • 亚马逊自研AI芯片要对外卖了,英伟达迎来最强劲对手?

    英伟达在AI芯片市场的霸主地位,终于有人正面挑战了。据Bloomberg报道,亚马逊云科技(AWS)掌门人Peter DeSantis透露,AWS正在洽谈将自研的Trainium AI芯片出售给其他公司,用于其数据中心。如果这桩生意做成,将是迄今为止对英伟达AI芯片统治地位最强有力的冲击之一。

    贝佐斯想卖芯片,Jassy把话说在前头了

    这事儿其实有伏笔。今年4月,亚马逊CEO Andy Jassy在年度股东信里就写得明明白白:如果我们的芯片业务独立成一家公司,把今年生产的芯片卖给AWS和其他第三方,年化营收规模大约在500亿美元左右。”我们对自家芯片的需求太旺盛了,未来很有可能会把整机架的芯片卖给第三方。”

    亚马逊AI芯片挑战英伟达
    亚马逊Trainium芯片冲击AI芯片市场格局

    500亿美元是个什么概念?英伟达目前的年化营收是3260亿美元,500亿当然还”干不掉”英伟达。但这个体量已经跟英特尔的全年营收相当——也就是说,如果AWS真的对外卖芯片,它一上来就是个”英特尔级别”的选手。

    为什么AWS一直不卖芯片?

    既然芯片这么强,为什么AWS憋了这么久不外卖?根本原因是一个”瀑布效应”——芯片是引子,真正赚钱的是后面的存储、安全、网络、监控等一整套云服务。客户买了Trainium的算力,顺带就要用AWS的S3存数据、用CloudWatch做监控、用IAM管权限……这笔账,比单纯卖芯片划算多了。

    另一个现实问题是产能。Jassy在股东信里说,目前的Trainium芯片产能一上线就被抢光,连下一代Trainium4的产能也早就预订完了——而这芯片要到一年以后才上市。自己都不够用,怎么卖给别人?

    AWS发言人Doron Aronson确认了对外销售芯片的可能性:”虽然我们历史上一直拒绝直接销售芯片的请求,但Andy说过,未来我们很可能会把整机架的芯片卖给第三方。”

    台积电的产能争夺战

    真要外卖芯片,AWS得先解决制造端的问题。Trainium芯片由台积电代工,而台积电的先进制程产能是全世界科技公司争抢的香饽饽。最新消息是,英伟达已经取代苹果,成为台积电的最大客户——这意味着黄仁勋在产能谈判桌上,比AWS有更多话语权。

    所以AWS要外卖芯片,不仅仅是”我想卖”的问题,还得在台积电那里挤出产能来。这事儿的难度,不亚于做芯片本身。

    黄仁勋的200亿,Jassy的500亿

    这场竞争有个有趣的对照:黄仁勋最近宣布英伟达发现了一个全新的2000亿美元市场——卖CPU给AI基础设施(不只是GPU),直接入侵英特尔和AMD的地盘。Jassy的500亿美元芯片野心,则是反过来从英伟达碗里分肉。

    两家公司的CEO都在押注同一件事:AI基础设施的市场,远远没有见顶。区别在于,英伟达是从芯片往系统走,AWS是从系统往芯片走——最后谁更能打,接下来几年就见分晓了。


    • AWS Trainium芯片年化营收潜力约500亿美元,相当于英特尔全年营收规模
    • 英伟达当前年化营收3260亿美元,地位短期难以撼动
    • AWS外卖芯片的最大障碍:自身产能不足 + 台积电产能争夺
    • 亚马逊从云服务端往芯片端渗透,与英伟达的”反向包抄”形成对决
  • Signal总裁警告:AI聊天机器人不是你的朋友

    你现在跟ChatGPT聊过天吗?问它拿主意、让它帮你写邮件、甚至把它当树洞说心事?这没什么稀奇的,越来越多人把AI聊天机器人当成了某种”数字朋友”。但Signal的总裁Meredith Whittaker最近给出一个很直白的警告:它们不是你的朋友。

    它们没有意识,也不是你的对话者

    Whittaker在接受Bloomberg采访时被问到ChatGPT和Claude这类聊天机器人的隐私问题时,她的回答相当犀利:”它们不是你的朋友,不是有意识的生物体,也不是有感知的对话者。”

    这话听起来有点冷酷,但她的逻辑很清晰。AI聊天机器人本质上是在”平均化”互联网上已经存在的内容——它给出的每个回答,都是基于训练数据里海量文本的统计分析,而不是它自己”想”出来的。如果你让AI替你思考,你自己的思维过程就被截断了。

    AI聊天机器人隐私警示
    AI聊天机器人便利的背后,是隐私让渡的代价

    她自己几乎不用AI来”帮忙思考”。她说:”我很认真地对待自己的思考和写作,不希望把一个想法推演的过程,被一个把网上已有内容做了平均化的系统的回答给截断或遮蔽掉。”

    微软Copilot的”圣诞购物”场景吓到人了

    真正让人警惕的,是AI公司自己描绘的”未来场景”。微软AI CEO Mustafa Suleyman最近预测,用户今年就能让Copilot全权负责圣诞购物——它会监听家庭群聊,判断每个亲戚想要什么,然后自动下单。

    Whittaker对此的回应是:这意味着你要给Copilot访问你信用卡的权限、访问浏览器的权限、访问你Signal消息的权限、替你给兄弟姐妹发消息的权限、你家庭住址的权限,还有你日历的权限。”你刚才描述的,是一个在多个应用和服务之间拥有极度广泛访问权的系统。”她说,”在Signal的语境下,这相当于一种后门。”

    这番话值得琢磨。AI公司不停告诉我们”让AI帮你做事”,但它们很少同时告诉你:要做到这一点,你需要把生活中几乎所有的数字权限都交给它。

    Signal的坚持:不跟风做AI”助手”

    Whittaker不是随便说说——她领导的Signal是目前少数几家坚决不往产品里塞AI”助手”的主流通讯应用。Signal的核心卖点就是端到端加密和隐私保护,往里面加一个需要把消息内容发给云端AI处理的”智能助手”,等于自废武功。

    这跟整个行业的风向形成了鲜明对比。WhatsApp已经加了AI助手,iMessage据传也在考虑类似功能。Signal的做法在商业上可能”不够聪明”,但Whittaker显然认为,有些底线不能破。


    说回开头那句话——AI不是你的朋友。这不代表你不能用它,而是说你得清醒地知道:你输入给它的每一句话,都在训练它、也在暴露你。把它当工具用,别把它当知己。

  • 挪威对AI进课堂说不了:6-13岁禁用,17岁以上才让学

    挪威政府这周出了一个政策,简单说就是:小学生别碰AI,初中生老师看着用,高中生才能正经学。这套分层管理的思路,在全球范围内算是相当明确了,生效时间是今年8月。

    挪威AI教育政策
    挪威对AI进课堂祭出分层管理(插图:AI生成)

    具体怎么分的?6到13岁(一年级到七年级)原则上不让用AI;14到16岁(初中)可以在老师监督下”谨慎地”用;17到19岁(高中)的目标是把AI用对、用好,为以后上大学或工作做准备。

    为什么是挪威先动手

    挪威这个决定,背景其实很清晰。过去一年,生成式AI在青少年群体里的渗透率疯涨,ChatGPT、Claude、Gemini,随便一个手机就能用。学校这边,老师们的心态也很分裂——有人当成教学辅助工具,有人坚决抵制,觉得学生在用AI写作业、写作文,根本不是在学东西。

    挪威教育部的判断是:年龄太小的孩子,认知能力还没发展到能分辨AI生成内容的好坏,更别说理解AI的局限性了。这个阶段盲目引入AI,弊大于利。等到初中,可以在特定场景下用,比如辅助查找资料、整理思路,但必须有老师在场。到了高中,学生已经具备一定的批判性思维,这时候学的是”怎么用好AI”,而不是”怎么被AI替代”。

    挪威的政策核心不是”禁”,而是”分级管控”。它承认AI是未来必备技能,但前提是你得先学会不用AI也能把事情做对。

    别的国家在干嘛

    挪威不是第一个碰这个问题的国家,但可能是第一个给出如此明确年龄分层的。法国之前禁过ChatGPT,后来又松口了;美国有些学区全面封杀AI工具,有些则鼓励老师把它纳进课程设计;中国这边,”双减”之后对教育科技监管整体趋严,AI进课堂的口子也没完全放开。

    欧盟的《AI法案》里,对教育场景下的AI使用也有专门条款,要求是”高风险”应用必须经过严格评估。挪威作为欧盟经济区成员,这套政策某种程度上也是在给欧盟其他成员国探路。

    老师和家长的真实反应

    政策出来之后,挪威本地的反应挺值得玩味。有老师觉得,终于有个明确说法了,之前是各搞各的,有的班级AI用得飞起,有的班级连提都不让提,学生之间也不公平。现在有个国家标准,至少大家在同一套规则下跑。

    但也有人担心执行问题。14到16岁”在老师监督下使用”,监督的边界在哪里?是用AI辅助教学,还是老师得盯着每个学生的屏幕?这些细节,政策文件里还没说清楚。而且,挪威的数字化程度本来就很高,孩子们在家用AI,学校禁止,这种”校内校外两重天”的情况,怎么处理?


    说到底,挪威这套政策反映的是一个更普遍的焦虑:AI来得太多快,教育和监管都还没想清楚该怎么接。完全禁止不现实,放开了又怕害了孩子。挪威选了一条中间路线,至于效果好不好,得等几个学期之后才看得出来。

    对其他国家来说,挪威这个”试验”值得盯着看。如果效果好,大概率会被拿来当模板;如果搞砸了,那就成了反面教材。

  • DeepMind诺奖得主跳槽Anthropic,Google的AI人才防线崩了?

    6月20日,一条消息在AI圈炸了锅——2024年诺贝尔化学奖得主John Jumper在X上宣布,离开工作了近9年的Google DeepMind,加入对手Anthropic。

    John Jumper加入Anthropic
    2024年诺贝尔化学奖得主John Jumper从DeepMind跳槽至Anthropic(插图:AI生成)

    Jumper在X上说,DeepMind CEO Demis Hassabis在他博士毕业仅6个月的时候就敢让他领导AlphaFold团队,这确实冒了很大的风险。过去这些年,整个GDM团队教会了他”如何做伟大的科学”。他还特意补了一句:GDM是个特别的地方,我仍然会兴奋地关注他们接下来会有什么惊人的发现。

    AlphaFold到底有多厉害

    说Jumper是AI领域最炙手可热的人物之一,一点不夸张。2024年,他和Hassabis一起拿了诺贝尔化学奖——理由是他们开发的AlphaFold,用AI预测蛋白质三维结构,直接把一个困扰生物学界几十年的难题给破了。

    蛋白质的3D结构决定了它的功能,传统方法要用X射线晶体学,动辄几个月甚至几年。AlphaFold把这个过程压缩到了几天,而且准确率惊人。这个成果开源之后,全世界的生物学家都在用,药企也在用它加速新药研发。Jumper就是这个世界级突破的核心推手。

    蛋白质结构预测精度的提升,意味着我们能更快地理解疾病机制、设计靶向药物。Jumper的离开,对DeepMind来说是个不小的损失。

    一周之内,两个人走了

    Jumper的离开并不是孤立事件。就在这周,Character AI的联合创始人Noam Shazeer也宣布离开DeepMind,不过他的目的地是OpenAI。

    Shazeer是什么来头?他在Google工作了20年,2024年Google花了27亿美元把他和一批研究员从Character AI”买”回来。结果才过了不到两年,他又走了,而且是去了OpenAI——Google最直接的竞争对手。

    Bloomberg的报道还透露了一个细节:Jumper在DeepMind后期,是Google开发AI编程工具的核心成员之一。而这个工具,Google到现在都没能成功地卖给企业用户。巧合的是,这正好是Anthropic的Claude在企业市场最强势的领域。

    Anthropic在攒什么局

    Anthropic这边的算盘其实挺明显的。公司成立以来,一直打着”安全AI”的旗号,但在顶尖研究人才上,跟Google DeepMind和OpenAI比还是有差距。现在把Jumper这样的诺贝尔奖得主揽入麾下,研究实力一下子就上了一个台阶。

    而且Jumper的专长——用AI解决科学问题——正好跟Anthropic最近发力的方向吻合。Claude在写代码、做研究这些”知识型任务”上本来就很强,如果有AlphaFold级别的科学AI能力加持,想象空间不小。


    这场AI人才大战,打到这个份上,已经不只是薪水或算力的比拼了。顶尖研究者想去的地方,是能做最前沿研究、能产生最大影响力的地方。DeepMind曾经是这个地方的代名词,但现在,Anthropic和OpenAI显然也在争夺这个位置。

    Jumper在X上的那条官宣帖子,发出没多久就引来了几千条回复。有人祝贺,有人感叹,也有人直接在评论区问:”所以AlphaFold的下一个版本会在Claude里跑吗?”

  • Google把AI翻译做到极致了:Gemini 3.5 Live Translate支持70+种语言实时互译

    Google把AI翻译做到极致了:Gemini 3.5 Live Translate支持70+种语言实时互译

    跨语言沟通一直是人类的梦想。从古代的翻译官,到现代的词典软件,再到AI翻译工具,我们一直在寻找能让人和人之间无障碍交流的方法。Google最早在2006年推出Google Translate,用机器学习做语言翻译。二十年过去,Google现在发布了Gemini 3.5 Live Translate,一个专门为实时语音到语音翻译设计的音频模型。

    Gemini 3.5 Live Translate是什么?

    简单说,它是一个能实时把一种语言翻译成另一种语言,并且用说话人自己的音色、语调、语速讲出来的AI模型。不是那种机械的合成音,而是听起来很像真人说话的翻译。

    Google说这个模型采用了一种”动态处理方式”。传统的轮流式翻译系统通常要等说话者说完后才开始翻译,这导致对话中经常出现尴尬的停顿。Gemini 3.5 Live Translate通过智能地平衡上下文优化与即时输出的需求,将翻译延迟控制在数秒内,减少了对话中的中断感。

    Gemini 3.5 Live Translate实时翻译展示
    Gemini 3.5 Live Translate实现低延迟实时语音互译

    70+种语言,保留说话人音色

    这个模型目前支持超过70种语言的自动识别和翻译。更重要的是,它不仅能生成自然流畅的翻译语音,还能精准还原说话者的语调、语速和音高特征。

    这意味着什么?如果你用英语说话,AI翻译成日语后,不是说日语的”AI机器人”,而是用你自己的”声音特点”说日语。听的人会觉得”哦,他虽然在说日语,但我能感觉到这是他在说话”。

    这种能力背后是Google在语音克隆和音色保留技术上的积累。当然,Google也说这个技术目前还在优化中,不是所有语言对都能做到完美的音色保留。


    低延迟实时翻译,让跨语言对话更自然

    实时翻译的最大挑战不是”翻译得准不准”,而是”翻译得快不快”。如果每次说话都要等三秒钟才能让对方听到翻译,那对话的流畅感就全毁了。

    Gemini 3.5 Live Translate的突破在于它能在”翻译质量”和”响应速度”之间找到平衡点。Google说它的延迟是”数秒内”,这意味着在实际对话中,你不会感觉到明显的卡顿。

    技术上,这得益于Gemini系列的强大多模态能力。它能同时处理音频输入、语义理解、跨语言转换、语音生成等多个步骤,而且是在一个端到端的模型中完成的,不需要把任务拆分成多个独立模块。


    应用场景——从国际会议到旅行沟通

    Google已经宣布把这个技术集成到Google Meet中。想象一下:一个视频会议,里面有说英语、中文、日语、西班牙语的参与者。每个人说自己的语言,其他人能实时听到用自己语言翻译的内容,而且延迟很低,对话能自然进行。

    除了会议场景,这个技术对旅行者也很有用。假如你去日本旅游,不会说日语,但有了支持Gemini 3.5 Live Translate的工具,你可以直接和餐厅服务员、出租车司机、酒店前台对话,AI会实时帮你翻译。

    当然,目前这个技术还在早期阶段。Google说它会逐步向更多用户开放,首先在Pixel设备和Android系统中上线,然后再推广到iOS和其他平台。

    AI翻译这几年进步很快。从最早的基于词典的逐词翻译,到神经机器翻译(NMT),再到现在的大语言模型驱动的实时语音互译,我们离《银河系漫游指南》里的”巴别鱼”(一种能实时翻译任何语言的生物)越来越近了。Gemini 3.5 Live Translate不一定是最完美的AI翻译工具,但它代表了这个领域的一个新里程碑。

  • iOS 27的AI藏在哪?苹果把这10个日常功能都悄悄升级了

    iOS 27的AI藏在哪?苹果把这10个日常功能都悄悄升级了

    WWDC 2026上,苹果把大部分舞台时间给了Siri AI重构和Apple Intelligence的宏大叙事。但如果你仔细翻翻iOS 27的更新列表,会发现苹果其实把AI藏在了你每天都会用到的那些小功能里。不是那种”我们革命性地重新定义了XX”的夸张宣传,而是润物细无声地让事情变得更顺手。

    Siri的彻底重构——从语音助手到AI代理

    这是iOS 27最重大的AI升级。Siri不再是那个偶尔用来设闹钟、查天气的语音助手了。苹果对其进行了2011年发布以来最彻底的重构,把它变成了一个真正意义上的AI代理。

    新Siri能理解屏幕上的当前上下文内容。比如你在微信聊天里提到周末要去某家餐厅,Siri能自动识别这个信息,主动问你要不要加到日历里,甚至帮你查那天的天气。

    更厉害的是跨应用搜索能力。Siri现在能搜索消息、相册、邮件、日历,然后把信息串联起来。你问”上周和老王讨论的那个项目进展怎么样了”,它能自动找到相关的消息记录、邮件往来、甚至Notes里记的会议要点,然后给你一个完整的摘要。

    跨设备连续性也是个亮点。在iPhone上和Siri的对话,切换到iPad或Mac上能无缝衔接,不会丢失上下文。这意味着可以在手机上开始一个复杂任务,然后在电脑上继续完成。

    当然,苹果没忘记自己的”隐私优先”策略。Siri的AI处理尽量在设备端完成,实在需要上云的,也是用私有云基础设施,而且承诺第三方审计。

    iOS 27 AI功能展示
    iOS 27的AI功能深度整合到日常应用中

    Apple Wallet的智能账单分割

    这个功能特别实用。iOS 27里的Apple Wallet可以用iPhone摄像头扫描收据,然后AI自动识别上面的每一项,计算出每个人应该分摊多少(包括税费和小费),然后直接通过Messages或Wallet完成还款。

    想象一下:聚餐后拿到收据,打开Wallet拍个照,勾选朋友吃了哪些菜,系统自动算出每个人的份额,然后直接发Apple Cash请求给每个人。整个过程不到一分钟。

    这个功能由Apple Intelligence驱动,背后是OCR(光学字符识别)和自然语言处理的结合。苹果说它最多能同时处理10个人的账单分割。


    iOS 27的AI修图功能

    苹果的AI修图工具这次终于追上了Android阵营。iOS 27带来了三个核心AI修图功能:

    • Clean Up(去路人):升级到了更强大的云端模型,能更精准地识别照片里不想要的元素,然后无缝移除。
    • Extend(扩展照片边缘):AI能自动”想象”照片边缘之外的场景,然后把照片向外扩展。
    • Spatial Reframing(空间重构):AI能模拟相机移动,重新构图。

    Apple Music的AI歌词翻译

    对于喜欢听外文歌的人,这个功能很贴心。iOS 27扩展了”Lyrics Translation”功能,新增支持法语、德语、意大利语、韩语、西班牙语、日语到英语的翻译。

    “Lyrics Pronunciation”功能更复杂。它能显示音译歌词(用拉丁字母标注非拉丁字母语言的发音),帮你唱对那些不会说的外语歌词。


    苹果做AI的方式,和OpenAI、Google不太一样。它不急于把AI包装成一个独立的”产品”,而是把它当成一种”能力”,悄悄注入到每天都在用的那些功能里。你不一定能感受到AI的存在,但会觉得”哎,这功能怎么突然变好用了?”