标签: AI技术

  • 谷歌I/O 2026倒计时:Gemini轻量升级,AI眼镜重启硬件线

    谷歌I/O 2026倒计时:Gemini轻量升级,AI眼镜重启硬件线

    谷歌I/O 2026开发者大会
    2026年谷歌I/O开发者大会将于5月19-20日举行

    2026年谷歌I/O开发者大会今天(5月20日)正在加州山景城举行。这次大会的核心看点很明确:新一代Gemini模型和Android XR智能眼镜。距离上次谷歌发布Gemini 3.1 Pro已经过去三个月,业界对新版本的期待值拉满。

    Gemini模型不会跨越式迭代

    综合多方消息,谷歌这次大概率不会发布Gemini 4.0。按照约3-4个月的迭代节奏,上一代Gemini 3是2025年11月发布的,到现在才半年。更可能的情况是推出Gemini 3.2或3.5,性能大致与OpenAI近期发布的GPT-5.5相当。

    新一代模型的技术突破方向值得关注——它侧重Agent任务能力提升,而不是推理能力。具体来说,新模型预计将大幅提升上下文处理能力,并着重优化端侧轻量化表现。这意味着AI功能能够适配更多中低端安卓机型,真正服务于谷歌庞大的移动生态。

    谷歌一直想把Gemini更深入地融入其生态系统。这次大会上,我们可能会看到Gemini从独立App升级为安卓底层的原生能力。

    智能眼镜产品线重启

    智能眼镜是本届大会最受瞩目的硬件产品。距离谷歌首次推出Google Glass已过去十余年,现在谷歌正与三星、Gentle Monster和Warby Parker合作开发两款AI眼镜。

    一款是类似Meta Ray-Ban的无屏AI眼镜,主打轻量化与日常佩戴,支持免提唤醒Gemini助手。另一款则更为前沿,配备镜片内显示技术,可将导航、实时翻译等信息直接投射在用户视野中。两款眼镜均基于Android XR操作系统。


    生态整合比产品更新更关键

    除了具体的产品和模型,本次大会还将展示谷歌在AI生态领域的战略布局。Android 17系统有望迎来变革,Beta版或将公布,开放Gemini Nano端侧AI能力,支持第三方开发离线AI应用。

    传闻中的”Gemini Spark”Agent平台可能会在大会上亮相。这个系统旨在主动运行、处理跨应用和服务的任务,而不是等待用户指令。它能够访问跨应用、浏览会话和用户活动的数据,这将是AI从工具升级为系统层的关键一步。

    谷歌母公司Alphabet此前预计2026财年资本支出将达到1750亿至1850亿美元,这些资金将重点投向大规模数据中心扩建与专用AI算力部署。重金押注AI,谷歌亟需证明其庞大的AI投入能够通过搜索广告、云服务和订阅带来回报。

  • 斯坦福2026 AI指数报告:AI在狂奔,我们还在找鞋

    斯坦福2026 AI指数报告:AI在狂奔,我们还在找鞋

    如果你在关注AI新闻,你可能会觉得头晕。AI是淘金热。AI是泡沫。AI要抢你工作。AI连时钟都不会读。斯坦福大学以人为本AI研究所发布的2026年AI指数报告,就是为了切断一些噪音而出的年度成绩单。

    报告说,尽管有预测认为AI发展可能会碰壁,但顶级模型一直在变得更好。人们采用AI的速度比采用个人电脑或互联网还快。AI公司生成收入的速度比之前任何技术繁荣时期的公司都快,但它们也在数据中心和芯片上花费了数千亿美元。用来衡量AI的基准测试、用来监管它的政策、就业市场都在努力跟上。AI在狂奔,而我们其他人还在找鞋。

    Stanford 2026 AI Index Report
    斯坦福2026年AI指数报告封面

    美中AI竞赛:差距薄如刀片

    在一场具有巨大地缘政治风险的漫长激烈竞赛中,根据Arena(一个允许用户比较大型语言模型在相同提示下输出的社区驱动排名平台)的数据,美国在AI模型性能上与中国几乎并驾齐驱。

    2023年初,OpenAI凭借ChatGPT领先,但这个差距在2024年随着Google和Anthropic发布自己的模型而缩小。2025年2月,由中国实验室DeepSeek构建的AI模型R1短暂匹配了顶级美国模型ChatGPT。截至2026年3月,Anthropic领先,紧随其后的是xAI、Google和OpenAI。中国模型如DeepSeek和阿里巴巴落后并不多。

    随着最佳AI模型在排名中的差距只有薄如刀片的优势,它们现在在成本、可靠性和现实世界实用性上竞争。

    指数指出,美国和中国有不同的AI优势。虽然美国有更强大的AI模型、更多资本和估计5,427个数据中心(比任何其他国家的10倍还多),但中国在AI研究出版物、专利和机器人技术方面领先。


    AI模型进步速度快得吓人

    尽管有预测认为发展将进入平台期,AI模型仍在变得越来越好。从某些指标来看,它们现在在旨在衡量博士级科学、数学和语言理解的测试上达到或超过了人类专家的表现。

    AI模型的软件工程基准测试SWE-bench Verified,顶级分数从2024年的约60%跃升至2025年的近100%。2025年,一个AI系统独立生成了天气预报。

    “我对这项技术继续改进感到震惊,它根本没有以任何方式进入平台期,”报告的合著者、南加州大学计算机科学家Yolanda Gil说。

    AI模型性能基准测试图表
    AI模型在各种基准测试中的表现趋势

    测试AI的方式坏了

    这些进步报告应该持保留态度。斯坦福报告说,随着模型迅速突破天花板,旨在跟踪AI进步的基准测试也在努力跟上。有些构建得很差——一个测试模型数学能力的流行基准测试有42%的错误率。其他的可以被操纵:例如,当模型在基准测试数据上训练时,它们可以学会得分高而没有变得更聪明。

    因为AI很少以被测试的方式使用,强大的基准测试性能并不总是转化为现实世界的性能。对于复杂、互动的技术如AI代理和机器人,基准测试几乎还不存在。


    AI开始影响就业,年轻人首当其冲

    在成为主流的三年内,AI现在被全球超过一半的人使用,采用速度比个人电脑或互联网都快。估计88%的组织现在使用AI,五分之四的大学生使用它。

    部署还处于早期阶段,AI对就业的影响很难衡量。尽管如此,一些研究表明,AI开始影响某些职业的年轻工作者。根据斯坦福经济学家2025年的一项研究,自2022年以来,22至25岁软件开发人员的就业下降了近20%。

    下降可能不能单独归咎于AI,因为更广泛的宏观经济条件可能是罪魁祸首,但AI似乎正在发挥作用。

    雇主表示招聘可能会继续收紧。根据麦肯锡公司2025年的一项调查,三分之一的组织预计AI将在未来一年缩小他们的劳动力,特别是在服务和供应链运营和软件工程领域。


    所有这些都付出了代价

    所有这些速度都是有代价的。全球AI数据中心现在可以抽取29.6吉瓦的电力,足以在峰值需求时运行整个纽约州。仅运行OpenAI的GPT-4o的年用水量可能超过120万人的饮用水需求。

    同时,芯片的供应链令人担忧地脆弱。美国托管了世界上大多数AI数据中心,而台湾的一家公司台积电制造了几乎所有领先的AI芯片。

  • MIT选出2026年AI最重要的10件事,每一件都在发生

    MIT选出2026年AI最重要的10件事,每一件都在发生

    每次打开AI新闻,都有一股”不知道该看哪里”的焦虑感。模型一个接一个发布、功能三天一小改、公司每周都有大新闻——但哪些真的重要、哪些只是杂音?

    MIT Technology Review在2026年4月首次推出年度清单”10 Things That Matter in AI Right Now”,由AI记者与编辑集体选出今年最值得持续关注的10个AI议题。这份清单不是看谁的模型最强,而是从更大的视角回答:AI正在改变什么,而你应该知道哪些?

    MIT Technology Review 2026年AI最重要的10件事
    MIT Technology Review首次发布AI年度趋势清单

    人形机器人训练资料正在悄悄收集

    人形机器人要学会”动作”,需要的不是更多文字资料,而是人类行为的影片。已有公司设立专门的”训练中心”,雇用工人重复执行特定动作让机器人录影学习。更奇特的是另一种做法:远端遥控人形机器人,由海外某个人”钻进机器人”操纵它的动作。

    人形机器人训练资料这个问题指向一个即将到来的现实:人类的身体动作,正在成为下一波AI训练的核心原料。

    AI加速诈骗,现在就影响你

    AI最直接且现实的黑暗面,不是机器人统治世界,而是诈骗变得更快、更便宜、更难识破。AI降低了诈骗的门槛:你不再需要懂技术才能制作逼真的钓鱼信件、伪造语音通话、或是批量生成假帐号。

    语音诈骗、Deepfake影片诈骗、自动化社交工程攻击,已在全球造成实质财务损失。理解这件事的意义不是叫你不要用AI,而是提醒你:当有人用影片、语音、文字”证明自己是某人”,你需要比以前更谨慎地验证。

    多Agent协作:AI从”一个助手”变成”一支团队”

    第一代AI Agent能帮你浏览网页、写一段程式码,但它们各自为政。下一步是让多个Agent分工合作:一个Agent负责搜集资料、另一个负责分析、第三个负责起草报告、第四个负责执行发布——整套流程自动完成,人只需要在关键节点确认。

    这项趋势在Google、Anthropic、Microsoft等平台的agentic平台陆续推出后,已从概念阶段进入企业落地阶段。对未来几年的影响会是:你交给AI的任务,会开始被一组AI一起完成,而不是靠你自己拼凑不同工具。

    中国的开源押注:免费模型背后的地缘政治

    中国AI实验室正在把顶尖模型免费开放给全球开发者,这个策略让世界各地的应用正在建立在中国AI的基础上。DeepSeek、Qwen(阿里巴巴)、GLM(智谱AI)——这些中国开源模型在关键基准测试上已接近主流商用LLM,加上可免费部署、推论成本较低,让全球开发者纷纷在上面建构应用。

    越来越多美国与全球的应用,正在”默默”跑在中国开源模型上——这个现象已悄悄发生,而且难以逆转。

    反扑浪潮:AI发展速度超过社会准备

    对AI的强力反扑正在全球范围内成形,而且已开始取得具体的小胜利。这波反扑的来源异常多元:保守派和自由派都有、艺术家和工会都有、欧洲监管机构和美国地方政府都有。他们的诉求各异,但共同点是:AI的发展速度已超過社会准备好接受它的速度。

    具体的胜利案例包括多国对AI生成艺术的版权保护立法推进,以及影视、音乐、艺术等产业在合约中加入AI使用授权条款。这件事的长期影响,可能决定未来AI工具的使用规则与创作者的收益分配方式。


    其他值得关注的趋势

    • LLMs Plus:大型语言模型不会消失,但正在被要求做更多、更难、更少出错的事
    • 世界模型:让AI能理解并模拟真实物理世界的系统,对机器人、自动驾驶意义重大
    • AI进军作战室:生成式AI已进入军事决策流程,指挥官真的在采纳它的建议
    • 武器化深伪:Deepfake从”技术上可能”变成了”已成事实”,所有影片都需要怀疑其真实性
    • AI科学家:能自主设计实验、分析数据、提出假设的AI研究代理系统