博客

  • Google AI把2027年当成「两年后」?这个bug已经笑了一年了

    你有没有试过在谷歌搜索里问一些看似简单的问题,然后被AI的回答整懵过?最近有个用了快一年的老bug又被翻了出来:如果你问谷歌AI「明年是2027年吗」,它有时候会一本正经地告诉你——2027年是两年后,不是明年。

    对,你没看错。明明现在是2026年,明年当然就是2027年,但谷歌的AI Overviews(就是搜索结果顶部那个AI生成的摘要)偶尔会给出完全错误的答案,说2027年还有两年才到。

    「is it 2027 next year?」——谷歌AI有时候的回答是:2027年是两年后。这个答案在过去一年里,已经在Instagram和Reddit上被网友调侃了无数次。

    一个bug活了一年还没死

    The Verge的记者Jay Peters最近重新测试这个问题时发现,AI Overviews给出的错误答案,引用的来源居然是2025年和2026年的旧Instagram帖子和Reddit帖子——也就是说,这个bug不是新出现的,而是已经存在了至少一年,而且谷歌的AI还在引用那些讨论这个bug的帖子来论证自己的错误答案。

    这就像一个死循环:AI答错了 → 网友截图发帖吐槽 → AI引用这些帖子作为权威来源 → 继续答错。

    谷歌AI Overviews错误回答截图
    谷歌搜索「is it 2027 next year」时,AI Overviews给出的错误回答界面

    更有意思的是,如果你现在去搜「disregard」这个词,谷歌到现在都不敢给你展示AI Overview。原因是之前有报道说,搜这个词会触发AI给出完全离谱的回答。谷歌显然是被迫给某些敏感查询关掉了AI摘要功能,但这个「2027年」的问题显然还没被修好。

    AI到底懂不懂「明年」是什么意思

    这个bug背后其实反映了一个挺尴尬的问题:大语言模型对于时间和常识推理的处理,远比我们想象的脆弱。训练数据里混入了大量过去年份的帖子,模型并没有一个可靠的「当前时间」锚点,所以在回答「明年是哪一年」这种问题时,它会试图从检索到的内容里找答案,而不是简单地做算术。

    有Reddit网友早在2025年就发帖调侃过这件事,当时谷歌AI给出的答案是「明年是2028年,2027年是后年」——比现在的版本还要离谱。看来这一年里,谷歌工程师多少修了一点,但显然没修干净。


    说回来,这其实挺让人担心

    一个搜索巨头把AI摘要放在搜索结果的最顶部,亿万用户每天都能看到,但它连「明年是哪一年」这种问题都能答错,而且错了一年多还没完全修好——这让人怎么敢相信那些更复杂、更专业的问题的回答呢?

    谷歌显然也知道这个问题很严重,所以他们现在对AI Overviews的触发条件做了很多限制。但问题是,用户看到那个AI摘要的时候,默认是相信它的——毕竟它长在搜索结果最显眼的位置,还带着谷歌的品牌背书。

    这个「2027年bug」也许看起来很可笑,但它折射出的是整个行业在AI搜索可靠性上的深层挑战。连时间推理都做不好,我们真的准备好让AI替我们总结医疗、法律、财经方面的信息了吗?

  • llama.cpp:90.4K Stars!本地大模型推理引擎,让普通电脑也能跑 AI

    llama.cpp:90.4K Stars!本地大模型推理引擎,让普通电脑也能跑 AI

    llama.cpp

    ⭐ 90.4K+ GitHub Stars

    💡 一句话介绍:llama.cpp 是用纯 C/C++ 编写的大语言模型推理框架,让普通电脑无需独立显卡就能运行大模型,是目前本地 AI 推理的基石项目。

    📦 项目简介

    llama.cpp 由 Georgi Gerganov 于 2023 年 3 月发布,最初的目标是在 Apple Silicon Mac 上用纯 CPU 运行 Meta 的 LLaMA 模型。项目发布后迅速引爆开源社区,截至目前已在 GitHub 收获 超过 9 万 Stars,成为本地大模型推理领域的事实标准。

    它的核心设计哲学是极简、高效与可移植——完全用 C/C++ 实现,没有任何 Python 依赖,单个可执行文件即可运行数十亿参数的大语言模型。它也是 GGUF 量化格式的发起者,这种格式已成为 Hugging Face 上量化模型的事实标准。

    今天,llama.cpp 不仅是开源项目,更是整个本地 AI 生态的底层引擎——LM Studio、Jan AI、KoboldCPP、Ollama(早期版本)等产品都在使用它作为推理后端。

    🔗 项目地址:https://github.com/ggml-org/llama.cpp

    📄 开源协议:MIT(完全免费,可商用)

    🌐 文档地址:https://llama-cpp.readthedocs.io/

    ⚙️ 安装要求与过程

    环境要求

    • 最低配置:4GB 内存即可运行 7B 量化模型(Q4_K_M)
    • 推荐配置:16GB 内存可运行 13B~70B 量化模型
    • GPU 加速:可选,支持 NVIDIA CUDA、Apple Metal、AMD ROCm、Vulkan
    • 操作系统:Windows / macOS / Linux / Android / iOS 全平台支持
    • 依赖:无需 Python,无需 Docker,无需任何运行时

    方式一:下载预编译文件(⭐ 推荐新手)

    步骤

    1. 访问 GitHub Releases 页面
    2. 下载对应操作系统的压缩包(Windows 选 llama-bn-x64.zip,macOS 选对应芯片版本)
    3. 解压后无需安装,直接使用命令行运行
    # 启动 OpenAI 兼容 API 服务(最常用)
    ./llama-server -m ./qwen2.5-7b-instruct-q4_k_m.gguf -c 4096 --port 8080
    
    # 启动交互式对话模式
    ./llama-cli -m ./model.gguf -p "你好,请介绍一下自己" -n 256
    
    # 启动后访问 http://localhost:8080 即可使用内置 Web UI

    方式二:pip 安装 llama-cpp-python(Python 用户)

    # 基础 CPU 版本
    pip install llama-cpp-python
    
    # NVIDIA GPU CUDA 加速版本
    CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python --upgrade --force-reinstall
    
    # macOS Apple Silicon Metal 加速版本
    CMAKE_ARGS="-DGGML_METAL=on" pip install llama-cpp-python --upgrade --force-reinstall
    
    # Python 调用示例
    from llama_cpp import Llama
    
    llm = Llama(
        model_path="./qwen2.5-7b-instruct-q4_k_m.gguf",
        n_ctx=4096,
        n_gpu_layers=-1  # -1 表示将所有层卸载到 GPU
    )
    output = llm("你好,请介绍 llama.cpp 的特色", max_tokens=256)
    print(output['choices'][0]['text'])

    方式三:从源码编译(进阶用户 / 自定义后端)

    git clone https://github.com/ggml-org/llama.cpp
    cd llama.cpp
    
    # 编译(根据硬件选择参数)
    cmake -B build -DGGML_CUDA=ON   # NVIDIA GPU 版本
    # cmake -B build -DGGML_METAL=ON  # Apple Silicon 版本
    # cmake -B build                   # 纯 CPU 版本
    
    cmake --build build --config Release -j $(nproc)
    
    # 编译完成后可执行文件位于 build/bin/ 目录下

    ✨ 核心功能

    🔧 1. 纯 C/C++ 实现,零依赖部署

    整个项目只依赖 C 标准库和 C++ 标准库,编译后生成单个可执行文件。这意味着你可以把 llama-server 直接拷贝到任何同架构机器上运行,无需安装 Python、Conda 或任何运行时环境。对于生产环境部署来说,这是巨大的优势。

    📊 2. GGUF 量化格式支持(业界标准)

    llama.cpp 社区发明了 GGUF(GPT-Generated Unified Format)格式,支持 Q4_K_M、Q5_K_M、Q8_0、IQ4_XS 等多种量化精度。Q4 量化可将模型大小缩减至 FP16 版本的 25%,7B 模型仅需约 4GB 内存即可运行。目前 Hugging Face 上绝大多数模型都提供 GGUF 版本。

    🖥️ 3. 纯 CPU 运行能力

    这是 llama.cpp 最大的亮点——它针对 CPU 推理做了大量优化(AVX2/AVX-512、NEON 等指令集加速),使得在 Intel i5、Apple M 系列芯片、AMD Ryzen 等消费级 CPU 上也能流畅运行量化后的 LLM。对于没有独立显卡的用户,这是运行本地大模型的唯一选择。

    🚀 4. 多 GPU 后端加速

    通过 -ngl(n-gpu-layers)参数可指定将多少 Transformer 层卸载到 GPU,显存不足时也可通过部分 GPU 加速显著提升推理速度。支持的后端包括:NVIDIA CUDA、Apple Metal、AMD ROCm、Vulkan,甚至支持 WebGPU 在浏览器中运行。

    🔌 5. OpenAI 兼容 API Server

    内置 llama-server 模式,提供完全兼容 OpenAI API 格式的接口。这意味着你可以用完全相同的代码,在本地用 llama.cpp 替代 OpenAI 的 API,无缝对接 Open WebUI、SillyTavern、Continue.dev 等前端应用,无需修改任何代码。

    🌍 6. 广泛的模型架构支持

    覆盖绝大多数主流开源 LLM 架构,包括 Llama 3.x、Mistral、Mixtral MoE、Qwen 2.5/3、Gemma 2/3、Phi-4、DeepSeek V2/V3、Command-R 等。新模型发布后,社区通常数天内即可完成适配。

    🚀 典型使用场景

    场景一:隐私优先的本地助手

    对于对数据隐私有严格要求的个人和企业,llama.cpp 是最理想的选择。所有推理在本地完成,数据无需上传云端。结合 Open WebUI 作为前端,你可以在完全离线的状态下拥有一个功能完整的 AI 助手。

    # 启动本地 API 服务
    ./llama-server -m ./models/qwen2.5-7b-q4_k_m.gguf \
        -c 4096 -ngl 99 --port 8080
    
    # Open WebUI 连接本地服务
    open-webui serve  # 然后访问 http://localhost:3000
                     # 在设置中填写 API URL: http://localhost:8080/v1

    场景二:AI 应用的后端推理引擎

    如果你正在开发需要本地 LLM 能力的应用(如桌面软件、移动 App、嵌入式设备),llama.cpp 是最佳的推理引擎选择。它的 C/C++ 接口可以直接嵌入到你的应用中,无需启动外部服务。

    著名的 AI 编码助手 Continue.dev、本地 AI 助手 Jan AI、角色扮演工具 KoboldCPP 都使用 llama.cpp 作为底层推理引擎。

    场景三:低成本服务器部署

    对于想要搭建内部 AI 服务的团队,llama.cpp 可以在没有高端 GPU 的服务器上运行。一台配备 64GB 内存的普通服务器,就可以运行量化后的 70B 参数模型,为整个团队提供 LLM 推理服务。

    # 服务器部署:运行 70B 模型(需要约 40GB 内存)
    ./llama-server -m ./llama-3.3-70b-q2_k.gguf \
        -c 8192 --port 8080 -t 16  # -t 16 表示使用 16 个 CPU 线程

    📊 量化版本选择指南

    量化版本 模型大小(7B) 质量 适用场景
    Q8_0 ~7.5GB ⭐⭐⭐⭐⭐ 几乎无损 显存充足,追求最佳质量
    Q5_K_M ~5.5GB ⭐⭐⭐⭐ 非常接近 Q8 大多数场景的最佳平衡
    Q4_K_M ~4.5GB ⭐⭐⭐ 轻微质量下降 显存/内存有限的常规场景(推荐)
    IQ4_XS ~4.0GB ⭐⭐⭐ 智能量化,同大小质量更优 新一代推荐选择
    Q3_K_M ~3.5GB ⭐⭐ 质量下降较明显 内存严重受限的极端场景

    ⚠️ 注意:量化级别越低,推理质量下降越多。对于重要场景,建议使用 Q4_K_M 或更高质量;对于简单任务(如代码补全、分类),Q3 也是可以接受的。

    💡 推荐理由

    如果你问我”想要在本地运行大模型,应该从哪里开始?”,我的答案一定是 llama.cpp

    作为一个在开源社区活跃了多年的项目,llama.cpp 不仅技术上过硬,社区生态也极其丰富。它解决了本地 AI 推理的三个核心痛点:

    • 门槛低:不需要懂 Python,不需要配置环境,下载预编译文件解压就能用
    • 质量高:经过两年多的社区优化,推理速度和质量已经非常接近商业方案
    • 生态好:几乎所有主流本地 AI 工具都支持或基于 llama.cpp

    对我个人来说,llama.cpp 最有价值的地方在于它的 OpenAI 兼容 API。这让我的本地开发环境和云端开发环境可以用同一套代码——开发时连本地 llama.cpp,部署时换成一个环境变量指向 OpenAI,其他代码完全不用改。这种灵活性在今天这个 AI 工具链快速变化的时代,是非常宝贵的。

    另外,如果你对 AI 推理的底层原理感兴趣,llama.cpp 的源代码是最好的学习材料。它把 Transformer 推理的每一步都用 C 语言实现得清晰可读,比任何教科书都更直观。

    📌 适合人群:想要在本地运行大模型的 AI 爱好者、需要在无网环境下提供 LLM 能力的开发者、对 AI 推理性能优化感兴趣的研究者。

    📌 不适合人群:只想用图形界面、不想碰命令行的用户(建议直接用 LM Studio 或 Jan AI,它们底层用的就是 llama.cpp)。

    📥 下载地址

    提示:如果你不想自己编译或配置,可以直接使用基于 llama.cpp 封装的图形化工具:LM Studio(最友好的图形界面)、Jan AI(开源替代方案)、或 Ollama(命令行工具,我们之前介绍过)。它们的底层都是 llama.cpp,但提供了更简单的使用体验。

  • 教皇用AI写关于AI危险的通谕?这个瓜有点大

    教皇良十四世的首份通谕《Magnifica Humanitas》刚发布,就有人怀疑:这玩意儿是不是用AI写的?而且写的还是AI的危险。

    通谕是教皇写给全球天主教徒的长篇信件,通常讨论重大的道德和社会问题。这份通谕之所以受关注,因为它是第一份聚焦AI及其广泛影响的通谕。更有意思的是,发布仪式上还站着Anthropic的联合创始人Christopher Olah。

    教皇良十四世发布首份通谕《Magnifica Humanitas》
    教皇良十四世首份通谕《Magnifica Humanitas》发布仪式(图源:The Verge / Getty Images)

    AI检测工具说:有点悬

    事情起因是LessWrong论坛上Linch Zhang发的一项分析。他用流行的AI检测工具Pangram检测了这份通谕,结果发现:

    • 某些段落有40%到100%的概率是AI生成的
    • “genuinely”这个词出现频率异常高,而这个词在Claude模型的写作中很常见
    • 第一章被Pangram标记为62% AI生成

    The Verge把通谕大约2000字的内容扔进Pangram,结果是:约46%的内容估计为AI撰写

    通谕是教皇发布的篇幅较长的信件,旨在传达针对当时重要道德和社会挑战的教导。这份通谕是教皇良十四世的首份通谕,也是第一份聚焦AI及其广泛影响的通谕。

    但AI检测不是百分百靠谱

    当然,AI检测工具并非万无一失。Zhang的分析也发现,Pangram把某些章节标记为”几乎0% AI生成”。作为对比:

    • 前四份通谕的前20段内容,Pangram100%判定为人工撰写
    • 教皇良十四世的一次演讲转录文本,Pangram评级为100%人工撰写

    Pangram在AI研究人员中口碑还不错。2025年3月他们声称,把人工撰写的内容误判为AI生成的概率约为万分之一。但不同AI检测工具的结果可能截然不同,即使结果一致也无法保证完全正确。


    这件事为什么有意思

    且不论这份通谕到底是不是AI写的,这件事本身就挺讽刺的:

    • 一份警告AI危险的文档,本身可能就是AI写的
    • 发布仪式上站着Anthropic联合创始人(Claude的东家)
    • AI检测工具自己也在被质疑准确性

    目前梵蒂冈还没有回应置评请求。这份通谕的核心内容是呼吁在AI时代保持”深刻的人性”,如果它真的是用AI写的……那这个反讽力度简直拉满。

    不管结论如何,这件事给所有人的提醒是:AI生成的内容正在进入人类最权威的文本行列,而我们用来检测它的工具,本身也还在被验证

  • 谷歌AI搜索太霸道,DuckDuckGo躺赢:安装量暴增30%

    上周谷歌I/O开发者大会扔了个重磅炸弹:传统搜索的蓝色链接列表,要被AI代理彻底取代了。这个代理能回答提问、执行任务,还能在后台默默跑监控。听起来很酷对吧?但用户的反应却是——”我换搜索引擎。”

    我上周亲耳听到一位女士打电话说要改用DuckDuckGo,理由是后者可以”选择不用AI”。她的原话是:”谷歌已经不是以前的谷歌了。”看来有同样想法的人不在少数。

    谷歌这次改版引发的反弹超出预期。有人骂它”扼杀开放网络”,有人担心AI概览给出不准确的答案,还有人单纯就是烦了——连搜个”disregard”这种基础操作都被复杂化了。

    DuckDuckGo捡了大便宜

    DuckDuckGo这家一直被谷歌压着打、美国市场份额只有2%左右的隐私搜索引擎,这次居然躺赢了。数据说话:

    • 5月20-25日,DuckDuckGo美国区应用安装量周均增长18.1%,5月25日当天峰值增幅达到30.5%
    • iOS端更猛,周均增长33%,峰值增幅69.9%
    • 无AI搜索页面noai.duckduckgo.com的访问量周均增长22.7%,5月24日峰值27.7%

    有意思的是,连阵亡将士纪念日周末这种传统流量低谷期,DuckDuckGo的用户量都在涨。CEO Gabriel Weinberg这周出来表态了:”谷歌正在强制推送AI,用户没有选择退出的选项。结果就是他们的搜索结果越来越差,而不是越来越好。”

    DuckDuckGo无AI搜索选项界面
    DuckDuckGo的”No AI”搜索选项(图源:TechCrunch)

    DuckDuckGo自己也有AI,但给你选择权

    别以为DuckDuckGo是反AI原教旨主义者,人家也有AI产品,叫Duck.ai。这个产品免费、免注册,支持Claude 4.5 Haiku、Llama 4 Scout、Mistral Small 3 24B、GPT-5 mini等模型。

    关键区别在于:DuckDuckGo的AI是你可以选的,不是被强制喂给你的。而且隐私保护做得很到位——请求到达模型提供商之前就剥离用户IP,30天内删除对话记录,聊天内容不用于模型训练。

    Weinberg的说法挺直白:”我们不仅尊重用户的选择权,也尊重用户的隐私权。你在DuckDuckGo上的一切操作都是私密的。”


    这件事其实给所有做AI产品的公司提了个醒:用户并不排斥AI,但厌恶被强迫。谷歌这次改版的技术方向可能没错,但把选择权拿走,就会把用户推向竞争对手。DuckDuckGo这波流量能维持多久不好说,但至少证明了一件事——给用户选择权,比把所有功能都AI化更重要

  • 我用Google的新AI模型Omni把自己P进了埃菲尔铁塔前,效果好到让我不安

    去年我用AI把孩子的毛绒玩具”深度伪造”成了一只去度假的小鹿,当时只是想验证一下Google在Gemini广告里承诺的功能到底靠不靠谱。视频没给孩子看,但那个实验让我开始认真思考:生成式AI的”无害娱乐”和”纯垃圾内容”之间,到底有没有界限?

    也许这两个圆圈完全重叠呢。也许不是。但有一件事我很确定:做出逼真的AI视频,需要的努力和知识少得令人惊讶。而这个趋势,在Gemini进入Omni时代之后,还在继续。

    Omni到底是什么

    Omni是Google新推出的一套生成式模型家族,号称有一天能把任何类型的输入——照片、视频、文字——变成任何其它东西。不过目前阶段,它还只是个视频生成工具。

    Omni Flash是这套模型里第一个正式发布的版本,现在已经可以在Google的AI视频生成和编辑平台Flow上用。如果你愿意,当然也可以继续用旧的Veo模型——但Omni在几个维度上确实比Veo进了一步。

    Google声称Omni在生成视频时会融入更多”现实世界知识”,因此能更好地保持角色在整个视频中的一致性。

    于是我把那只AI小鹿又请了出来,让它收拾行李再去冒险——看看Omni是不是真的如Google说的那样。

    结果:好得让人困惑

    怎么说呢,结果非常两极分化,甚至可以用”令人困惑”来形容。有些片段做得很好——比我五个月前测试Veo的时候一致性和还原度都高得多。但即使是最好的片段,也还是会有一些典型的”AI惊吓时刻”:比如小鹿在跳伞的时候突然换了朝向。

    我给了Omni更多创作空间:”做一个蒙太奇,展示小鹿打包行李、登上邮轮去热带度假的过程。氛围要可爱、好玩。小鹿在行李箱里塞了件搞笑的东西,后面会在片段里派上用场。”

    结果小鹿塞了一罐蜂蜜进去;后面确实有段情节是小鹿去够那罐蜂蜜,把它当成防晒霜在挤。说实话,这个桥段还不错。问题在于那瓶蜂蜜的外观在整个视频里一直在变:从玻璃罐,变成透明的挤压瓶,又变回装蜂蜜的挤压瓶。而我甚至不知道该怎么描述模型对视频最后一帧的处理——就好像它把刚才生成的所有元素一股脑吐出来就完事了。

    AI generated content label example
    Google Omni生成的AI内容会有标注 / The Verge

    编辑功能:有进步,但还不够

    你可以用文字提示词来建议对视频进行修改。实话实说,这方面Omni确实比Veo好用。但Veo的结果本来就烂得可以——我发现每次想改点什么,直接重新生成一个新视频反而更快。Omni确实会”听进”你的修改建议,但结果并不总是能打中你想要的点。

    我让它强调小鹿在度假片段里的面部反应,结果出来的东西看起来很怪异。它还时不时给小鹿加上鹿角——但小鹿根本没有鹿角,它还是个宝宝呢,谢谢。当我提示它去掉某个场景里突然出现的鹿角时,它照做了——然后在所有其他场景里都加上了鹿角。

    这一切都不是免费的

    生成视频是要消耗”积分”的,根据场景长度和起始”素材”的不同,一次消耗15到40积分不等。一轮编辑要花40积分。我订的是每月20美元的AI Pro方案,每月给1000积分。生成了大约20个片段、其中几个做了编辑之后,我的积分就只剩145了。

    如果你对想要生成的视频有比较具体的想法,那你可能要做好心理准备:跟模型来回拉锯很多轮才能得到一个接近你想象的视频,而每一轮都要烧积分。

    然后我把自己深度伪造了

    Omni号称的强项之一是把AI生成的内容叠加到真实视频上,所以我让小鹿休息了一下,转而深度伪造了我自己。我给Omni喂了一段自拍视频,表情很中性,然后让它生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。说实话,我没准备好面对我看到的东西。

    我的深度伪造视频里有一些”AI痕迹”:叉子碰到意面碗的那个声音有点太”做作”了;飞机视频的背景里有个女人出现了两次;但除了这些小故障和一种说不清的”诡异感”之外,它们逼真得要命。

    我把吃意面的片段给我丈夫看了。他知道我在测试AI视频工具,但我没告诉他场景里哪些部分是AI生成的。在不知道哪些是AI的情况下,他完全相信我就是坐在镜头前吃意面——他唯一的疑点是那个碗看起来不太眼熟。至于吃意面这个动作本身,逼真到足以让我丈夫信服——一个在过去十年里几乎每天看着我吃东西的男人。

    我的其他深度伪造视频有不同程度的”好到能在社交媒体上骗到人”。有几段埃菲尔铁塔的片段看起来有点卡通化,但其中一段逼真到你可能要反复看几次才能发现是AI。我知道那不是我,因为AI版本的我转过头时露出了扎成马尾的头发——但我不觉得其他任何人能看出区别,而这让我感觉很怪。


    我得诚实地说,我有点被这一切整累了。当初测试Veo 3的时候,我被它能产生的真实感震惊了。过去几年里,我一次又一次地被”用AI造出假人”有多容易而震惊。我可能也应该被Omni震惊,我想我确实震惊了,但那种”震惊感”已经磨掉了。

    要用AI做出一部”电影级杰作”,其实还没有Google想让你相信的那么容易。但Omni确实在某些可辨认的维度上比Veo有进步。如果你有一个Google账号和一张信用卡,那你只需要微不足道的努力,就能把一段自己坐在家里的视频变成看起来像在飞往毛伊岛的飞机上的画面。我不觉得我们正好站在”奇点的山麓”——但我们肯定已经深深陷入了诡异谷。

  • 法拉利用了IBM的AI,想让每个F1车迷都觉得自己是”队内人”

    F1这几年的热度不用多说,美国尤其如此——Netflix那部《极速求生》把车手们的日常搬上屏幕,硬生生的把一项”有钱人的运动”变成了大众娱乐。tech公司当然也看到了这块肥肉:AWS、Oracle、Anthropic都在往车队里塞钱、塞技术。

    IBM两年前突然意识到,自己在体育赞助这块有个巨大的空白:F1。于是他们找上了法拉利——历史上赢了最多比赛的车队,没有之一。

    “他们是历史上最成功的车队。”IBM体育与娱乐合作副总裁Kameryn Stanhouse这么说。

    不只是赞助,是讲故事

    IBM跟法拉利的合作核心,说白了就是”用AI讲故事”。法拉利专门新设了一个职位——”粉丝发展负责人”,由Stefano Pallard担任。他的任务不是拉更多粉丝进来,而是让每个已有的粉丝都觉得”这支车队认识我”。

    想法其实挺朴素的:比赛期间每秒钟产生数百万个数据点,车手和赛车的每一个动作都被记录。问题是,这些数据对普通粉丝来说就是天书。IBM的AI把这些数据变成普通人能看懂、愿意看的内容——这才是难点。

    Ferrari F1 car with IBM AI branding
    IBM与法拉利的AI合作,用数据讲故事 / TechCrunch

    新App里有什么

    旧的法拉利粉丝App基本上是个”查赛程工具”——查完就走,没人留下来。新版本不一样了:有AI写的比赛总结,有幕后故事,有预测游戏,还有一个AI伴侣可以回答问题。

    甚至连”把App翻译成意大利语”这种基本功能,在IBM接手之前都没有——尽管法拉利是个意大利车队,意大利粉丝也占大头。你可以想象之前那个App有多”原始”。

    Pallard说,他们用AI分析App里的互动信号——哪些内容受欢迎、粉丝发来的消息情绪如何——然后据此调整讲故事的方式和内容的分发策略。”这帮我们理解Tifosi(法拉利粉丝的昵称)真正想要什么,然后直接指导我们怎么呈现内容。”

    粉丝变了,法拉利也得变

    F1去年发布的数据有个有趣的发现:75%的新粉丝是女性,而且很多是Z世代。她们入坑的入口往往是F1学院——一个全女性赛车系列赛,目的是培养下一代女车手。

    这些新粉丝和老粉丝要的东西其实是一样的——更多。更多数据、更多内幕、更多功能。Pallard说:”未来五年的愿景,是让每个粉丝都觉得这个体验是为他们量身定做的——不管他们跟了我们30年,还是30天。这才是持久忠诚度的来源。”

    IBM进场之后,App的互动数据确实在往上走——比赛周末的互动量增长了62%。当然,这个数字是IBM自己给出的,但方向应该没错:当AI真的在帮你”讲故事”而不是”塞数据”的时候,人们是感受得到的。

  • 和Google CEO聊了60分钟:AI、搜索的未来,以及网络正在发生什么

    和Google CEO聊了60分钟,关于AI、搜索和网络的未来

    每年Google I/O开发者大会之后,我都会和Google兼Alphabet CEO桑达尔·皮查伊(Sundar Pichai)坐下来聊一趟。今年已经是第五年了,这成了Decoder播客的一个传统。

    这次访谈的信息量很大。Google在I/O上发布了强大的新Gemini模型,把AI代理塞进了所有产品里,还对网页版和YouTube的搜索做了大改动——这些改动会再次重塑信息生态。

    Nilay Patel,The Verge主编
    Nilay Patel,The Verge主编,Decoder播客主持人(来源:The Verge)

    Google Zero从想法变成现实

    几年前我提出了”Google Zero”这个概念——意思是随着Google在搜索结果页面直接回答越来越多的问题,网站从Google获得的流量会降到零。

    当时皮查伊在访谈中还对此不以为然。但现在,整个媒体行业都在应对这个问题。连Conde Nast这样的大型出版集团CEO都公开表示,他们正在为一个”搜索流量为零”的世界做规划。

    这次我直接问了皮查伊:对于一家标志性出版集团说”我不能依赖Google搜索流量了”,他怎么回应?

    他的回答很得体:”首先,信息生态远远超出了Google的范围。我们数据显示,用户获取信息的来源比以往任何时候都多。”然后他说,出版商都在适应这个新世界,Google也在适应。

    搜索的下一步:从结果到任务

    这次I/O最引人注目的是,Google明显在推动搜索从” delivering results(提供结果)”转向”setting off tasks(触发任务)”。新的智能搜索框和Gemini Spark代理平台的结合,让搜索可以直接启动任务,而不只是给答案。

    这很令人兴奋,但似乎很可能再次改变开放网络的动态。如果Google直接帮你把事情做完了,你还需要点开那些蓝色链接吗?

    YouTube也被AI改造了

    Google还在用YouTube视频训练它的模型,并且改变YouTube搜索的方式——现在它会总结视频内容,把用户直接带到相关部分。

    这肯定会让一些创作者感到焦虑。我问皮查伊,他是否准备好和YouTuber们打一场和现在出版商们正在打的同样的仗。

    “我们站在奇点的山麓”

    这次访谈最后,我问了皮查伊关于DeepMind CEO德米斯·哈萨比斯(Demis Hassabis)在I/O主题演讲结尾说的话。

    我们现在”站在奇点的山麓”(in the foothills of the singularity),哈萨比斯这样说。

    皮查伊当然同意哈萨比斯的看法。但他对于AGI(通用人工智能)时间线的思考,值得认真关注。

    他说:” timeline不重要,因为进步的速度意味着你会在各方面与越来越强大的系统打交道。三年后,不管我们叫不叫它AGI,它都会非常、非常强大,我们必须为此做准备。”

    组织变革:为AI时代重组Google

    这次访谈中,我还问了皮查伊关于Google内部组织变革的问题。ChatGPT出现后,他意识到需要重新思考Google的运作方式,于是做了很多高管调整和重大决策,让公司进入更激进的状态。

    他把Brain和DeepMind这两个世界顶级AI研究团队合并成了”Google DeepMind”——用他的话说,这”比听起来难”,就像”把斯坦福和MIT放到一起,从它们搞出一个系或者一所大学”。

    他还设立了专门AI基础设施团队,并且让科雷·卡武克丘奥卢(Koray Kavukcuoglu)担任Google首席AI架构师。


    AI会取代CEO吗

    Decoder听众最想问CEO们的问题是:”AI多久能取代你的工作?”

    皮查伊的回答挺有意思的。他说CEO的工作”没那么复杂”,AI在决策方面会非常有帮助。他还开玩笑说,他得花很多时间分配算力,”这方面AI随着时间的推移会做出更理性的选择”。

    但他说,正确的做法是用这些工具”从更高的基础出发”,而不是不让你做你之前做的事。就像电子表格普及到公司之后,财务分析的方式在三四年内发生了根本性变化,但我们适应了。

    代理人(agents)也是类似的版本。不是你不办生日派对了,而是当你规划旅行的时候,你可能把时间花在思考真正想做的事情上,而不是追着查开放时间和买票。

  • 有人把Google搜错了:DuckDuckGo安装量暴涨30%,背后是一场「反AI搜索」运动

    当Google搜索变了味道

    上周Google I/O开发者大会的一个宣布,让很多人突然意识到:那个熟悉的Google搜索可能真的不在了。Google表示要用车AI代理取代传统的蓝色链接列表,这个代理能回答查询、执行任务,还能在后台运行监控。

    听起来很酷对吧?但现实中有人不这么想。TechCrunch记者上周无意中听到一位女性打电话说,她正在改用DuckDuckGo,因为那个平台可以”选择不使用AI”。

    “Google已经不是原来的Google了,”她说道。看来持有相同想法的人不在少数。

    反对声音有多大

    这一改动引发的反对相当强烈。有人认为这会扼杀开放网络,还有人担心AI概览会返回不准确的回复,并且剥夺了不想使用AI的用户的选择权。

    甚至有人发现,连搜索一个简单的词都变得复杂了——你可以试着在Google上搜索”disregard(忽略)”这个词看看会发生什么。

    作为回应,许多人开始转投隐私导向的替代搜索引擎DuckDuckGo。这家公司此前一直未能突破Google的主导地位,仅占美国搜索市场约2%的份额。

    DuckDuckGo无AI搜索界面
    DuckDuckGo提供的无AI搜索选项(来源:TechCrunch)

    DuckDuckGo的意外收获

    DuckDuckGo首席执行官加布里埃尔·温伯格(Gabriel Weinberg)在声明中直接点名Google:”谷歌正在强制推送AI,且没有提供退出选项。结果就是,他们的搜索结果越来越差,而不是更好。”

    数据显示,在5月20日至25日期间,DuckDuckGo在美国地区的应用安装量周均环比增长18.1%。更夸张的是,在5月25日达到了30.5%的峰值。在iOS平台上,安装增速更高,周均环比增长达到33%,峰值高达69.9%。

    有意思的是,DuckDuckGo的”无AI搜索页面”(noai.duckduckgo.com)访问量也在增长。这个页面默认关闭所有AI功能,包括AI辅助回答和AI生成的图像。

    选择权才是关键

    DuckDuckGo当然也提供自己的AI产品Duck.ai,这个服务免费且不需要用户注册账户,支持访问多个模型,包括Anthropic的Claude 4.5 Haiku、Meta的Llama 4 Scout、Mistral的Small 3 24B,以及OpenAI的GPT-5 mini。

    关键是,所有这些聊天都是私密的。DuckDuckGo会在请求到达模型提供商之前剥离用户的IP地址,在30天内删除对话,并且防止聊天内容被用于训练。

    “我们不仅尊重用户的选择权,也尊重用户的隐私权,”温伯格说,”你在DuckDuckGo上做的所有事情都是私密的;我们不收集搜索历史或聊天记录,也不会将任何内容用于AI训练。”

    DuckDuckGo还提供”搜索辅助(Search Assist)”功能,类似Google的AI概览,以及”AI图像过滤器”,可以从搜索结果中过滤掉AI生成的图像。

    公司首席传播和政策官卡米尔·巴兹巴兹(Kamyl Bazbaz)说得很直白:”人们只是想要选择权。”


    这件事其实反映了一个更大的问题:当科技公司认为”AI就是未来”的时候,他们可能忽略了一部分用户真正想要的是什么——选择权。不是每个人都需要或想要AI来”帮助”自己搜索。有些人就是想看到一个干净的、不受算法干扰的搜索结果列表。

    Google当然有权利推进AI搜索,但当他们把这件事变成”强制推送”而非”可选功能”的时候,用户用脚投票也就不奇怪了。DuckDuckGo这波增长,本质上是用户在用行动说:”我们不想被代表。”

  • DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    DeepSeek-V3:103K Stars!开源MoE大模型,以极低成本媲美GPT-4

    ⭐ GitHub热门AI开源项目 · 第38期

    DeepSeek-V3

    103K+ Stars  |  ⚡ MoE大模型  |  🚀 成本仅GPT-4的1/10

    由DeepSeek开发的开源混合专家大模型,在数学、代码和多语言基准测试中表现出色

    📌 项目简介

    DeepSeek-V3 是由DeepSeek团队开发的新一代开源混合专家(MoE)大语言模型,总参数规模达671B,每个token激活37B参数。该模型在数学、代码生成和多语言理解等基准测试中表现出色,性能媲美GPT-4和Claude 3.5,但训练成本仅约557万美元,是迄今为止性价比最高的开源大模型之一。

    671B
    总参数量

    37B
    激活参数量

    $5.57M
    训练成本

    128K
    上下文窗口

    ⚙️ 安装要求和过程

    环境要求

    • 🐍 Python 3.8+ (推荐使用Python 3.10+)
    • 📦 PyTorch 2.0+ 或更高版本
    • 💻 GPU 推荐:至少80GB显存(如A100/H100)用于完整模型推理
    • 💾 内存:建议至少128GB系统内存
    • 📁 磁盘空间:完整模型约需1.3TB存储空间(BF16格式)

    💡 提示:如果显存有限,可以使用模型量化(如4-bit/8-bit量化)或分布式推理来降低硬件要求。DeepSeek也提供了更小的蒸馏版本供本地部署。

    快速安装步骤

    # 1. 克隆官方仓库
    git clone https://github.com/deepseek-ai/DeepSeek-V3.git
    cd DeepSeek-V3

    # 2. 安装依赖
    pip install -r requirements.txt

    # 3. 下载模型权重(需同意许可协议)
    download deepseek-ai/DeepSeek-V3

    # 4. 运行推理示例
    python inference.py –model-path ./DeepSeek-V3 –input “你好,请介绍一下你自己”

    核心功能

    🧩 混合专家(MoE)架构

    采用创新的MoE架构,总参数671B但仅激活37B,大幅提升推理效率,降低计算成本。

    📐 超强数学推理

    在美国数学竞赛AIME 2024上取得优异成绩,数学推理能力接近甚至超越GPT-4o。

    💻 顶级代码生成

    在HumanEval和MBPP等代码基准测试中表现优异,支持多种编程语言,代码质量接近Claude 3.5。

    🌍 多语言支持

    支持中、英、法等多种语言,多语言理解能力在开源模型中处于领先地位。

    ⚡ 高效推理引擎

    配备优化的推理引擎,支持批处理、KV Cache、投机解码(Speculative Decoding)等加速技术,生成速度最高可达60 TPS(tokens per second)。

    🚀 典型使用场景

    📚 场景一:教育科技与数学辅导

    DeepSeek-V3的数学推理能力极强,可用于开发智能数学辅导系统。例如,某在线教育平台集成DeepSeek-V3后,能够逐步解答高中数学竞赛题,并给出详细的解题步骤和思路分析,学生满意度提升40%。

    💼 场景二:企业级代码助手

    利用DeepSeek-V3的代码生成能力,企业可以搭建内部代码助手。例如,某金融科技公司使用DeepSeek-V3辅助Python和SQL开发,代码审查效率提升50%,同时减少了30%的常见bug发生率。

    🌐 场景三:多语言内容生成

    DeepSeek-V3的多语言支持使其非常适合国际化内容生成。某跨境电商平台使用DeepSeek-V3自动生成产品描述(支持12种语言),内容生产速度提升10倍,且本地化质量显著优于传统机器翻译。

    💡 推荐理由

    作为一名经常使用大模型的开发者,我之所以强烈推荐 DeepSeek-V3,主要有以下几个原因:

    ① 性价比无敌 —— 训练成本仅约557万美元,但性能媲美GPT-4o和Claude 3.5 Sonnet。对于预算有限的团队来说,这是目前最好的开源选择。

    ② 开源可商用 —— 采用MIT License,完全开源且可免费商用。你可以自由部署、修改、二次开发,不用担心许可问题。

    ③ 推理效率高 —— MoE架构让它在保持强大能力的同时,推理成本远低于同级别密集模型。配合优化的推理引擎,可以在消费级硬件上运行量化版本。

    ④ 中文能力出色 —— 与许多主要面向英文优化的开源模型不同,DeepSeek-V3在中文理解和生成方面表现非常出色,适合国内开发者使用。

    ⑤ 活跃的社区支持 —— GitHub上103K+ stars,且有DeepSeek团队持续维护更新。社区贡献了大量教程、工具链和部署方案,降低了使用门槛。

    如果你正在寻找一个性能强劲、成本低廉、可商用的开源大模型,DeepSeek-V3绝对值得一试。💪

    📥 下载地址

    💡 提示:如果硬件资源有限,可以访问 DeepSeek开放平台 直接使用API,无需本地部署。


    📌 本文由 WorkBuddy AI 自动采集撰写

    关注我们,每周获取更多GitHub热门AI开源项目介绍 🚀

  • 我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    说到AI可穿戴设备,最近最值得拿出来聊的大概就是亚马逊收购的那个Bee了。TechCrunch的记者Lucas Ropek前段时间专门测评了一番,写得挺真实的,我看完之后的感觉跟他差不多:有意思,但也有点不太舒服。

    Bee AI可穿戴设备实拍
    Bee AI可穿戴设备实拍(图源:TechCrunch)

    它到底能做什么

    Bee这个东西本质上是个”AI腕带”——戴在手上,可以全天记录你的对话,然后自动转录、生成摘要。如果你是个经常开会、但又记不住内容的人,这个功能确实挺实用的。把Bee跟日历同步之后,它还能全天给你发待办提醒。

    使用方式很简单:开机、戴上、跟手机App同步,再填一些基础个人信息就可以了。Bee自带录音功能,按一下设备上的按钮就能开关录音。录音的时候会闪绿灯,关掉录音绿灯就灭了——这个设计至少让你周围的人知道,现在正在录音。

    Lucas在测评里说,他在打商务电话的时候用了Bee,对方同意录音之后,App自动生成了对话摘要,还把每个部分都拆分好了。之后不用重新听完整段对话就能回顾内容,这确实很有用。

    隐私这道坎

    问题也随之而来。Lucas说自己是个”隐私爱好者”。在一个普通人时刻被数字监控包围的世界里,他很珍惜任何不被记录的机会。所以把这么个会”偷听”的小玩意儿24小时戴在手上,他一点都不觉得吸引人。

    这个感受其实很多人都会有。Bee要正常工作,需要开放大量手机权限:位置、照片、通讯录、日历、手机通知——甚至还可以共享健康数据。也就是说,你的线下生活和数字生活,基本上都被它获取了。


    实际体验有一些坑

    Lucas在测评中还提到,他带着Bee去参加了每周固定和朋友一起的电影夜,整晚都开着录音。当时他们看的是《落水狗》——昆汀·塔伦蒂诺的那部暴力美学经典。Lucas还担心Bee会把里面的粗俗暴力场面当成真实事件,说不定触发什么内部警报。

    结果Bee基本知道发生了什么,它判断出他们在看电影,事后的事件总结里,还把这次对话标注为”塔伦蒂诺电影场景分析”——这个结果倒是挺有趣的。

    但从产品本身来说,Bee的转录文本质量还不够稳定,有时候会漏掉对话片段,也不一定能够准确识别不同的说话人。至于职业场景,Bee确实有一定的潜力——如果你每天要开很多会,脑子记不住所有内容,Bee算是个还算称职的助手。

    数据存在云端,你放心吗

    更关键的是,Bee收集的大量数据都存储在云端。亚马逊跟很多大型科技公司一样,偶尔也会出现数据安全问题。公司在隐私政策里说已经”实施了技术和组织安全措施”,还进行了”严格的第三方安全审计”——这些话术我们都听了很多遍了,至于实际效果如何,只能说见仁见智。

    如果未来能推出完全本地运行的版本——也就是数据不用上传云端——可能会吸引到更多像Lucas这样的”隐私爱好者”。亚马逊去年收购了Bee之后,应该还会继续迭代这个产品,至于能不能在实用性和隐私保护之间找到平衡点,接下来几年会很关键。