标签: 数据隐私

  • 微软对外推Claude Fable 5,对内却把门关上了

    微软刚刚把Anthropic最新、最强的Claude Fable 5推给了全世界。GitHub Copilot用上了,Foundry平台也集成了,开发者们已经在用这款Mythos级模型写代码。但有个细节很多人没注意到:微软自己员工的工作场景里,暂时用不了这款模型。

    这事听起来有点矛盾。一家公司将别人的AI模型打包进自己的核心产品、推向外部客户,但自己人却不能用。原因说起来也不复杂:数据

    Anthropic在发布Claude Fable 5的时候,附带了一个新的数据留存规则。为了运行这套新模型配套的安全分类器,Anthropic会保存用户的提示词和模型输出,留存期30天。如果内容被标记为违反Anthropic使用政策,相关数据最长会留存2年。

    这个规则对普通用户来说可能没什么感觉,但对微软这样级别的企业来说,就是另一回事了。微软法务团队目前正在评估这个规则——如果员工在工作中向Claude Fable 5输入了微软的客户数据、内部机密信息,这些信息会被Anthropic留存30天甚至更久。这在合规和数据安全层面是一个实打实的风险点。

    内部先关门,外部照常推

    评估还没出结果,微软内部已经先采取了限制措施。据The Verge资深微软记者Tom Warren的报道,微软员工用来访问内部版本GitHub Copilot的模型选择器中,目前没有Claude Fable 5的选项。

    有意思的是,其他所有Claude系列模型在微软内部仍然可以正常使用。原因很直接:那些旧版本都遵循”零数据留存”(ZDR)规则,不会保存用户的交互数据,微软的法务团队对它们开了绿灯。

    Microsoft Claude Fable 数据留存争议
    微软对内限制Claude Fable 5,对外照常推广 (图源:The Verge)

    这里呈现了一个微妙的画面:微软在对外商业化Claude Fable 5这件事上跑得很快。Anthropic 6月9日发布,微软几乎同步就上线到了GitHub Copilot和Foundry平台。但同样是这款模型,微软自己却不敢让内部员工随便用。

    Anthropic的走钢丝表演

    Anthropic这边也在小心走路。Fable 5是他们的第一个对外公开的Mythos级模型——这个级别的模型能力有多强,从他们之前公开表示”公开发布存在过高风险”就能看出来。为了能推出来,他们加了好几层提示词安全防护。而数据留存规则,正是这套安全机制的一部分。

    微软拒绝就员工的这一使用限制发表评论。但从目前的情况来看,Anthropic的数据留存规则如果不调整,这款模型很可能长期被挡在微软内部的大门之外。

    这件事其实折射出一个更大的问题:当AI模型越来越强,它们需要的数据留存策略也越来越复杂。模型提供方希望留存数据来运行安全机制、改进模型;但企业客户——尤其是微软这种级别——对数据留存的容忍度极低。两边的需求在Fable 5这里撞车了。

    对于微软的外部客户来说,目前还不受这个内部限制的影响。GitHub Copilot用户该用还是能用。只是不知道,那些把敏感代码库接进Copilot的团队,会不会也开始问同样的问题。


  • Google悄悄改了隐私规则:你用Lens拍的图、Search Live的录音,现在可以用来训练AI了

    Google又在动用户数据的脑筋了。这次中招的是Google Lens、Search Live、语音搜索和Google翻译——你通过这些功能上传的图片、录音和视频,现在会被保存在一个新设置的”搜索服务历史”里,用来训练和改良Google的AI模型。

    新的”搜索服务历史”是什么?

    根据Google发给用户的邮件和官网更新,这个新设置会保存你通过以下方式产生的交互内容:用Google Lens搜索的图片、Search Live实时搜索的录音、语音搜索记录,以及用Google翻译说出的短语录音。

    Google的理由是,这些数据用来”提供、开发和改良服务”,包括AI模型,同时如果你打开了新的”个性化推荐”设置,还会用来推送个性化建议和广告。

    Google将使用您的搜索服务历史记录来”提供、开发和改良其服务,包括其AI模型”,以及如果您打开了新的”个性化推荐”设置,还会提供个性化建议和广告。

    怎么关掉?和以前的设置有什么区别?

    用户可以在新的”搜索服务历史”设置里关闭这个选项,也可以关闭”保存媒体”选项。但问题在于,大多数人根本不会去检查这些设置。

    以前,这些搜索相关的交互数据是包含在”网页和应用活动”设置里的。现在Google把它们拆了出来,变成了一个独立的设置。也就是说,即使你以前关掉了网页和应用活动追踪,这个新设置可能仍然是打开的——除非你之前已经明确禁止Google保存搜索历史,在这种情况下,过渡期间”搜索服务历史”会保持关闭。

    Google搜索AI功能示意图
    Google搜索的AI功能不断扩张,背后是海量用户数据的支撑 | 图源:The Verge

    这事儿为什么值得在意?

    说到底,这是Google在AI军备竞赛中的标准操作——需要尽可能多的真实用户数据来训练模型。Lens的图片、Search Live的录音、翻译的语音,这些都是高质量的多模态数据,对训练多模态AI模型来说价值极高。

    问题是,大多数用户并不知道自己的这些数据正在被用来训练AI。Google的做法是:先设为默认开启,然后告诉你”你可以关掉”。这和之前各种隐私争议的套路如出一辙。

    如果你在意自己的数据隐私,现在就去Google账号设置里检查一下”搜索服务历史”——它可能在你不知情的情况下已经打开了。

    • 设置路径:Google账号 → 数据和隐私 → 搜索服务历史
    • 建议同时检查”网页和应用活动”以及”个性化推荐”设置
    • 这些设置将在”未来几个月内”逐步推出,不是所有人现在都能看到