你在AI模型眼里存在吗?这个新工具给你打了分

Google不好用了,那查人用啥?

你上一次在Google上搜自己是什么时候?如果答案是”很久以前”,那你的感觉没错——Google搜索的结果确实不像以前那么好用了。但这背后有个更深层的变化:大家现在了解一个人,越来越多地通过聊天机器人,而不是搜索引擎。

AI模型记忆与身份搜索
In the Weights 用分数衡量你在AI模型眼里的存在感

两个前OpenAI员工Thomas Dimson和Joey Flynn最近做了个工具叫In the Weights,把这个变化变成了一个可以量化的游戏。”Weights”指的是AI模型的参数权重——那些决定模型训练和输出的数字。这个网站声称能测量”一个模型在不用搜索工具的情况下,能多准确地回忆起某个人”。

被写进权重里,意味着你的存在被认为足够重要,重要到在创造超级人工智能的过程中被记住了。

怎么测的?

具体做法挺直接:网站拿类似”这个人是谁?给出最多10个结果,每个带简短描述”这样的问题去问不同的模型,包括Grok、Gemini、多个版本的GPT、Claude、Llama,还有一些不太知名的模型。然后把相似的描述聚类,给你打个”强度分”。

TechCrunch的作者Anthony Ha试了一下,拿了641分,排在前6%。他正得意呢,一查发现好几个同事分数比他高多了。排行榜一直在变,写这篇文章的时候,”小鬼当家”的主演Macaulay Culkin排第一,988分,和歌剧演唱家Luciano Pavarotti咬得很紧。

幻觉标出来了

结果里还会显示哪个模型给出了哪个答案,顺手把可能出现的幻觉也标出来。比如GPT-5.4 Mini说”Anthony Ha是个缩写,可能指多个名字首字母是A.H.A.的人”——这明显是在胡说。

为什么做这个东西?Dimson说,他和Flynn离开OpenAI之后(他们是通过OpenAI收购设计工作室Global Illumination进去的),想找点有创意的事情做。他的想法是:2026年,Google式的虚荣搜索已经不是正确的目标了,因为越来越多的流量在往大语言模型那边走。

那么多人的生活某种意义上是被编码进AI大脑里的一堆浮点数里面的。

反响超预期

Dimson说,反响比他们预想的要疯狂得多。他们本来以为就是个小小的好奇心的产物,结果好像戳中了大家的某根神经——大家都想看看自己在超级智能里是不是”永垂不朽”了。互相比较也是一大动力。

这个网站还有个加分项:界面设计走的是任天堂NES的复古像素风,挺有特色的。Dimson说,他接下来打算深挖一下,为什么同一个系列的不同模型会给出不同结果,哪些模型对哪类人有偏见,以及哪些人”应该有个维基百科词条但实际上没有”。

说到底,这个工具提出了一个挺有意思的问题:当AI模型成为大家获取信息的主要方式,你在模型眼里的”存在感”,是不是成了一件值得在意的事?

📎 原文来源:In the Weights is your new AI-centric vanity search — TechCrunch

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注