标签: AI

  • iOS 27里这些AI功能,比新版Siri更值得关注

    iOS 27里这些AI功能,比新版Siri更值得关注

    iOS 27 AI功能概念图
    iOS 27 实用AI功能散布在系统各个角落(概念图)

    WWDC本月早些时候,苹果发布了AI版Siri的重磅更新——这个说了好几年的”理解个人语境、能替你操作手机”的Siri终于要来了。但这只是台面上的大新闻。散落在iOS 27各个角落里,还有一批更接地气的AI功能,它们不需要你主动去跟Siri对话,而是在你用手机的过程中默默让事情变得更顺。

    这些功能现在在开发者测试版里已经能用,公测版很快跟上,秋天正式推送。看完清单,你大概会同意:苹果这一次对AI的理解,比”做个聊天机器人”要实在得多。

    拍张小票就能AA制

    吃完饭最烦的事之一:把小票拍下来,手动算每个人吃了什么、该均摊多少。iOS 27里,Apple Cash新增了账单拆分功能,用Apple Intelligence识别小票上的项目、数量、小费、税费,然后让你勾选自己吃了哪些菜,再群发给一起吃饭的人。每个人自己选自己的,最后用Apple Cash结算。整个过程不超过一分钟。

    这个功能妙在它不强迫你用——小票识别只在你打开Apple Cash的时候才出现,而且它懂”分一半”这种操作(比如你跟朋友合点了一份前菜)。

    密码被泄露了?AI帮你自动改

    用了密码管理器也不代表安全。数据泄露这种事,用户自己其实没什么办法。iOS 27的密码更新功能会用Apple Intelligence自动识别弱密码和被泄露的密码,然后替你打开网站、登录、把密码改成更安全的版本——整个过程不需要你手动操作。

    这比现在”系统通知你密码可能泄露、请你去改”的做法前进了一大步。当然,让AI代你登录网站这件事本身也需要信任,苹果强调这一切都在设备端完成,不上传数据。

    Messages里的一键建议

    朋友发信息让你带东西、让你分享某次聚会的照片、或者约你吃饭——iOS 27的Messages会用Apple Intelligence读懂对话内容,然后直接在输入框上方给出”一键操作”建议:把请求加到提醒事项、把照片选好让你确认发送、把饭局加到日历。

    这个设计很苹果:AI在后台跑,但界面上看起来只是”多了几个方便的按钮”,你甚至不一定意识到这是AI在帮你。不需要喊Siri,不需要切换应用,该出现的时候它就在那里。

    打电话时自动显示订单号

    打航空公司或酒店的客服电话,对方第一句通常是”请问您的确认码是?”——然后你就要手忙脚乱地去邮件里翻。iOS 27的”通话上下文”功能会从你的Mail里提取相关信息,在你拨号的时候就显示在通话界面上。订单号、确认码、预约时间,都直接呈现。

    同样,这一切在设备端完成。苹果的逻辑是:AI不一定非要以”助手”的身份出现,它也可以只是一个”刚好在你需要的时候把信息放到你眼前”的后台能力。

    用自然语言建快捷指令

    快捷指令(Shortcuts)一直是iPhone里最强大但也最难上手的 app。iOS 27里,你直接用自然语言描述想做什么,Apple Intelligence就会帮你建好这个快捷指令。比如”让我每天晚上根据明天的日程自动设闹钟”,或者”每次我下班的时候给伴侣发个预计到家时间”。以前要在快捷指令编辑器里拖半天模块,现在说一句话就行。

    其他值得提的功能还有:Safari用AI自动把打开的标签页按主题分组;家庭 app 用AI把多次触发的通知合并成一条(比如”有人到家了,车库门已关”);直接用说话的方式往日历里加事件,AI会自动提取时间、地点、参与人。

    苹果这一轮AI功能的底层逻辑跟Google和Microsoft很不一样:它不是在做一个”你跟它聊天”的AI,而是在让整个系统变得更聪明。Siri的升级是头条,但真正改变日常体验的,可能是这些散落在各个 app 里的小改动。


  • 2026年科技大裁员,AI成了最常被提到的理由

    2026年科技大裁员,AI成了最常被提到的理由

    2026年科技行业AI裁员趋势概念图
    2026年科技大裁员,AI成为最常被提及的理由(概念图)

    Oracle刚在监管文件中披露,过去12个月裁了2.1万人,占员工总数13%。公司在文件里写得很直白:AI技术的部署已经导致、并且可能继续导致员工数量减少。这句话把2026年科技行业最尴尬的现状摊开了——公司一边赚着历史级的营收,一边正大批量裁人,而AI既是增长的引擎,也是裁员的理由。

    Outplacement公司Challenger, Gray & Christmas的数据很说明问题:5月是几年来单月裁员最高的一次,AI是被提到最多的原因。这不止是某一家公司的决策,而是整个行业在集体做同一件事。

    从Oracle到亚马逊,名单还在变长

    这份名单读起来有点长。Google在整个2026年通过绩效考核和重组悄悄裁员,外部估算在1500到3000名工程师以上,而Google Cloud营收同比增长63%,首次突破200亿美元。Meta在5月裁了约8000人(10%员工),同时把约7000人转岗到AI部门——有报道说那些被塞进AI组的人并不开心,称那里像”灵魂粉碎的古拉格”。

    Cisco在同月裁了近4000人(5%),财报却好于预期。Cloudflare裁了1100人(20%),季度营收6.398亿美元,同比涨34%,是公司历史上最好的单季成绩。CEO Matthew Prince后来的解释是:被裁的”绝大多数是衡量者”——中 management、财务、法务、内审、收入确认。

    “我们绝大多数上周被裁的人,都是衡量者。”Cloudflare CEO Matthew Prince这句话,差不多把这一轮AI裁员的本质说清楚了。

    其他公司的动作也差不多。Intuit裁了约3000人(17%),PayPal宣布未来两三年裁20%员工(超4500人),理由都是”重新分配资源到AI”。Coinbase裁了700人(14%),CEO Brian Armstrong说AI让工程师”用几天时间完成过去一个团队几周才能做完的事”。Snap裁了约1000人(16%),CEO Evan Spiegel给的理由是AI进步让团队能减少重复劳动、提速度。

    不是所有公司都只用AI当借口

    有些公司的裁员确实跟AI有关系,但故事没那么简单。Block(Jack Dorsey的公司)裁了近4000人,差不多腰斩,从1万人以上降到6000人以下。Dorsey在X上写的是:智能工具加小团队正在改变”建立和运营公司的意义”。Salesforce裁了不到1000人,CEO Marc Benioff的说法是Agentforce让客服case数量下降,不再需要主动补位支持工程师——这话听起来像是真有用上AI,不只是拿AI当幌子。

    但更多情况下,这一轮裁员的背景是疫情期间的过度招聘。很多公司2020-2021年大扩招,现在以AI为由”合理化”人员调整。TechCrunch之前有一篇评论说,这个理由可能是个”火药桶”——被裁的员工并不觉得自己是被AI替代的,而是觉得公司拿了AI当幌子做他们早就想做的结构优化。

    不管怎么说,2026年这场以AI为名的大裁员还在继续。下一波会是谁?名单估计还会变长。


  • OpenAI发起”Patch the Planet”计划,用AI帮开源项目找漏洞

    OpenAI发起”Patch the Planet”计划,用AI帮开源项目找漏洞



    OpenAI开源安全计划概念图
    AI帮助保护开源软件(概念图)

    开源软件有个老问题:它是整个互联网的地基,但维护它的人往往只有两三个,还没工资。bug和漏洞就潜伏在这些代码里,哪天爆出来就是大事——Log4j那次大家都还记得。现在OpenAI说,它想用AI来帮开源社区找漏洞、修漏洞,而且不是只给机器扫一遍就完事,而是派真人去跟项目维护者一起改。

    “Patch the Planet”是什么

    这个计划叫”Patch the Planet”,名字是在向1995年电影《Hackers》里的经典台词”Hack the Planet”致敬。OpenAI周一(6月22日)正式公布了这个倡议,合作方是一家叫Trail of Bits的安全公司。

    具体怎么运作?Trail of Bits的安全工程师会直接跟开源项目的维护者对接,一起审查代码里可能存在的问题。OpenAI自己的安全工具——比如Codex Security——会在这个过程中帮忙做代码分析。

    OpenAI在公告里说了一段挺实在的话:”很多维护者已经被要求用更少的时间和资源、更快地处理更多的报告。’Patch the Planet’的设计是减轻这个负担,而不是再给他们加活。”

    为什么现在做这件事

    开源软件的安全问题不是新鲜事。Log4j事件就是典型案例:一个被无数商业软件依赖的开源工具里出了一个漏洞,结果全球一大片系统都受影响。开源生态的问题在于,它是去中心化的,很多项目的维护者就是靠爱发电,没有足够的人力物力去做系统性的安全审查。

    但最近一两年,情况起了变化。AI工具开始出现能自动在代码里找bug、甚至自动生成exploit(攻击脚本)的能力。Anthropic去年推出的Mythos就是一个被广泛讨论的例子——它的本意是帮安全研究人员找漏洞,但同样的技术也可以被坏人用来批量发现并攻击开源项目里的弱点。当AI把”找漏洞”这件事的门槛降到几乎为零的时候,开源生态的脆弱性就被放大了。

    OpenAI现在是反过来用AI做防守方——用自家的Codex Security等工具,帮开源社区把漏洞在坏人发现之前先找出来、修好。这个姿态本身也挺有意思:Anthropic的Mythos被不少人质疑会给网络攻击”赋能”,OpenAI这边则直接拿出了一个看起来更负责任的用法。

    能做成什么样

    当然,这个计划到底能做成什么样,现在还不好说。OpenAI的公告里没有说这个计划会运行多久、覆盖多少项目、怎么选项目,也没有说Trail of Bits的工程师能投入多少时间。开源项目成千上万,漏洞更是数不清,光靠一家安全公司加OpenAI的工具能覆盖多少,是个现实问题。

    但至少方向是对的。开源软件的安全问题一直是个”公地悲剧”——大家都在用,但没人愿意出钱维护。现在有几家大科技公司开始认真对待这件事,总比一直放任要好。

    更大的背景

    这件事的更大背景是:AI正在改变网络安全的攻防平衡。五眼联盟(美国、英国、加拿大、澳大利亚、新西兰的情报共享机制)本月初刚发了一份联合声明,警告各组织”立即行动”应对AI带来的网络威胁,理由是对手已经在用AI提升攻击效率了。

    当攻击方用上AI的时候,防守方如果还是老办法,肯定是来不及的。OpenAI这个计划至少是在尝试用AI的速度来对抗AI的威胁——哪怕它能不能真正规模化还存疑。


    “Patch the Planet”这个名字起得挺狂的,仿佛要把整个地球的开源漏洞都修一遍。显然这不现实。但它至少释放了一个信号:AI公司开始认真对待开源安全这件事了,而且愿意出人出工具来做。对于每天靠开源软件跑着无数业务的世界来说,这总归是件好事。


  • 被英伟达挖走创始人之后,Groq融了6.5亿美元重新出发

    被英伟达挖走创始人之后,Groq融了6.5亿美元重新出发



    Groq AI芯片概念图
    Groq的AI推理芯片(概念图)

    想象一下这个场景:你花十年时间攒出一家AI芯片公司,技术是自己亲手设计的,结果某天英伟达跑来跟你说——”把技术授权给我,顺便你的创始人兼CEO我也一并请走了”。你会怎么办?

    Groq的选择是:再融一笔钱,换一批人,换个打法,继续干。

    Jonathan Ross和他的LPU

    先把时间拨回十年前。Jonathan Ross在Google待过,帮Google搞出了TPU(Tensor Processing Unit)那块AI训练芯片。出来创业后,他搞了一款叫LPU(Language Processing Unit)的推理芯片,专门给大模型推理用的,速度很快。2024年Groq的估值冲到69亿美元,在AI芯片圈里算是英伟达之外最被看好的挑战者之一。

    然后英伟达来了。2025年12月,英伟达跟Groq签了一份非独占技术授权协议——说白了就是把LPU的技术拿去用——同时把Ross、总裁Sunny Madra和一帮核心工程师全部请进了英伟达。这笔交易的结构在AI圈有个外号叫”not-acqui-hire”:投资人拿钱走人,人才被挖走,但公司品牌还留着。

    英伟达那边当然没闲着。今年3月的GTC大会上,英伟达直接推出了自己的Groq 3 LPX推理硬件系统,用的就是拿到授权的LPU技术。

    6.5亿美元,重新出发

    按理说,核心技术IP给了竞争对手、创始人也被挖了,这家公司基本可以宣告出局了。但Groq没有。

    6月22日,Groq宣布完成6.5亿美元新一轮融资。领投方是达拉斯的成长型基金Disruptive(其创始人Alex Davis同时担任Groq董事长)和佛罗里达对冲基金Infinitum。Groq没有披露最新估值,但去年9月上一轮融资时估值还是69亿美元。

    更关键的是,Groq在业务上做了一个 pivot——转向所谓”neocloud”业务。这个业务原来由Madra负责,现在成了一号位。

    根据公司披露的数据:Groq的推理云现在有13个数据中心,覆盖北美、欧洲、中东和亚太,服务超过500万开发者,每周处理上万亿个token。这个规模说明,哪怕核心技术IP被英伟达拿走了,Groq的云服务本身还是有客户的。

    新班子,新打法

    创始人走了,就得找新人。Groq这几个月的动作就是:招人。

    新任CEO是Doug Wightman——他当初没有跟Ross一起去英伟达,留了下来。COO请来了Alan Rice,之前在xAI和Meta干过,再之前是美国海军出身。CTO和CPO则是一对被投过的创业搭档:Sinclair Schuller和Rakesh Malhotra,两人之前一起搞过企业云软件公司Apprenda,后来又创立了软件工程公司Nuvalence,2024年被安永收购。

    这个班子搭建的意图很明确:Groq不再主打芯片硬件,而是主打推理云服务。问题是,英伟达现在自己也有Groq 3 LPX系统了,Groq的云服务还能有多少差异化优势?

    活着就有希望

    有意思的是,这种”被大厂not-acqui-hire之后还能活下来”的案例,在AI圈并不是没有先例。

    Scale AI去年被Meta用143亿美元做了一笔类似的交易(Meta拿了Scale的数据标注授权,同时挖走了创始人兼CEO Alexandr Wang等人)。当时外界普遍认为Scale要完蛋了。但Scale AI的CEO Jason Droege今年5月告诉Forbes,公司业务已经反弹,今年营收预计突破10亿美元。

    Groq能不能复制这个剧本?现在下结论还为时过早。推理云服务这个赛道确实需求爆炸,各家AI公司都在抢算力,VC也愿意砸钱(就在本周,另一家推理初创公司Baseten据说正在以更高估值融资)。但竞争也在快速加剧——英伟达自己下场了,这可不是普通对手。


    AI芯片这个游戏,有钱就能继续玩。Groq拿了6.5亿,换了新班子,转了新方向,还留着500万开发者和每周上万亿token的处理量。这些筹码够不够跟英伟达再打一轮?至少Ross去了英伟达之后,Groq还没有选择投降。


  • 欧洲不想跟美国一起掐中国芯片,ASML成了夹心饼干

    美国想拉上欧洲一起堵死中国买芯片制造设备的路,但欧洲不干了。荷兰贸易大臣Sjoerd Sjoerdsma本周跑了一趟华盛顿,会见美国商务部长Howard Lutnick和国会议员,目的很直接:反对《MATCH法案》。这个法案如果通过,会禁止中国芯片制造商使用西方半导体设备,而受影响最大的就是荷兰公司ASML。

    ASML光刻机与欧美芯片政策博弈
    ASML是唯一能生产最先进光刻机的公司,如今被推到了美中芯片博弈的风口浪尖

    ASML是欧洲最有价值的公司,也是全世界唯一能做出先进AI芯片所需的光刻机的企业。中国市场对ASML来说不是小头——占其系统销售净额的19%。

    MATCH法案掐住的是哪条脖子

    现有的管制措施已经不让ASML把最先进的EUV(极紫外光刻)设备卖给中国了,但中国还能买到稍老一代的DUV(深紫外浸入式)设备——这些机器大概是十年前的技术,但依然能造出不少成熟制程的芯片。MATCH法案想做的,是把DUV也塞进禁令里。

    “我这次来华盛顿向国会全面说明我们的关切,这种情况很不寻常。对荷兰来说,利害关系可能非常高。”
    ——荷兰贸易大臣 Sjoerd Sjoerdsma(引自彭博社)

    ASML CEO Christophe Fouquet今年5月跟TechCrunch聊过这个话题。他的态度很明确:没人能轻易取代ASML在光刻机领域的地位,但中国市场丢了,对公司来说是很真实的损失。19%的销售额不是小数目,强行切断意味着ASML的营收要重新找补回来。

    欧洲为什么不愿意跟

    美国的算盘是拉着盟友一起把对中国的芯片设备出口掐紧,这样中国就没办法自建先进芯片产能。但欧洲有充足的理由不配合:ASML是荷兰的命根子企业,强行丢了中国市场,这家公司的研发投入和全球竞争力都会受影响,最终吃亏的是欧洲自己。

    还有一层考虑:中国是全球最大的芯片消费市场之一,欧洲的光刻机、德国的化工材料、日本的设备零部件,整个半导体供应链里中国都是重要买家。美国可以靠本土市场和盟友体系扛住中国的反制,但欧洲单一国家的抗压能力没那么强。


    法案还没过,但博弈已经开始了

    MATCH法案今年4月提出的,目前还没走到众议院或参议院全体投票那一步。彭博社的分析认为,它大概率得塞进一个更大的法案包裹里才能过关。这意味着荷兰和其他欧洲国家还有一段时间可以游说、谈判、想办法把最糟的条款拦下来。

    这件事背后更大的问题是:美国主导的芯片围堵战略,在盟友内部已经出现了裂痕。韩国、荷兰、德国都有自己的产业算盘,不是每个国家都愿意为了配合华盛顿而牺牲自家龙头企业的中国市场。这场芯片战争,后面还有得吵。

  • 做人形机器人的Agility Robotics要上市了,估值25亿美元

    做人形机器人能赚到钱吗?这个问题在投资圈吵了好几年,现在终于有了一家公司愿意走到公开市场对答案。Agility Robotics——就是那个做出双足机器人Digit、从俄勒冈州立大学孵化出来的团队——本周宣布要通过SPAC方式上市,交易完成后估值大概25亿美元。

    Agility Robotics的人形机器人Digit
    Agility Robotics的Digit人形机器人已在多家工厂投入实际使用

    这笔交易是跟特殊目的收购公司Churchill Capital Corp XI合并,预计能给Agility带来超过6.2亿美元的资金进账,其中包括来自新旧机构投资者的约2亿美元。公司说,这笔钱主要用来扩大下一代Digit v5的产能、交付现有订单,还有拓展新老客户。

    已经在跑的客户

    Digit这个双足机器人现在已经在9个客户现场跑着了,包括舍弗勒、GXO、加拿大丰田工厂,还有南美电商Mercado Libre。Agility说新版Digit v5已经拿下超过3亿美元的多年级订单,还有30多个潜在客户在评估大规模部署方案。

    “人形机器人即将成为提升生产力、供应链韧性和美国技术领导力的关键驱动力。Agility已经在客户环境中部署了商业化人形机器人,正在帮助企业应对劳动力短缺、提升效率,把AI驱动的自动化安全地整合进他们的运营。”
    ——Agility CEO Peggy Johnson

    这家公司背后站着一堆知名机构和科技公司:亚马逊、英伟达、软银愿景基金2期、DCVC都投过它。合并后的公司预计会在北美某个证券交易所挂牌,股票代码是AGLT,具体哪家交易所还没公布。

    人形机器人赛道的分水岭

    Agility这一步走得挺关键。人形机器人这个赛道喊了好几年,Figure、Boston Dynamics、Tesla的Optimus都在往前推,但真正把产品卖出去、产生收入的公司不多。Agility的打法是先盯住仓库和工厂这种相对结构化的场景,让Digit干搬运、分拣这些活,而不是一上来就喊”通用机器人”的大口号。

    25亿美元的估值合不合理?可以对比一下:Figure AI上一轮融资估值26亿美元,但那时还没什么收入。Agility已经有客户在付钱、有订单在手,这个估值相对来说不算离谱。SPAC虽然名声一般,但对于想快速上市、又不想走传统IPO路演流程的公司来说,还是一条可行路径。


    人形机器人从实验室走到工厂车间,再从车间走向公开市场,Agility这个案例会成为后面一批机器人公司的重要参照。接下来看它能不能真的把Digit大规模交付出去,而不只是停留在”演示视频很酷”的阶段。

  • Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    📦 项目简介

    Weaviate 是一款开源、云原生的向量数据库,同时存储对象和向量,支持大规模语义搜索。它将向量相似度搜索、关键词过滤、检索增强生成(RAG)和重排序功能整合到单个查询接口中,是构建 AI 应用的理想数据底座。

    Weaviate Logo

    ⚙️ 安装要求和过程

    环境要求

    • Docker 20.10+(推荐方式)
    • 内存:最低 4GB RAM,生产环境建议 8GB+
    • 客户端:Python 3.8+、Node.js 16+、Java 11+、Go 1.18+

    快速安装(Docker 本地部署)

    第一步:创建 docker-compose.yml

    services:
      weaviate:
        image: cr.weaviate.io/semitechnologies/weaviate:1.36.0
        ports:
          - "8080:8080"
          - "50051:50051"
        environment:
          ENABLE_MODULES: text2vec-model2vec
          MODEL2VEC_INFERENCE_API: http://text2vec-model2vec:8080
      text2vec-model2vec:
        image: cr.weaviate.io/semitechnologies/model2vec-inference:minishlab-potion-base-32M
    

    第二步:启动 & 安装客户端

    docker compose up -d
    pip install -U weaviate-client
    

    也可使用 Weaviate Cloud 免费试用,或部署到 Kubernetes/AWS/GCP。

    🚀 核心功能

    ⚡ 毫秒级十亿向量搜索

    基于 Go 构建,HNSW 索引,十亿级向量语义搜索毫秒返回。

    🔀 混合检索(向量+关键词+过滤)

    单接口同时支持语义搜索、BM25 关键词搜索、图像搜索,内置 hybrid 查询自动融合分数。

    🤖 内置 RAG & 重排序

    无需额外工具,直接支持生成式搜索(RAG)和重排序,快速构建 Q&A、聊天机器人。

    📈 生产级可扩展性

    支持水平扩展、多租户隔离、副本、RBAC 权限控制,Kubernetes 原生编排。

    💾 向量压缩 & TTL

    内置标量/二进制/产品量化,大幅降低内存占用;支持对象 TTL 自动清理过期数据。

    💡 典型使用场景

    场景一:RAG 检索增强生成系统

    将企业文档导入 Weaviate,结合 LLM 构建精准问答系统,大幅降低幻觉率。

    import weaviate
    from weaviate.classes.query import Filter
    
    client = weaviate.connect_to_local()
    results = client.collections.get("Document").query.near_text(
        query="如何申请退款?", limit=5,
        filters=Filter.by_property("category").equal("help")
    )
    for obj in results.objects:
        print(obj.properties["content"])
    

    场景二:语义搜索 & 推荐引擎

    电商/内容平台实现”理解意图”的搜索,支持多模态(文本+图像)检索。

    📌 推荐理由

    • 生态最完整:Python/JS/Java/Go/C# 五大官方 SDK
    • AI Agent 集成:官方提供 Agent Skills,支持 Claude Code/Cursor
    • 商业友好:BSD-3-Clause 许可,可自由修改和分发
    • 云原生架构:存储计算分离,Kubernetes 原生,水平扩展无忧

    📥 下载地址 & 相关链接

    ✝️ BSD 3-Clause License | Go | 2016年发布

  • Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    Weaviate:AI 开发者最爱的开源向量数据库,语义搜索与 RAG 的首选数据底座

    📦 项目简介

    Weaviate 是一款开源、云原生的向量数据库,同时存储对象和向量,支持大规模语义搜索。它将向量相似度搜索、关键词过滤、检索增强生成(RAG)和重排序功能整合到单个查询接口中,是构建 AI 应用的理想数据底座。

    Weaviate Logo

    Weaviate —— AI 开发者最爱的开源向量数据库

    ⚙️ 安装要求和过程

    环境要求

    • Docker 20.10+(推荐方式)
    • 内存:最低 4GB RAM,生产环境建议 8GB+
    • 存储:持久化卷(可选,用于数据持久化)
    • 客户端:Python 3.8+、Node.js 16+、Java 11+、Go 1.18+ 可选

    快速安装(Docker 本地部署)

    第一步:创建 docker-compose.yml 配置文件:

    services:
      weaviate:
        image: cr.weaviate.io/semitechnologies/weaviate:1.36.0
        ports:
          - "8080:8080"
          - "50051:50051"
        environment:
          ENABLE_MODULES: text2vec-model2vec
          MODEL2VEC_INFERENCE_API: http://text2vec-model2vec:8080
    
      # 轻量级嵌入模型,导入数据时会自动生成向量
      text2vec-model2vec:
        image: cr.weaviate.io/semitechnologies/model2vec-inference:minishlab-potion-base-32M
    

    第二步:启动服务

    docker compose up -d
    

    第三步:安装 Python 客户端

    pip install -U weaviate-client
    

    也可以使用 Weaviate Cloud 托管服务(免费试用),或部署到 Kubernetes、AWS、GCP 等云平台。

    🚀 核心功能

    ⚡ 毫秒级十亿向量搜索

    基于 Go 构建,高负载下响应稳定。采用 HNSW(Hierarchical Navigable Small World)索引算法,支持 ANN 基准测试领先性能,十亿级向量复杂语义搜索毫秒级返回。

    🔀 混合检索(向量 + 关键词 + 过滤)

    单接口同时支持语义搜索传统关键词(BM25)搜索图像搜索,支持高级过滤,可灵活组合获得最优结果。内置 hybrid 查询类型,自动融合向量相似度与关键词相关性分数。

    🤖 内置 RAG & 重排序

    无需额外工具,直接支持生成式搜索(RAG)重排序(Reranking)能力。可快速构建 Q&A 系统、聊天机器人、摘要工具。集成 Cohere、OpenAI、Voyage 等主流 Reranker 模型。

    📈 生产级可扩展性

    支持水平扩展多租户隔离副本细粒度 RBAC 权限控制,适配从原型到大规模生产场景。存储计算分离架构,支持 Kubernetes 原生编排。

    💾 低成本运维 & 向量压缩

    内置向量压缩能力(标量量化、二进制量化、产品量化),通过向量量化、多向量编码降低内存占用,对搜索性能影响极小。支持对象 TTL 机制,按集合配置数据过期时间,自动清理过期数据。

    💡 典型使用场景

    场景一:RAG(检索增强生成)系统

    将企业文档、知识库导入 Weaviate,结合 LLM 构建精准问答系统。Weaviate 负责语义检索召回相关段落,LLM 负责生成最终答案,大幅降低幻觉率。

    import weaviate
    from weaviate.classes.query import Filter
    
    client = weaviate.connect_to_local()
    
    # 语义搜索 + 元数据过滤
    results = client.collections.get("Document").query.near_text(
        query="如何申请退款?",
        limit=5,
        filters=Filter.by_property("category").equal("help")
    )
    for obj in results.objects:
        print(obj.properties["content"])
    

    场景二:语义搜索 & 推荐引擎

    电商、内容平台可用 Weaviate 实现”理解意图”的搜索体验。用户输入自然语言查询,系统返回语义最匹配的商品或内容,而非简单的关键词匹配。

    Weaviate 也支持多模态搜索(文本 + 图像),用户可用图片搜索相似商品,或用文本描述搜索相关图片。

    📦 Python 快速上手

    import weaviate
    from weaviate.classes.config import Configure, DataType, Property
    
    # 连接本地 Weaviate 服务
    client = weaviate.connect_to_local()
    
    # 创建集合(类似关系数据库的表)
    client.collections.create(
        name="Article",
        properties=[Property(name="content", data_type=DataType.TEXT)],
        # 使用 Model2Vec 向量化器,导入时自动生成向量
        vector_config=Configure.Vectors.text2vec_model2vec(),
    )
    
    # 插入数据并自动生成向量
    articles = client.collections.get("Article")
    articles.data.insert_many([
        {"content": "Vector databases enable semantic search"},
        {"content": "Machine learning models generate embeddings"},
        {"content": "Weaviate supports hybrid search capabilities"},
    ])
    
    # 执行语义搜索
    results = articles.query.near_text(query="Search objects by meaning", limit=1)
    print(results.objects[0].properties["content"])
    
    client.close()
    

    📌 推荐理由

    Weaviate 是我推荐的向量数据库首选之一,尤其适合以下场景:

    • 与已发布的同类项目对比:Qdrant(Rust,极致性能)、Milvus(分布式,大规模)、Chroma(轻量,快速上手)—— Weaviate 则胜在生态最完整集成最丰富
    • AI Agent 生态集成:Weaviate 积极拥抱 AI Agent 生态,官方提供 Agent Skills,支持 Claude Code、Cursor 等 AI 编码工具直接操作
    • 多语言 SDK 覆盖最全:Python、JavaScript/TypeScript、Java、Go、C#/.NET 五大官方 SDK,社区还有 Rust、PHP、Ruby 等扩展
    • BSD-3-Clause 许可:商业友好,可自由修改和分发,适合企业内嵌使用

    如果你正在构建 RAG 系统、语义搜索功能,或任何需要”理解语义”的 AI 应用,Weaviate 值得作为向量数据库的第一选择进行评估。

    📥 下载地址 & 相关链接

    ✝️ 开源协议:BSD 3-Clause License | 开发语言:Go | 2016年发布,持续维护至今

  • AI芯片公司Cerebras财报后股价跌近20%,CEO说市场理解错了

    Cerebras股价走势
    Cerebras上市后股价走势低迷,周三单日跌近20% | 图片来源:AI生成

    Cerebras Systems这周的遭遇,算是给AI芯片行业的狂热泼了盆冷水。周二公司发布了上市以来第一份季度财报,营收数据其实不差,但星期三股价直接跌了将近20%,一度逼近IPO发行价。

    问题出在毛利率指引上。Cerebras给全年毛利率的指引是38%到41%,但刚过去的这个季度,毛利率是47%。换句话说,公司自己预计接下来的利润率会明显收窄。投资者一看这个数字,直接选择了用脚投票。

    CEO说市场理解错了

    Cerebras的CEO Andrew Feldman星期三上了CNBC,说投资者对毛利率指引的理解有偏差。他的解释是:公司要从一个现有大客户那里把已经交付的系统租回来,这样才能更快地把产能释放出来,同时公司自己的数据中心也在建。

    临时租回自己的设备这件事,会在今年拖累利润率。但Feldman的潜台词是:这是短期阵痛,为了抢时间窗口不得不做的取舍。

    这个解释能不能让市场买账,目前看存疑。股价星期三刷新了上市以来的最低点,已经快要跌回IPO价格。对一家刚上市没多久的AI芯片公司来说,这个开局相当难看。

    营收涨了94%,亏损在收窄

    把情绪放在一边,Cerebras这季度的账面数据其实有可圈可点之处。营收1.93亿美元,比去年同一个季度涨了94%。净亏损从去年同期的2390万美元收窄到1400万美元。

    但AI芯片这个赛道,光有营收增长是不够的。投资者给Cerebras的估值,押注的是它能在英伟达统治的AI训练芯片市场里撕开一道口子。如果利润率起不来,哪怕营收涨得再快,盈利预期也得往后推。


    这件事其实反映了一个更普遍的问题:AI基础设施的投资周期和盈利周期之间,存在明显的错配。Cerebras选择先扩张产能、暂时牺牲利润率,是一条走得通的路,但前提是市场愿意等。从星期三的股价反应来看,至少有一部分投资者不想等。

    对手那边,英伟达和AMD都在紧锣密鼓地推新一代推理芯片,Groq刚宣布了6.5亿美元的融资。Cerebras能不能在利润率回暖之前,先把市场份额稳住,接下来几个季度见分晓。

  • Facebook推出AI创作者伴侣应用,这次要和ChatGPT抢人了

    Facebook AI创作者伴侣应用
    Meta重新打造Creator Studio,推出独立AI伴侣应用 | 图片来源:Meta

    Meta这周悄悄做了一个挺有意思的举动——把原来的Facebook Creator Studio整个重新打造成了一款独立的AI伴侣应用,专门给内容创作者用。目前这款应用还在小范围测试,只向部分创作者开放。

    这件事背后有个很直接的动机。TikTok和YouTube这几年疯抢创作者,Meta显然不想让自家的创作者跑到别的平台去。更关键的是,很多创作者在 brainstorm 内容创意、分析数据的时候,现在都用ChatGPT之类的第三方工具。Meta这次等于把这件事揽回来,让你在Facebook的生态里就能搞定一切。

    内置AI助手,语气都能模仿你

    新版Creator Studio应用里内置了Meta上个月刚推出的AI创作者助手。这个助手不是泛泛地给建议,它会根据你的内容风格、历史表现、观众互动情况、还有你自己的目标,给出个性化的推荐。

    比如说,创作者不用再去盯着一堆图表和数据面板发愁,直接问AI”我应该什么时候发帖?”或者”我的评论区大家都在说什么?”就行。因为是对话式的,你还可以接着追问,比如”我的观众群体这几个月有什么变化”。

    AI还会帮你处理评论。它能从成百上千条评论里把最重要的那些挑出来,然后用你自己的语气风格帮你起草回复。当然,发之前你可以编辑,最终决定权还在你手里。

    每天打开这个应用,创作者会看到一个当日优先事项列表:最新帖子的表现如何、离设定的目标还有多远、哪些评论需要回复。这其实就是把原来分散在各个页面里的功能,用AI整合到一个对话式的界面里。

    Meta最近在疯狂推新应用

    这次的AI创作者应用只是Meta近期密集发布新应用的一个缩影。上个月刚推出了一个叫Forum的独立应用,功能类似Reddit,专门为Facebook群组服务。4月又测试了一款叫Instants的应用,可以让用户跟Instagram好友分享阅后即焚的照片。

    这还没完。《纽约时报》本周二报道说,Meta还在开发一款类似Polymarket的预测市场应用,内部代号叫”Arena”,只是还没正式推出。


    为什么要这么密集地推新应用?《华尔街日报》今年4月报道过,扎克伯格跟员工说,AI带来的效率提升,会让公司有史以来第一次能同时开发这么多款应用。翻译一下就是:以前需要几十个人做的功能,现在AI能帮着搞定一大半,所以可以同时铺开做好几个产品。

    这个逻辑其实挺值得玩味的。AI取代了一部分重复劳动之后,释放出来的生产力不是用来裁员,而是用来扩张产品线。对Meta来说,创作者工具、群组社交、预测市场这些方向同时押注,总有一个能跑出来。