博客

  • 现代奢华蓝金光影人像排版海报

    现代奢华蓝金光影人像排版海报

    现代奢华蓝金光影人像排版海报

    现代奢华蓝金光影人像排版海报


    🤖 Nano banana pro

    🇺🇸 English Prompt

    {
      "meta": {
        "title": "Heroic Dramatic Studio Portrait",
        "role": "World-class photographer specializing in editorial portraits",
        "aesthetic": "Dramatic, saturated studio lighting with a heroic feel"
      },
      "constraints": {
        "identity_anchor": {
          "source": "ATTACHED REFERENCE PHOTO",
          "strictness": "Critical",
          "instruction": "Perfectly preserve exact facial features, skin tone, hairstyle, and natural likeness without changes."
        },
        "clothing_anchor": {
          "source": "EXACTLY AS IN REFERENCE PHOTO",
          "strictness": "Critical",
          "instruction": "Style, color, material, and fit must fully correspond to the original without stylization."
        }
      },
      "subject_details": {
        "expression": "Serious, tense, focused",
        "gaze": "Directed away from camera, into space above",
        "universality": "Lighting and angle applicable regardless of gender"
      },
      "composition": {
        "background": "Saturated solid orange-red backdrop, smooth intense gradients, no patterns, 'hot' atmosphere",
        "camera_angle": "Low angle (shot from below upwards) to create dominance",
        "framing": "Medium close-up, emphasis on face and shoulders"
      },
      "lighting": {
        "palette": "Dominant bright oranges and deep red shades",
        "key_light": "Strong directional source, deep dramatic shadows (chiaroscuro), emphasizing facial structure",
        "backlight": "Powerful expressive rim light or color halo separating subject from background",
        "mood": "Mysterious, tense, high-contrast"
      },
      "technical_specs": {
        "style": "Photorealism, high detail",
        "focus": "Sharp focus on face vs smooth gradient background",
        "texture_quality": "Preserve natural pores and skin texture"
      },
      "combined_prompt_text": "World-class editorial portrait, dramatic studio lighting, heroic feel. [REFERENCE PHOTO IDENTITY PRESERVED]: Exact facial features, skin tone, hairstyle. [CLOTHING EXACT MATCH]: No changes to fit or material. Expression: serious, tense, focused, looking up and away. Background: Saturated solid orange-red, smooth intense gradients, hot atmosphere. Camera Angle: Low angle shot from below for dominance. Framing: Medium close-up. Lighting: Bright orange and deep red palette, strong directional chiaroscuro key light, powerful rim light separating subject from background. Technical: Photorealistic, high detail, sharp focus on face, natural skin texture and pores."
    }

    🇨🇳 中文提示词

    {
      "meta": {
        "title": "英雄式戏剧化影棚肖像",
        "role": "世界级摄影师,擅长杂志肖像摄影",
        "aesthetic": "戏剧化、色彩饱和的影棚灯光,营造英雄气概"
      },
      "constraints": {
        "identity_anchor": {
          "source": "附带参考照片",
          "strictness": "严格",
          "instruction": "完美保留精确的面部特征、肤色、发型和自然神态,不得有任何改动。"
        },
        "clothing_anchor": {
          "source": "与参考照片完全一致",
          "strictness": "严格",
          "instruction": "款式、颜色、材质和合身度必须与原图完全一致,不得进行风格化处理。"
        }
      },
      "subject_details": {
        "expression": "严肃、紧张、专注",
        "gaze": "视线离开镜头,望向前方上方空间",
        "universality": "灯光和角度适用于任何性别"
      },
      "composition": {
        "background": "饱和的纯色 {argument name=\"Background Color\" default=\"orange-red\"} 背景,平滑强烈的渐变,无图案,营造“炽热”氛围",
        "camera_angle": "低角度(从下往上拍摄),以营造主导感",
        "framing": "中景特写,强调面部和肩部"
      },
      "lighting": {
        "palette": "主导色为明亮的橙色和深红色调",
        "key_light": "强烈的定向光源,深邃的戏剧性阴影(明暗对比法),强调面部结构",
        "backlight": "强烈的表现性轮廓光或彩色光晕,将主体与背景分离",
        "mood": "神秘、紧张、高对比度"
      },
      "technical_specs": {
        "style": "写实主义,高细节",
        "focus": "面部锐利对焦,背景平滑渐变",
        "texture_quality": "保留自然的毛孔和皮肤纹理"
      },
      "combined_prompt_text": "世界级杂志肖像,戏剧化影棚灯光,英雄气概。[保留参考照片身份]:精确的面部特征、肤色、发型。[服装完全匹配]:合身度或材质无任何改动。表情:严肃、紧张、专注,向上方望去。背景:饱和的纯橙红色,平滑强烈的渐变,炽热氛围。拍摄角度:低角度拍摄,营造主导感。构图:中景特写。灯光:明亮的橙色和深红色调,强烈的定向明暗对比主光,强烈的轮廓光将主体与背景分离。技术:写实主义,高细节,面部锐利对焦,自然的皮肤纹理和毛孔。"
    }
  • 迷人绿眸与高级灰的现代极简时尚人像

    迷人绿眸与高级灰的现代极简时尚人像

    迷人绿眸与高级灰的现代极简时尚人像

    迷人绿眸与高级灰的现代极简时尚人像


    🤖 Nano banana pro

    🇺🇸 English Prompt

    {
      "main_prompt": "Cinematic indoor portrait of a stunning young woman with long voluminous dark brunette hair cascading over her shoulders, striking piercing green eyes with a captivating and intense gaze directly at the camera, natural skin texture with a soft matte finish, wearing a sophisticated grey structured high-neck sleeveless wrap-style garment, a modern sculptural fashion bodice with a cross-over neck design, minimal and clean aesthetic, soft natural daylight coming from the side creating gentle shadows, neutral-toned interior background, 85mm portrait lens, photorealistic, hyper-detailed iris detail and fabric weave --ar 3:4 --stylize 300 --v 6 --q 2",
      "negative_prompt": "blurry, deformed, bad anatomy, ugly, overexposed, harsh shadows, heavy makeup, smiling, bright daylight, synthetic look, cartoon, drawing, messy room, low quality, vibrant colors, plastic skin",
      "style_tags": [
        "modern minimalist fashion",
        "high-end editorial",
        "piercing gaze",
        "sculptural clothing",
        "neutral palette"
      ],
      "technical": {
        "aspect_ratio": "3:4",
        "lighting": "soft natural side lighting",
        "camera": "85mm f/1.8 professional lens"
      },
      "extra_parameters": {
        "recommended_model": "Flux.1 [dev]",
        "guidance_scale": "7.0",
        "steps": "40",
        "image_reference": "use uploaded reference for the specific green eye color, the long brunette hair volume, the unique grey wrap-neck garment design, and the intense facial expression"
      }
    }

    🇨🇳 中文提示词

    {
      "main_prompt": "电影般的室内肖像,一位惊艳的年轻女性,一头浓密蓬松的深棕色长发垂泻于双肩,一双摄人心魄的碧绿色眼睛,目光专注而强烈地凝视着镜头,自然的皮肤纹理,柔和的哑光质感,身着一件精致的灰色结构感高领无袖裹身式服装,现代雕塑感时尚紧身胸衣,采用交叉领设计,极简而干净的美学,柔和的自然日光从侧面射入,营造出轻柔的阴影,中性色调的室内背景,85mm 人像镜头,超写实,虹膜细节和织物质感超高细节 --ar 3:4 --stylize 300 --v 6 --q 2",
      "negative_prompt": "模糊,变形,糟糕的解剖结构,丑陋,过曝,刺眼的阴影,浓妆,微笑,明亮的日光,合成感,卡通,绘画,凌乱的房间,低质量,鲜艳的色彩,塑料皮肤",
      "style_tags": [
        "现代极简时尚",
        "高端时尚大片",
        "锐利凝视",
        "雕塑感服装",
        "中性色调"
      ],
      "technical": {
        "aspect_ratio": "3:4",
        "lighting": "柔和自然侧光",
        "camera": "85mm f/1.8 专业镜头"
      },
      "extra_parameters": {
        "recommended_model": "Flux.1 [dev]",
        "guidance_scale": "7.0",
        "steps": "40",
        "image_reference": "使用上传的参考图,以获取特定的绿色眼睛颜色、浓密的棕色头发、独特的灰色裹颈服装设计以及强烈的面部表情"
      }
    }
  • 极简韩系时尚模特影棚写真

    极简韩系时尚模特影棚写真

    极简韩系时尚模特影棚写真

    极简韩系时尚模特影棚写真


    🤖 ChatGPT

    🇺🇸 English Prompt

    Ultra-realistic studio fashion portrait of a beautiful Korean woman posing against a clean light-gray studio wall, turning slightly toward the camera with a soft confident expression and relaxed elegant posture. One hand gently resting in her hair while leaning subtly against the wall. Wearing a fitted long black ribbed off-shoulder top that fully covers the waist and hips with dark washed jeans, creating a sleek minimal modern fashion aesthetic. Long silky black hair flowing naturally, glossy eyes, soft natural Korean makeup, smooth realistic skin texture, youthful Korean beauty aesthetic.
    
    Professional studio environment with visible softbox lighting equipment slightly blurred in the background, seamless white studio flooring, minimal neutral-toned backdrop, soft cinematic lighting with realistic shadows and highlights. Editorial fashion photography vibe with subtle moody contrast and clean composition.
    
    Minimalist Korean fashion aesthetic, calm elegant atmosphere, candid model pose, shallow depth of field, highly detailed, photorealistic studio portrait, luxury lifestyle magazine feel, soft glow, realistic DSLR photography, modern studio styling.

    🇨🇳 中文提示词

    超写实影棚时尚人像,一位美丽的韩国女性在干净的浅灰色影棚墙壁前摆拍,微微转身面向镜头,表情柔和自信,姿态优雅放松。一只手轻轻搭在头发上,身体微妙地靠在墙上。穿着一件修身的黑色长款螺纹露肩上衣,完全覆盖腰部和臀部,搭配深色水洗牛仔裤,营造出洗练极简的现代时尚美学。黑色长发自然垂落,眼睛明亮有神,清透自然的韩系妆容,真实的皮肤纹理,充满活力的韩系美感。
    
    专业影棚环境,背景中可见略微模糊的柔光箱照明设备,无缝白色影棚地面,极简中性色背景,带有真实光影效果的柔和电影感光效。具有细腻的情绪对比和干净构图的时尚杂志大片风格。
    
    极简韩系时尚美学,宁静优雅的氛围,自然的模特姿势,浅景深,高细节,写实影棚人像,奢侈生活方式杂志质感,柔光,真实单反摄影,现代影棚造型。
  • 复古Y2K风格木质酒吧人像

    复古Y2K风格木质酒吧人像

    复古Y2K风格木质酒吧人像

    复古Y2K风格木质酒吧人像


    🤖 ChatGPT

    🇺🇸 English Prompt

    A realistic portrait of a young woman sitting in a wooden bar at night. (Maintain the face and features exactly as the original 100%, do not edit.) The young woman has the original hairstyle with a few strands of hair covering her face slightly, remove the flower on her ear. Her hair is flowing in the wind, looking chic, cool, and a bit sexy with layers. She is  looking into camera. Her expression is cute, dreamy, innocent, and playful. Makeup is natural-toned, with a rosy blush on her cheeks and nose, and plump, pinkish-orange lips that look slightly muted due to the strong flash light. She is wearing a thin, flowing, black camisole with a deep square-neck and a tie at the chest. She is wearing low-rise denim pants, sitting and leaning on a bamboo table in a warm, orange-lit atmosphere. The background is wood with some partial reflections in the glass, showing small lights and decorations. The photo tone should be like a 2000s digital camera (Canon IXUS aesthetic). There is direct flash hitting her face and skin, making her skin look smooth, white, and slightly yellowish. There are subtle shadows around her, and clear light reflections on her cheeks. It should evoke a retro, lonely, soft, and vintage "Y2K nightlife portrait" feeling.

    🇨🇳 中文提示词

    一张在夜晚木质酒吧里年轻女性的写实人像照片。(保持面部特征与原图完全一致,100%不要修改)。这位年轻女性保留原有的发型,几缕发丝轻微遮住脸部,去掉耳朵上的花。她的头发随风飘动,看起来时髦、酷且带有一点性感的层次感。她直视镜头。表情可爱、梦幻、纯真且俏皮。妆容自然,脸颊和鼻尖有红润的腮红,嘴唇丰满且呈粉橘色,由于强烈的闪光灯显得略显暗淡。她穿着一件轻薄飘逸的黑色吊带衫,深方领并在胸前有系带。她穿着低腰牛仔裤,坐在并靠在竹桌上,背景是温馨的橙色光氛围。背景是木质的,玻璃上有部分反射,显示出微小的灯光和装饰。照片色调应像2000年代的数码相机(佳能 IXUS 美学)。直射闪光灯打在她的脸上和皮肤上,使皮肤看起来光滑、白皙且略微发黄。她周围有细微的阴影,脸颊上有清晰的反光。整体应营造出一种复古、孤独、柔和且具有怀旧感的“Y2K夜生活人像”氛围。
  • 韩国型男多变风格时尚海报

    韩国型男多变风格时尚海报

    韩国型男多变风格时尚海报

    韩国型男多变风格时尚海报


    🤖 ChatGPT

    🇺🇸 English Prompt

    Use reference image. Ultra-realistic 1:1 celebrity-style collage poster featuring the same young stylish Korean man repeated in 8 different square panels arranged in a clean grid layout. Each panel shows the identical person with consistent facial identity, same bone structure, same eyes, same hairstyle base, same skin tone, same age. Different fashion looks, hairstyles, expressions, poses, and colorful outfits in every panel. Bright orange, red, pink, yellow, and blue gradient backgrounds. Premium entertainment-show poster aesthetic. Cinematic studio lighting, sharp focus, glossy skin texture, vibrant fashion styling, expressive emotions, magazine-quality photography. Center panel contains only a realistic vintage microphone on stand. No text, no logo, no typography, no watermark. Highly cohesive composition, balanced spacing, luxury Korean TV show promotional design, ultra detailed, photorealistic, editorial fashion photography.
    same person in every panel, identical face identity consistency, multi-outfit character sheet, unified facial features, consistent character seed

    🇨🇳 中文提示词

    使用参考图。超写实的 1:1 明星风格拼贴海报,在干净的网格布局中,8 个不同的正方形板块展示同一个时尚的韩国年轻男子。每个板块中的人物身份一致,具有相同的骨骼结构、眼睛、发型基调、肤色和年龄。每个板块展示不同的时尚造型、发型、表情、姿势和彩色服装。明亮的橙色、红色、粉色、黄色和蓝色渐变背景。高端娱乐节目海报美学。电影级演播室灯光,锐利焦点,亮丽皮肤质感,鲜艳的时尚造型,富有表现力的情绪,杂志级摄影质量。中心板块仅包含一个写实的复古立式麦克风。无文字,无标志,无排版,无水印。高度统一的构图,均衡的间距,奢华韩国电视节目宣传设计,极高细节,写实主义,社论时尚摄影。同一板块人物一致,面部特征身份一致,多套服装角色表,统一的面部特征,一致的角色种子。
  • 极简奢华超现实创意产品广告

    极简奢华超现实创意产品广告

    极简奢华超现实创意产品广告

    极简奢华超现实创意产品广告


    🤖 ChatGPT

    🇺🇸 English Prompt

    Erstelle eine realistische und zugleich surreale, kreative Werbeanzeige für [PRODUCT NAME] im Bereich [PRODUCT CATEGORY]. Das Produkt muss der Held des Bildes sein, zentral im Frame platziert und auf eine intelligente Weise visuell „geformt“, die automatisch den Geist und die Identität der Marke widerspiegelt. Verwende einen klaren, stimmigen Hintergrund, der zur Farbpalette der Marke passt, mit weichem, cineastischem Licht, ultrarealistischen Premium-Materialien, präzisen Schatten und einer hochwertigen Editorial-Komposition. Füge einen innovativen surrealen Akzent hinzu, der direkt mit der Natur des Produkts verbunden ist – kreativ, aber nicht übertrieben. Integriere das echte offizielle Produktlogo elegant und nahtlos in die Komposition und generiere automatisch einen kurzen, kraftvollen englischen 3-Wörter-Slogan, der zum Produkttyp und zum Markenton passt. Ultrahohe Qualität, perfekt ausgewogenes Framing, starker Realismus, luxuriöser Stil – kein zusätzlicher Text außer dem Logo und dem englischen 3-Wörter-Slogan.

    🇨🇳 中文提示词

    为[产品类别]领域的[产品名称]创作一个既写实又超现实的创意广告。产品必须是画面的主角,置于构图中心,并以一种能自动反映品牌精神和身份的智能化视觉方式进行“塑形”。使用清晰且协调的背景,与品牌色调相匹配,配备柔和的电影级光影、超真实的优质材质感、精准的阴影以及高端的社论式构图。加入一个与产品本质直接相关的创新超现实元素——富有创意但不夸张。将真实的官方产品标志优雅且无缝地融入构图中,并根据产品类型和品牌基调自动生成一个简短有力的3个单词组成的英文标语。超高质量、完美平衡的构图、极强的写实感、奢华风格——除了标志和3个单词的英文标语外,不得有其他文字。
  • 谷歌搜索亲手埋掉了十个蓝色链接,25年的老界面彻底变了

    “十个蓝色链接”——这个词在互联网上活了25年,从谷歌1990年代把搜索框推向大众开始,就是这个样子。输入关键词,吐出来一排蓝色超链接,点进去自己找答案。这套逻辑所有人习以为常,直到2026年5月19日谷歌I/O大会,它宣布:这个时代结束了。

    新搜索框是这次改造的核心。谷歌说这是搜索框自诞生以来最大的一次改动。它不再只是一个输入框了——能自动扩展长度来容纳长对话式查询,内置AI驱动的查询建议(不是简单的自动补全,而是理解你的意图来帮你构建更复杂的问题),而且你不需要在搜索前选择”要用AI模式还是普通模式”,系统自己判断。

    Google慕尼黑总部外墙
    谷歌慕尼黑总部(图片来源:TechCrunch)

    信息代理:谷歌提醒的进化版

    2003年谷歌推出过”谷歌提醒”(Google Alerts),关键词有新结果就发邮件通知你。那个服务现在还在,但早就不是人们获取信息的主要方式了。

    这次的新东西叫”信息代理”(information agents),背后的逻辑是一样的——追踪变化、推送通知——但能力强了太多。你可以让一个代理7×24小时在后台跑,用你自定义的参数监控某个行业的股市动向,它不只是发现变化,还能理解变化的意义,汇总之后通知你,附带来源链接和进一步查看的信息。

    谷歌搜索负责人Liz Reid在发布会上举了个例子:你可以设置提醒,用非常具体的参数追踪某个特定行业的股票市场动向,代理会为你制定监控计划,包括它需要访问的工具和数据——比如我们的实时金融数据。然后它会持续追踪这些变化,在条件满足时通知你。

    生成式UI:搜索结果变成交互式网页

    另一个有意思的更新是”生成式UI”——根据用户的问题,即时生成动态布局的交互式视觉内容。比如你问关于黑洞的问题,搜索结果不是一段文字,而是一个可以把概念具象化的交互式可视化组件,你接着问,它实时生成全新的视觉内容。

    这套系统由谷歌DeepMind团队用Gemini Flash 3.5模型开发,今年夏天会免费向所有谷歌用户推出。除此之外,用户还能用自然语言指令在搜索里直接搭建自己的小应用(比如根据日历信息做膳食规划、健身追踪等),这背后是谷歌的Antigravity代理开发平台在支撑。


    出版商要紧张了

    这套改动有一个绕不开的副作用:出版商从谷歌搜索拿到的引流会继续大幅下降。AI概览(AI Overviews)已经让很多媒体网站的referral流量掉了不少,现在搜索结果里直接出交互式内容,用户更没有理由点链接出去了。对一些依赖广告的媒体来说,这可能会是最后一根稻草。

    谷歌这边倒是不担心,AI概览的月活已经突破25亿,去年推出的对话式搜索模式月活也过了10亿。用户用脚投票,答案直接在搜索页上给到,何必再跳一次。

    搜索这件事的本质正在发生变化——从”帮你找信息”变成”帮你把信息消化好直接给你”。这个过程里,用户省了事,但整个内容生态的流量分配逻辑也被重新洗牌了。出版商适应得过来吗?今年夏天见分晓。

  • OpenAI上线图片溯源功能,AI生成图终于有身份证了

    前几天刷到一张真假难辨的图,第一反应是去翻评论区看有没有人说是AI做的。这种事现在越来越常见,AI生成的图像质量越来越高,肉眼基本看不出破绽,结果就是谣言、诈骗、假新闻配图越来越难甄别。

    5月19日,OpenAI终于动了,宣布了两件事:一是接入C2PA开放标准,在图片元数据包里写清楚”这张图是AI生成的”;二是和谷歌合作,给图片嵌入SynthID不可见水印,截图、裁剪、加滤镜都抹不掉。

    Google SynthID开发者大会展示图
    谷歌SynthID水印演示现场(图片来源:TechCrunch)

    两套系统,互补短板

    C2PA的好处是信息量大,谁生成的、用什么模型生成的,都能写进去。问题是元数据太容易被篡改,有人故意删掉就白搭。SynthID正好反过来,水印嵌在像素层,抗干扰能力强,但能携带的信息有限。

    OpenAI的说法是:水印在截图之类的转置操作里更耐用,元数据能比单独的水印提供更多信息,两个一起上,可靠性比单用任何一层都高得多。

    一个公开验证工具正在预览

    光有水印不够,得让用户能用才行。OpenAI在做的验证工具,上传一张图就能检测有没有C2PA标识或SynthID水印,初期只支持自家的DALL·E等模型生成的图像,但OpenAI说希望未来能扩展到其他公司的AI工具。

    这件事的意义不只是”OpenAI给自己打标记”。作为头部玩家,OpenAI同时支持C2PA和SynthID,等于在推整个行业往统一溯源标准上走。不然每家各自为战,用户要装一堆检测工具,最后还是一地鸡毛。


    目前只管自家图片

    有个现实的限制:这两套保护措施只覆盖OpenAI自己生成的图片。网上那些用Stable Diffusion、Midjourney或者其他野路子公司工具生成的图,暂时还不归它管。所以这套方案目前最大的作用是确保OpenAI”不当帮凶”,而不是一口气解决整个AI假图问题。

    不过方向是对的。溯源这件事,不做就永远没有,做了至少有个起点。等覆盖的模型多了、用户习惯用验证工具了,AI生成内容的透明度才能真正提上来。

  • Google把20年街景数据喂给了Genie,AI现在能模拟你家门口的街道了

    你有没有在Google Maps的街景里「逛」过别人的 neighborhood?把那个小黄人往巴黎某条街上一扔,看看酒店是不是在安全的地段。Google现在想把这件事变得不止是「看看」,而是让你真正走进去、改天气、看暴风雪里的同一条街是什么样子。

    5月19日的Google I/O大会上,DeepMind宣布把Street View的数据接入Project Genie——Google的通用世界模型。简单来说,Genie可以根据文字或图片提示,生成可交互的游戏式三维环境。现在加上街景,它生成的就是真实世界的地方。

    Google Genie Street View 模拟展示
    Genie接入街景数据后,可生成纽约街景的交互式模拟(图源:TechCrunch)

    为什么这件事有意思

    DeepMind研究员Jack Parker-Holder举了一个很具体的例子:一个即将部署到伦敦的机器人,那边常年见不到什么太阳。用Genie,他们可以模拟阳光从维多利亚式房屋上反射下来的罕见场景,这样机器人真的遇到时就不会「懵掉」。

    「你可以说,我要去纽约,但不是这个季节,是下雪的时候。我想看看那条街在下雪时是什么样子。」

    街景数据积累,Google干了20年。背着摄像头的小车和塞了相机的背包,在全球110个国家和七大洲拍了超过2800亿张图片。这些数据的价值,过去主要体现在地图产品和广告上,现在DeepMind找到了新用法。


    不只是玩游戏

    Genie 3去年8月开放了研究预览,今年1月向美国的Google AI Ultra订阅用户开放。它的目标应用场景有三个:教育、游戏、机器人训练。接上街景之后,机器人训练这个场景立刻变得很实。

    Waymo已经在用Genie的模拟器来训练无人驾驶汽车应对「极罕见事件」——比如龙卷风,或者一头大象突然出现在路上。以前这种场景只能靠人工合成,现在有了街景作为基底,模拟出来的环境至少地理位置是真实的。

    和Waymo自己的模拟器相比,Genie的优势在于视角。Waymo的模拟都是从车载摄像头角度看的,而街景数据可以切换到任意视角——机器人视角、行人视角、甚至无人机视角。

    • 2800亿张街景图片覆盖全球110个国家
    • Waymo已用Genie模拟龙卷风、大象等极端场景
    • 支持任意视角切换(车载/行人/机器人/无人机)
    • 教育、游戏、机器人训练三大目标场景

    还差在哪里

    坦率说,现在的效果还没到「以假乱真」的程度。Google团队给我看的样片,包括我以前住过的一个街区的海底版本,识别度很高,但画质还是电子游戏水准,不是照片级真实。

    更大的问题是物理规律。现在的Genie模型还没有真正理解因果关系——比如在一个约书亚树国家公园的雪地场景模拟里,跑过去的人直接穿过了仙人掌和灌木丛。物理规则不是硬编码进去的,模型是通过被动观察自己「悟」出来的,这个过程还需要时间。

    「这类模型在准确度和质量上,可能比视频生成落后6到12个月。但我认为这是可以解决的。」——Jack Parker-Holder

    对比一下,Google自己的图像生成器Nano Banana已经能在信息图里生成完美的文字,视频生成器Veo也理解了纸船会跟着水流漂、烟会在空气中散开这些物理常识。Genie要追上这个水平,还得再跑一阵。

    目前,Street View in Genie已经向部分美国Ultra用户开放,接下来几周会逐步扩展到全球Ultra用户。DeepMind的产品经理Diego Rivas提醒说,这还是一个实验性的东西,准确度方面还有很多要改进的地方。

    但方向是清晰的。Google Maps的前总监Jonathan Herbert说,他们很早就在想怎么把地图数据用在新形式的AI研究上。Genie接入街景,是这个世界模型第一次真正摸到「真实世界的地基」。接下来会发生什么,值得盯着看。

  • Andrej Karpathy官宣加入Anthropic,OpenAI联合创始人为何选择竞对

    5月19日,AI圈被一条推文炸开了锅——Andrej Karpathy在X上官宣了自己加入Anthropic的消息。这位OpenAI的联合创始人、特斯拉前AI负责人,选择在这时候加入Claude的缔造者,让不少人感到意外。

    「我认为LLM前沿领域接下来的几年会特别关键。我很兴奋能加入这里的团队,重新回到研发一线。」——Andrej Karpathy

    他到底是谁

    karpathy在AI圈子里的分量,不需要太多介绍。他是OpenAI的创始成员之一,早年深耕深度学习和计算机视觉,2017年被马斯克挖去特斯拉,一手搭建了FSD(全自动驾驶)和Autopilot的核心团队。2022年离开特斯拉后,他短暂回归OpenAI一年,2024年又出来创立了Eureka Labs,想用AI助手做教育。

    他还有一门非常出名的在线课程《Neural Networks: Zero to Hero》,教学生从零开始用代码实现神经网络,在YouTube上有一大批忠实观众。可以说,他是少数几个既能搞懂大模型理论、又能真正把大规模训练跑起来的人。

    Andrej Karpathy
    Andrej Karpathy(图源:San Francisco Chronicle / Getty Images)

    在Anthropic做什么

    Karpathy本周正式入职Anthropic,在Nick Joseph的带领下专注于预训练(pre-training)方向。预训练是构建前沿模型最烧钱、最吃算力的阶段,直接决定了Claude的核心知识和能力上限。

    Anthropic方面还透露,Karpathy会着手组建一个专门的团队,研究方向是用Claude来加速预训练研究本身。这个思路很清晰——用AI来研究AI,用更强的模型来帮自己训练下一代模型,形成研发飞轮。


    为什么是现在

    Anthropic在这个时间点挖来Karpathy,信号很明确:他们相信AI辅助的研发,而不仅仅是堆算力,才是接下来和OpenAI、Google竞争的关键。能同时懂LLM理论和大尺度训练实践的研究者,圈子里掰着手指头数得过来,Karpathy是一个。

    至于他创立的Eureka Labs,目前还没有进一步的消息。Karpathy在自己的帖子里也提到,他对教育的热情不会消失,未来会找时间继续这件事。

    • OpenAI联合创始人身份,深度参与GPT早期研发
    • 特斯拉FSD团队缔造者,大规模AI落地经验
    • 顶级AI教育者,Zero to Hero课程影响数十万开发者
    • 唯一同时深度参与过OpenAI和特斯拉AI全栈的领军人物

    同一天,Anthropic还宣布了另一位重磅人才的加入:网络安全老将Chris Rohlf加入了前沿红队(frontier red team)。Rohlf在Yahoo的”The Paranoids”安全团队成名,后来在Meta待了六年,职业生涯跨度超过20年。他在X上写道:「我们有一个真正的机会,用AI大幅改善网络安全」,并认为此刻加入Anthropic是正确的选择。

    两则人事消息同一天公布,怎么看都像是Anthropic在Google I/O期间的一次精准人才公关。不管是巧合还是刻意为之,Anthropic正在用行动告诉外界:他们不仅在模型能力上追,在人才吸引上也一点不虚。