标签: AI视频

  • MoneyPrinterTurbo:66.6K Stars!AI短视频一键生成,让内容创作不再靠体力

    MoneyPrinterTurbo:66.6K Stars!AI短视频一键生成,让内容创作不再靠体力


    MoneyPrinterTurbo Web界面

    MoneyPrinterTurbo Web 操作界面

    📌 项目简介

    MoneyPrinterTurbo 是一个基于AI大模型的短视频一键生成工具。只需提供一个视频主题关键词,就可以全自动完成:文案生成 → 视频素材匹配 → 字幕生成 → 背景音乐搭配 → 高清短视频合成,全流程无需人工干预。

    66.6K+
    GitHub Stars

    多模型
    AI 接入支持

    双端
    Web + API

    MIT
    开源协议

    ⚙️ 安装要求和过程

    环境要求

    • Python 版本:推荐 Python 3.11
    • 依赖管理:优先使用 uv 工具
    • 必要依赖:ImageMagick(图片处理)、ffmpeg(视频处理)
    • 最低配置:4核CPU、4GB内存
    • 推荐配置:6-8核CPU、8GB内存、4GB显存GPU

    快速安装步骤

    # 1. 克隆项目
    git clone https://github.com/harry0703/MoneyPrinterTurbo.git
    cd MoneyPrinterTurbo
    
    # 2. 配置 API Key(复制配置模板)
    cp config.example.toml config.toml
    # 编辑 config.toml,填入 pexels_api_keys 和 LLM API Key
    
    # 3. 安装依赖(推荐使用 uv)
    uv python install 3.11
    uv sync --frozen
    
    # 4. 启动 Web 界面
    uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=False

    💡 国内用户推荐:LLM 接入优先选择 DeepSeekMoonshot(Kimi),无需VPN,注册即送额度,调用稳定。

    ✨ 核心功能

    ① 全流程自动化生成

    只需输入主题/关键词,自动完成文案生成、高清无版权素材匹配、字幕生成、背景音乐搭配,最终合成高清短视频,全程无需人工干预。

    ② 多场景尺寸适配

    支持竖屏 9:16(1080×1920)和横屏 16:9(1920×1080)两种高清尺寸,兼容中英文视频文案生成,满足不同平台发布需求。

    ③ 灵活自定义能力

    支持 AI 自动生成文案或自定义文案,可调整字幕字体/位置/颜色/大小/描边,支持自定义背景音乐和本地素材,批量生成多个视频。

    ④ 多模型兼容

    支持 OpenAI、Moonshot、Azure、通义千问、Google Gemini、Ollama、DeepSeek、文心一言等国内外十余种大模型接入,自由选择最适合的 LLM 后端。

    ⑤ 多端使用支持

    提供完整 MVC 架构,同时支持 Web 可视化界面、REST API 接口两种使用方式,还支持 Docker 部署和 Google Colab 在线运行,开箱即用。

    🎬 典型使用场景

    场景一:自媒体短视频批量生产

    自媒体运营者需要每天稳定输出高质量短视频内容,但文案创作、素材搜集、剪辑合成耗时费力。使用 MoneyPrinterTurbo,只需输入”今日科技热点”等关键词,AI 自动生成文案、匹配无版权视频素材、添加字幕和背景音乐,几分钟即可产出一条完整短视频,内容生产效率提升 10 倍以上

    场景二:企业营销视频快速制作

    电商运营或市场人员需要为产品制作营销短视频,但缺乏专业剪辑能力。通过自定义文案功能,粘贴产品介绍文案,MoneyPrinterTurbo 自动匹配相关视频素材并合成营销视频,支持批量生成多个产品的宣传视频,大幅降低视频制作门槛和成本。

    场景三:知识分享内容创作

    知识博主需要将长篇文章或知识点转化为短视频内容。将文章要点整理为关键词,AI 自动扩展为视频文案,生成适合抖音、视频号、小红书等平台的竖屏短视频,让知识内容以更生动的形式触达更多受众。

    💡 推荐理由

    MoneyPrinterTurbo 是我见过的最完整的 AI 短视频生成开源方案。它不只是简单地拼接 AI 能力,而是真正从创作者的实际痛点出发,把视频制作的全流程——创意、文案、素材、配音、字幕、剪辑——全部打通。

    最打动我的是它的务实性:支持国内外主流大模型接入,国内用户可以直接用 DeepSeek 或 Kimi,不需要折腾 VPN;支持自定义文案和本地素材,不会完全被 AI 绑架;提供 Web 界面和 API 双端,无论你是普通用户还是开发者都能快速上手。

    当然,AI 生成的视频质量还无法和专业人工剪辑相提并论,素材匹配的准确性也有提升空间。但作为内容创作的效率工具,它已经足够惊艳。对于需要批量生产短视频内容的自媒体运营者来说,这是一个值得深入研究的开源项目。

    🖼️ 界面预览

    Web界面

    Web 可视化操作界面

    📥 下载地址

    🌐 官方网站:https://github.com/harry0703/MoneyPrinterTurbo

    🐙 GitHub 仓库:https://github.com/harry0703/MoneyPrinterTurbo

    📦 一键启动包:Windows 用户可直接下载项目 Release 中的一键启动包,解压即跑

    🐳 Docker 部署:docker-compose up 一键启动

    ☁️ 在线体验:支持 Google Colab 在线运行,无需本地配置环境


    📌 开源自尊:本项目采用 MIT 开源协议,可自由用于个人和商业场景,仅需保留版权声明。如果你也在探索 AI + 内容创作的方向,强烈建议深入研究这个项目,一定会有所收获。

  • YouTube开始自动标注AI视频,不申报就替你标

    AI生成的视频越来越逼真,YouTube决定不再只靠创作者自觉标注了。这家谷歌旗下的视频平台本周宣布,将用内部系统自动检测并标注使用了「重要拟真AI」的视频内容。

    从自愿标注到主动执法

    这套标注机制其实已经上线两年多了。早在2024年3月,YouTube就更新了AI政策,要求创作者在Creator Studio里主动披露那些可能被误认为真实人物、地点或事件的AI内容。只不过之前完全靠自觉——如果你不标,平台也不会拿你怎么样。

    现在不一样了。YouTube明确表示,5月起将使用新的内部信号来识别AI生成内容并自动打标。当然,平台仍然鼓励创作者自觉申报,但如果你忘了标,YouTube会替你标上。

    YouTube AI标注界面截图
    YouTube 新的 AI 内容标注样式(来源:TechCrunch)

    有意思的是,如果视频是用YouTube自己的AI工具(比如Veo或Dream Screen)生成的,创作者连删除标签的权限都没有——标签会永久附着在视频上。

    AI生成内容如果包含C2PA元数据(表明其为完全AI生成),标签同样会被自动附加且无法移除。最近OpenAI也承诺采纳C2PA标准,跟Nvidia、Kakao、ElevenLabs站到了一起。

    标签展示位置大调整

    以前AI标签藏得挺深——除非视频涉及健康或新闻等敏感话题,否则标签只出现在展开的视频描述里。大多数观众根本不会注意到。

    现在YouTube把标签挪到了更显眼的位置:长视频的标签直接展示在视频播放器下方、描述区上方;Shorts的标签则直接叠在视频画面上。平台的说法是,这样观众在刷到拟真AI内容时能第一时间意识到「这不是真的」。

    至于那些只是轻微修改、动画化或明显不真实的AI视频(比如那个经典的「独角兽在奇幻世界奔跑」示例),标签仍然只出现在展开的描述里,不会在画面上干扰观看。


    deepfake检测同步扩张

    自动标注功能上线前不久,YouTube刚刚扩展了其AI深伪检测能力。最初只对名人、公众人物、政客和其他创作者开放人脸匹配扫描,现在任何成年用户都可以主动扫描平台上是否有冒用自己的AI生成视频。

    YouTube特别强调,AI标签不会影响视频的推荐权重,也不会影响变现能力。这一点对于创作者来说应该是个定心丸——标注AI内容不再意味着被限流。

    这套自动标注系统上线的时间点很微妙。上周谷歌在I/O开发者大会上刚刚发布了Gemini Omni,这个多模态AI模型家族能输出高质量视频,并且展现出对物理、文化、历史和科学的真实理解。换句话说,AI生成视频的「以假乱真」程度又上了一个台阶,YouTube不得不提前筑坝。

  • 我用Google的新AI模型Omni把自己P进了埃菲尔铁塔前,效果好到让我不安

    去年我用AI把孩子的毛绒玩具”深度伪造”成了一只去度假的小鹿,当时只是想验证一下Google在Gemini广告里承诺的功能到底靠不靠谱。视频没给孩子看,但那个实验让我开始认真思考:生成式AI的”无害娱乐”和”纯垃圾内容”之间,到底有没有界限?

    也许这两个圆圈完全重叠呢。也许不是。但有一件事我很确定:做出逼真的AI视频,需要的努力和知识少得令人惊讶。而这个趋势,在Gemini进入Omni时代之后,还在继续。

    Omni到底是什么

    Omni是Google新推出的一套生成式模型家族,号称有一天能把任何类型的输入——照片、视频、文字——变成任何其它东西。不过目前阶段,它还只是个视频生成工具。

    Omni Flash是这套模型里第一个正式发布的版本,现在已经可以在Google的AI视频生成和编辑平台Flow上用。如果你愿意,当然也可以继续用旧的Veo模型——但Omni在几个维度上确实比Veo进了一步。

    Google声称Omni在生成视频时会融入更多”现实世界知识”,因此能更好地保持角色在整个视频中的一致性。

    于是我把那只AI小鹿又请了出来,让它收拾行李再去冒险——看看Omni是不是真的如Google说的那样。

    结果:好得让人困惑

    怎么说呢,结果非常两极分化,甚至可以用”令人困惑”来形容。有些片段做得很好——比我五个月前测试Veo的时候一致性和还原度都高得多。但即使是最好的片段,也还是会有一些典型的”AI惊吓时刻”:比如小鹿在跳伞的时候突然换了朝向。

    我给了Omni更多创作空间:”做一个蒙太奇,展示小鹿打包行李、登上邮轮去热带度假的过程。氛围要可爱、好玩。小鹿在行李箱里塞了件搞笑的东西,后面会在片段里派上用场。”

    结果小鹿塞了一罐蜂蜜进去;后面确实有段情节是小鹿去够那罐蜂蜜,把它当成防晒霜在挤。说实话,这个桥段还不错。问题在于那瓶蜂蜜的外观在整个视频里一直在变:从玻璃罐,变成透明的挤压瓶,又变回装蜂蜜的挤压瓶。而我甚至不知道该怎么描述模型对视频最后一帧的处理——就好像它把刚才生成的所有元素一股脑吐出来就完事了。

    AI generated content label example
    Google Omni生成的AI内容会有标注 / The Verge

    编辑功能:有进步,但还不够

    你可以用文字提示词来建议对视频进行修改。实话实说,这方面Omni确实比Veo好用。但Veo的结果本来就烂得可以——我发现每次想改点什么,直接重新生成一个新视频反而更快。Omni确实会”听进”你的修改建议,但结果并不总是能打中你想要的点。

    我让它强调小鹿在度假片段里的面部反应,结果出来的东西看起来很怪异。它还时不时给小鹿加上鹿角——但小鹿根本没有鹿角,它还是个宝宝呢,谢谢。当我提示它去掉某个场景里突然出现的鹿角时,它照做了——然后在所有其他场景里都加上了鹿角。

    这一切都不是免费的

    生成视频是要消耗”积分”的,根据场景长度和起始”素材”的不同,一次消耗15到40积分不等。一轮编辑要花40积分。我订的是每月20美元的AI Pro方案,每月给1000积分。生成了大约20个片段、其中几个做了编辑之后,我的积分就只剩145了。

    如果你对想要生成的视频有比较具体的想法,那你可能要做好心理准备:跟模型来回拉锯很多轮才能得到一个接近你想象的视频,而每一轮都要烧积分。

    然后我把自己深度伪造了

    Omni号称的强项之一是把AI生成的内容叠加到真实视频上,所以我让小鹿休息了一下,转而深度伪造了我自己。我给Omni喂了一段自拍视频,表情很中性,然后让它生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。说实话,我没准备好面对我看到的东西。

    我的深度伪造视频里有一些”AI痕迹”:叉子碰到意面碗的那个声音有点太”做作”了;飞机视频的背景里有个女人出现了两次;但除了这些小故障和一种说不清的”诡异感”之外,它们逼真得要命。

    我把吃意面的片段给我丈夫看了。他知道我在测试AI视频工具,但我没告诉他场景里哪些部分是AI生成的。在不知道哪些是AI的情况下,他完全相信我就是坐在镜头前吃意面——他唯一的疑点是那个碗看起来不太眼熟。至于吃意面这个动作本身,逼真到足以让我丈夫信服——一个在过去十年里几乎每天看着我吃东西的男人。

    我的其他深度伪造视频有不同程度的”好到能在社交媒体上骗到人”。有几段埃菲尔铁塔的片段看起来有点卡通化,但其中一段逼真到你可能要反复看几次才能发现是AI。我知道那不是我,因为AI版本的我转过头时露出了扎成马尾的头发——但我不觉得其他任何人能看出区别,而这让我感觉很怪。


    我得诚实地说,我有点被这一切整累了。当初测试Veo 3的时候,我被它能产生的真实感震惊了。过去几年里,我一次又一次地被”用AI造出假人”有多容易而震惊。我可能也应该被Omni震惊,我想我确实震惊了,但那种”震惊感”已经磨掉了。

    要用AI做出一部”电影级杰作”,其实还没有Google想让你相信的那么容易。但Omni确实在某些可辨认的维度上比Veo有进步。如果你有一个Google账号和一张信用卡,那你只需要微不足道的努力,就能把一段自己坐在家里的视频变成看起来像在飞往毛伊岛的飞机上的画面。我不觉得我们正好站在”奇点的山麓”——但我们肯定已经深深陷入了诡异谷。