|

新车测评网
2000活跃值=1元

首页 > 汽车活动 > 汽车活动 > 音效师狂喜！谷歌推出首个AI视频自动配音工具，一个人干了后期活

音效师狂喜！谷歌推出首个AI视频自动配音工具，一个人干了后期活

发布时间：2024-06-19 22:58:50

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日

谷歌发布新一代AI视频自动配音工具，AI视频开启「有声时代」！

6月17日，谷歌人工智能团队DeepMind发布了一个名为V2A（Video-to-Audio）的AI架构系统，顾名思义即“视频转音频”，能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于，可为任何视频自动创建合适的音轨BGM，在实践中取得了十分有效的进展，可以大大降低视频配音的制作成本。

当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片，但它们均输出的是默片。

谷歌V2A系统的特点，便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面，知道画面里正在发生什么，应该出现什么声音。

举个例子，比如输入一则主题为「在黑暗中行走」的无声视频，添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后，AI模型就能根据提示词生成恐怖片风格的背景音效，十分逼真。

00:00 / 00:12

脚步声基本吻合人物走动的节奏，随着画面的切换，脚步声也随之消失，毛骨悚然的紧张感拉满。

为了能够贴近Sora热点，谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

00:00 / 00:08

比如上边这段Sora生成的水母漂荡影像，营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片，经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“新车测评网用户上传并发布"，本平台仅提供信息存储服务。

下一篇:市值狂飙，3.34万亿美元！英伟达一举超越微软、苹果，登顶“世界股王” ！分析师看好上攻5万亿美元

上一篇:华为MatePad 11.5\"S 12GB平板电脑本周开售，搭载麒麟9000WE处理器

汽车活动更多>>

丰田上海车展主题：直面问题所在，研产供销全面中国化同级唯一天地门，空间堪比A+级，东风纳米06再次颠覆国民车吉利银河星耀8：以豪华平权，再创“爆款” 长安汽车，销量涨了、利润跌了传祺向往 M8 内饰官图发布！提供 7 座布局，搭载 2.0T 插混动力方程豹钛 3 将于 4 月 16 日上市！采用纯电动力，配备一键漂移模式广汽 CC4 概念车官图发布！配鸥翼门设计新款 Jeep 大切诺基谍照曝光！外观内饰升级，定位中大型 SUV 汽车业加速重组并购最新成果：一汽或成零跑大股东上汽之夜：懂车更懂你！上汽制造进阶，共创美好出行上汽大通G50混动：重塑10万级MPV价值标准！比亚迪580KW超级电机铭牌曝光：转速30500转/分钟全球第一 2024年全年销量3143.6万辆，增长4.5%，47.5%新能源渗透率，585.9万辆全球第一出口量丰田纯电车型终端售价“崩盘” 消息称bZ3裸车只要9万多小鹏汽车新总部2025年启用，办公空间翻三倍，打造智能车库恢复序幕与尾声，李六乙版话剧《雷雨》令人耳目一新新华文创携手FILA FUSION推出系列活动，用非遗开启新年游戏成为文旅新引擎？上海游戏赋能商旅文体展融合发展的实践晨光加速年轻化布局：联动腾讯视频《斩神》，力拓二次元千亿蓝海广州“贺·岁”今日开展，系海昏侯相关展览首次在广州展出信也科技顾鸣：东南亚数字金融市场正在加速接近成熟地区福特游骑侠Ranger FX4沙狐版来袭，越野性能再升级，售价28.58万起 “一车抵三车” 长安启源E07迎来OTA升级优雅的英国敞篷跑车，2门4座布局，V8发动机、665马力、加速3.5s 宏光MINIEV四门版来袭，小巧便捷，女友直呼开车出门超方便！溜背造型+掀背尾门，后置后驱+5.9秒破百，体验东风风行星海S7 搭载全球最强电机比亚迪唐L实车曝光：自带车顶无人机舱三菱翼神改装AIRBFT气动避震底盘升降案例双电机、四驱、650马力，27英寸大屏，这内饰看着可太有档次了！ 2025年温州永嘉县事业单位引进博士研究生公告

Copyright 2017-2025 新车测评网版权所有京ICP备18049689号-26