年视频生成研究报告

(精选报告来源:幻影视界)

2024年,AI视频生成是最受关注的领域之一,OpenAI在今年2月发布Sora,推动视频生成技术出圈的的同时也催化了产业的发展,目前AI视频生成现状如何,有哪些趋势和特点?

应用趋势:2024年将成为AI视频的应用元年,年视频生成研究报告未来3-5年更多应用场景将随着模型能力提升和推理成本下降逐步解锁

模型能力:通过自然语言及其他方式可以实现对内容的精准控制,深度理解物理世界规律,稳定性、丰富度达到在各个领全面达到商用水准。1分钟的视频片段生成时间达到缩短到数秒,接近实时生成

经济性:视频生成的成本继续降低1个数量级

产品:新一代视频交互界面开始普及,视频生成内容融入大部分视频制作场景,重塑内容生态

模型能力:实现复杂语义理解,同时满足多个生成条件,视频的活动度、丰富度、稳定性可以媲美影视级内容,有效时长超过一-分钟,在部分场景可以充分满足需求。1分钟的视频片段生成时间缩短到到分钟级

经济性:推理成本下降1个数量级

产品:视频模型与传统工作流进行深度集成,同时萌生AI原生工作流,商业化规模达到Midjourney的水平

模型能力:生成视频时长度短、活动度低、稳定差,人物对象、背景经常畸变。语言理解能力有限,只能理解简单指令,难以同时满足多个生成条件,指令遵从能力差,10秒左右视频片段需要3-5分钟生成

经济性:成本高昂,每分钟视频约3美元1

产品:简单的文成视频、图生视频功能,以网页端和移动的简单应用为主,功能较为单薄

成本驱动:AI生成视频的成本远低于各类现有视频内容的制作成本,将逐渐驱动视频生成内容渗透到各内容种类.

AI视频生成的成本远远低于影视行业的制作成本,有若干个数量级的降本效果,但目前阻碍应用的主要因素是模型能力不足,生成效果尚无法与传统制作方式竞争,但预期模型能力将持续迭代,未来3-5年达到可以与传统制作方式的媲美的水平动画类电影的制作成本尤其高,需要渲染大量的2D和3D内容,传统制作方式包括角色建模、场景贴膜、纹理贴图、渲染合成等环节,需要数百人耗时数月进行制作,工程量非常大,视频生成可以大量削减制作成本的

局部应用已经开始:在对于制作质量要求较低、制作方式和内容较为模板化的短剧行业,已经出现AI短剧生成的应用,例如Reel.AI

在训练侧,视频大模型的进步同样遵循ScalingLaw,需要在Scalable的模型架构上不断增加数据和算力来提升模型能力。在推理侧,需要算力成本的下降和充足的供给来支撑下游的应用和商业化。我们正在看到GPU的性能提升和领军玩家在算力基建上的巨额投入,这将成为未来视频模型发展和应用的根本驱动力。

幻影视界整理报告原文节选如下:

本文仅供参考,不代表我们的任何投资建议。幻影视界整理分享的资料仅推荐阅读,用户获取的资料仅供个人学习,如需使用请参阅报告原文。

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文