日期:2025/04/04 21:35来源:未知 人气:51
大家好,我是葉子。众所周知,几个大厂的AI视频大模型已经卷了很久,鹅厂却迟迟没有动静。
不过前两天鹅厂却默默搞了个大事,他们推出了腾讯旗下的第一个AI视频大模型——【混元视频模型】,然后把这一个堪比sora的视频大模型直接开源了。
简单说一下混元视频模型有多强:130亿参数(目前参数最大的开源视频模型),支持中英文双语输入,可以模拟物理世界,一镜到底,语义识别很精准,角色动作一致性很强,生成的视频可以带音乐。
开源版下载地址:https://github.com/Tencent/HunyuanVideo
内测版只需要在腾讯元宝APP/网页版上即可申请。内测申请链接:https://yuanbao.tencent.com/bot/app/share/chat/GKAJQFF/videoTrafficDiversion
目前开源视频大模型中无可争议的NO.1。作为鹅厂的第一版本的视频大模型,可以说质量效果都很好。基本超越了大多数其他大模型的第一版。
在提示词的理解和遵循上,以及运动的稳定性,包括物理世界的规律性,写实感,镜头转换上,都表现很不错。
目前混元视频还只有文生视频,所以对提示词有一点给要求:
之前教过大家的文生视频公式不知道大家是否还记得,葉子这里也再分享一下:
公式=内容描述+(风格+镜头+氛围+景别+光线+焦点景深+构图+色调) 公式解释:(括号内部分可省略)内容描述:主体+描述+运动+场景**风格: 中国风、水墨风、写实摄影风、二次元动漫风等。镜头: 航拍镜头、前推镜头、平移镜头、旋转镜头等。氛围: 温馨的、紧张的、神秘的等。景别: 全景、中景、特写、低角度仰视等。光照: 自然光、夕阳下、逆光、金色阳光下等。焦点景深: 微缩摄影、前景焦点清晰、模糊背景等。构图: 大面积留白、黄金分割、对称等等。色调:** 低饱和度、高饱和度、黑白、丰富色彩等。
这一点其实腾讯混元视频很好的一点就是,这些内容很多都内置了。
比如常用的标签:
比如更多设置中,有prompt增强,可以帮助我们优化提示词,还有其他的一些功能:
而这么强大的视频,鹅厂说开源就开源了,确实有钱就是大气,目前鹅厂已经开源了不少大模型,目前已经有文本生成、图片生成以及最新的视频生成。腾讯确实NB。