阿里达摩院上线“文本生成视频大模型”

据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。

阿里达摩院上线“文本生成视频大模型”

本文链接:https://www.8btc.com/article/6810504
转载请注明文章出处

原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/bhq/23026.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注