您当前的位置: 首页 > 行业数据 >

每日关注!微软亚洲研究院推出NUWA-XL超长视频生成模型

来源:快科技 2023-04-20 13:49:45


(资料图片仅供参考)

编程客栈()4月20日 消息:你相信吗?只要php输入16句简单描述,AI就能生成11分钟的动画了。

近日,微软亚洲研究院推出了NUWA-XL超长视频生成模型,采用创新的Diffusion over DiffusionjOjoKmg架构,通过「从粗到细」的生成过程,可以并行生成高质量的超长视频,为多模态大模型提供了新的解题思路。

论文地址:https://arxiv.org/abs/2303.12346

NUWA-XL「从粗到细」的生成方法具有三个优势:

分层结构使模型能够直接在长视频上进行训练,python从而消除了训练和推理之间的差距。

模型包含多个局部扩散模型,自然支持并行推理,可以显著提高生成长视频时的推理速度。例如在相同的硬件设置下,当生android成1024帧时,NUWA-XL 使平均推理时间从7.55分钟减少到26秒,速度提升了94.26%。

由于视频的长度可以相对于深度 m 呈指数级扩展,因此模型可以很容易地扩展出更长的视频。

目前,长视频生成的多数方法是采用「Autoregressive over X」架构,这种方法存在训练-推理差距的问题,导致不真实的、扭曲的镜头变化。

NUWA-XL的推出填补了长视频生成领域的空白,为人工智能在视频jOjoKmg生成方面的应用提供了新的可能性。

微软亚洲研究院首席研究员段楠表示,目前人工智能多模态大模型的研发仍停留在文字生成阶段。即使GPT-4已经在理解方面加入了视觉信息,但仅限于图片,输出依旧是文字或代码。因此,当前和未来的研究方向非常明确,就是将语言和视觉的理解和生成融入到一个基础大模型中,以增强图像、视频和音频的生成。他希望未来可以使用一套结构来融合支持语言和视觉的生成算法,使人工智能模型更加通用。

上一篇 下一篇
x
推荐阅读 更多
每日关注!微软亚洲研究院推出NUWA-XL超长视频生成模型

编程客栈()4月20日消息:你相信吗?只要php输入16句简单描述,AI就能生成11分钟的动画了。近日,微软亚洲研究院推出了NUWA-XL超长视频生成模型,采

2023-04-20
全球热点评!鬼子姜的吃法?

鬼子姜又叫洋姜,菊芋,富含丰富的氨基酸,菊糖,膳食纤维,维生素等营养元素,有清热降火,降血糖,中和脾胃等保健作用,是一种营养极高的食

2023-04-20
焦点热门:港股异动 | 吉林长龙药业(08049)早盘飙涨逾50%创6年来新高 一季度归母溢利同比增长55.8%

智通财经APP获悉,吉林长龙药业早盘飙涨逾50%,高见1 9港元创2017年4月份以来高点。截至发稿,涨39 83%,报1 65港元,成交额175 01万港元。消

2023-04-20
焦点短讯!深圳2022年下半年翻译专业资格证书发放通知

各有关考生:2022年下半年翻译专业资格证书(以下简称证书)定于近期发放,具体事项通知如下:一、发放范围在深圳市报名参加2022年下半年翻译专

2023-04-20
【全球热闻】杭州对色狼处罚结果公开 违法行为多发生在地铁或公交

【杭州对色狼处罚结果】3月以来,杭州已经出现两次高温,温度超越了数十年来的同期纪录。姑娘们早早穿上了裙子,但是有敏锐的读

2023-04-20
天天热头条丨男子捉弄外卖女骑手 故意填错地址 辱骂威胁并打差评

近日,安徽马鞍山,一名女骑手报警称:自己按照平台的定位将外卖送到目的地,发现竟是错误地址。拨通电话询问时,没想到得知是对

2023-04-20
即时:明神宗朱翊钧年号_明神宗朱翊钧

1、否明太祖-洪武-朱元璋建文帝-朱允炆明成祖-永乐-朱棣明仁宗-洪熙-朱高炽明宣宗-宣德-朱瞻基明英宗-正统-朱祁镇明

2023-04-20
天天热推荐:中甲联赛本周六打响,青岛西海岸队首轮对战江西庐山队

青岛日报社 观海新闻4月19日讯今天下午,青岛西海岸队在位于中德生态园的俱乐部驻地竖旗出征,开启新赛季的中甲联赛征程。今年三月,俱乐部正

2023-04-20
全球观察:警惕以“免费美容”为名步步设陷

郭亮作据《法治日报》报道,近日,湖南省长沙市公安局对一个以“免费美容”为名实施诈骗的犯罪集团开展统一收网行动,捣毁诈骗窝点7个,抓获犯

2023-04-20
当前视讯!大亚圣象:4月19日融资买入794.46万元,融资融券余额1.85亿元

4月19日,大亚圣象(000910)融资买入794 46万元,融资偿还984 19万元,融资净卖出189 72万元,融资余额1 84亿元。

2023-04-20