新大模型可根据文本生成高清视频
4月27日,模型在中关村论坛未来人工智能先锋论坛上,可根清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。据文论坛现场,本生清华大学教授、成高生数科技首席科学家朱军向与会者展示了Vidu生成的清视视频,包括行驶在崎岖道路上的模型汽车、戴珍珠耳环的可根猫、弹吉他的据文熊猫等。与此前震撼业界的本生Sora一样,Vidu能够根据文本描述直接生成高质量视频。成高 “长时长、清视高一致性、模型高动态性”是可根Vidu的显著特征。朱军表示,据文研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。 除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。 值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。
- 最近发表
- 随机阅读
-
- 胜利社区:党建引领聚合力 文化赋能扬清风_
- 上证综合全收益指数“首秀”收红
- “硬腕子”+“活点子”治本保生态
- 腎結石「6纇食物」真的要少吃!辣椒上榜 就連大家最愛1酸甜水果也中
- 德州县级冷链食品疫情防控专班工作会议召开
- 不尋常!西班牙4月飆35度「史上最熱」 今年前三月均溫創63年新高
- 中國海軍「和平方舟」號醫院船訪問塞舌爾
- 美國施壓無效,菲律賓將與中國企業共創電信未來
- 一生扎根中国乡土丨那年今日
- 非遗文化生活馆亮相成都
- 筑牢民生底线 推进就业创业
- 什么是金融风险防范?
- 北京海淀:9家餐饮单位存在食品安全问题被通报
- 網路聲量最強的「令和新選組」背後推手,山本太郎將如何震撼日本國會大選?
- 做好中考考务工作 营造良好考试环境
- AEIS︰醫管局記招沒有告訴你的事
- 我市3月份居民消费价格指数下降0.6%_
- 市委第一巡察组向市人力资源和社会保障局反馈巡察情况
- IU「收2包義美小泡芙」秒露笑眼!親民揮手比YA 保鑣大叔全程保護
- 美國交通部對達美航空大面積取消航班事件展開調查
- 搜索
-
- 友情链接
-