中国自研“智象视觉大模型” 将生命力注入你的故事
“在AIGC的中国自研智象路上,我们可以说是视觉生命一路狂奔。”近日,大模智象未来(HiDream.ai)的力注创始人梅涛(CEO)表示,作为国内一家专注于构建视觉多模态基础模型及应用的故事生成式人工智能初创公司,其自主研发的中国自研智象“智象视觉大模型”是目前全球同时支持图像和视频生成的最大模型。模型参数已超过130 亿,视觉生命可实现文本、大模图片、力注视频等多模态内容的故事生成。 2024年第一季度,中国自研智象智象未来计划推出重大迭代的视觉生命图像基础模型。这一技术也将持续赋能视频生成领域,大模原有视频基础模型预计在3月底实现大幅升级。力注新一版模型将在文本与视频的故事一致性、生成时长和视频连贯性等方面有显著进步,用户可享受到更加丝滑、顺畅的视频生成体验。 深耕于视频生成领域,智象未来将聚焦四大关键要素——视觉故事性、内容确定性、超高清画质(4K/8K)以及全局和局部可控性,并已在实际产品中实现4K高清画面、全局和局部的可控、剧本多镜头视频生成等功能。 其中,Pixeling 千象是智象未来打造的自主可控生成式AIGC创作平台和社区,其小程序“千象万相”集图片生成、视频生成、图片编辑(智能重绘、智能拓图、图片增强)等功能于一体。即使是零基础的用户,也能运用AIGC一站式满足需求,让天马行空的想象触手可及,让创作更加高效而强大。 E象则是专为电商卖家打造的AI制图工具。无需策划方案、道具采购、美工置景、布景拍摄、后期加工等流程及费用,商家只需上传一张商品图或真人试穿图,即可一键生成大量真实场景商品图,还原服饰的真实上身效果,助力卖家降本增效,打造爆款。 此外,智象未来团队在文生视频领域独辟蹊径,开辟更精细、稳定、品质卓越的创新之路——不直接从文本向视频转换,而是从文本先向图片转换,生成关键帧,再拓展为多镜头的完整视频。 “逐帧生成的方法不仅能够提高视频生成的稳定性、细节处理和美感,还为视频生成的时长拓展提供了可能性。”梅涛介绍。 收到一条文本或指令后,大语言模型会基于对文本的理解,自动生成分镜头脚本,再通过“文生图”功能,创造性地生成分镜头脚本所描绘的画面,从细腻纹理到光影流转,每一幅画面都精雕细琢。然后,将多个画面逐帧拼接,转换为多段单一镜头的视频。最终,将这些视频剪辑形成15秒甚至更长时间的多镜头视频。 目前,智象未来已经完成图像Diffusion Transformer 架构 130 亿参数规模的训练,拥有如此大规模的训练数据集,使模型具备强大的语言理解和视觉推理能力。
- 最近发表
- 随机阅读
-
- 贯彻落实《国家标准化发展纲要》|沈阳新增1个全国专业标准化技术组织
- 春风吹暖万象新!广东乡村“春日经济”活力足
- 又悶又熱!雨區擴大 南部及午後易有大雨
- 明光全力筑牢防汛减灾“安全堤”_
- 美国铝业公司:对华关税将使其年度成本增加超千万美元_
- 国家发改委调研组来淮
- 台開董邱復生籌不出150萬交保金! 離開北檢法警幫叫車
- 寿县小甸镇加强冬季食品药品安全监管
- 福建龙岩约谈7家供校集体用餐配送单位
- 凡尔赛宫马术场地 正在铺设
- Youtuber滴妹男友查理 疑經營德州撲克賭場
- 別再熬夜了!醫警告「晚睡重傷身體1器官」 泌尿道感染機率也增加
- 警方寓教于乐多种形式送法进校园 教孩子们安全触网预防欺凌
- 制止餐饮浪费|辽宁沈阳:组建外卖小哥“飞行队”
- 人類起源的故鄉找到了?這篇論文堪稱「過度解讀」的負面教材
- 歐盟就自中國入境航班指引達成一致
- 制止餐饮浪费|北京延庆开展宣教活动
- 花都邝维煜小学“岭南绿美第一村”学农研学之旅
- 坚决打赢“基本解决执行难”硬仗
- 陕西汉中:端午假期受理食品药品等投诉58起
- 搜索
-
- 友情链接
-