昆仑万维发布Matrix-Zero世界模型,开启空间智能新时代

2025-02-14 14:41:09爱云资讯3656

2月14日,昆仑万维正式推出 Matrix-Zero世界模型,成为中国第一家同时推出3D场景生成和可交互视频生成模型的探索空间智能的企业。

Matrix-Zero世界模型包含两款子模型:

(1)昆仑万维自研3D场景生成大模型,支持将用户输入的图片转化为可自由探索的真实合理的3D场景,比World Labs生成场景的探索范围更大更自由,而且包括动态物理效果;

(2)昆仑万维自研可交互视频生成大模型,提供以用户输入为核心驱动的可交互空间智能视频生成方案,支持根据用户实时输入生成互动视频效果,具备更精准控制的action model。

昆仑万维Matrix-Zero的3D场景生成功能,支持将用户输入的图片转化为可自由探索的真实合理的3D场景,具备全局一致性、可自由探索、支持不同风格图片输入、支持风格迁移、支持动态场景生成等亮点。

能够实现这样的逼真效果,得益于昆仑万维自研3D场景生成大模型,包含两个核心模块:场景布局生成模块和纹理生成模块。几何生成模块借助可微渲染和扩散模型技术,能创造出和输入图片一致的3D场景布局;纹理生成模块在图片生成模型和视频生成模型基础上训练,当用户在场景中运动时,昆仑自研3D场景生成大模型不断对场景缺失区域进行几何和纹理的补全,从而确保用户在任何位置、任何角度都能看到合理、一致的场景。

此前,谷歌Genie(可交互生成环境)系列已经向大众展示了世界模型的能力和魅力。为达到更好的流畅性、一致性等,昆仑万维可交互视频大模型建立在先进的生成式视频模型之上,结合自主研发的用户交互模块,最终实现了一种以用户输入为核心驱动的空间智能视频生成方案

该方法能够在保证开放领域视频生成能力的同时,进一步增强对视频内容中视角移动的精确控制,使其更加符合用户的交互需求和预期。通过这种方式,我们不仅可以生成符合用户意图的视频内容,还能够优化空间智能模型的适配性,从而拓展在虚拟环境、交互式应用以及沉浸式体验中的应用场景。

作为针对图片对应的 3D 世界中自由探索提出的视频生成系统,Matrix-Zero 能够在不同环境下高效地生成高质量的视频内容,并确保视频的流畅性、一致性和合理性。

紧握AI时代脉搏,成为中国探索空间智能的领跑者。昆仑万维作为中国AI领军企业,始终践行公司使命——实现通用人工智能,让每个人更好地塑造和表达自我,坚持在人工智能领域自主研发,持续推出AI产品。

过去三年,昆仑万维在视觉多模态、深度学习、强化学习等关键技术方向取得了一系列成绩,同时构建起了完整的AI矩阵:最懂金融、学术的天工AI搜索,全球首个AI音乐创作平台Mureka,AI 短剧平台SkyReels,AI社交产品Linky,AI游戏等,形成了“AI前沿基础研究——基座模型——AI矩阵产品/应用”的产业链。

2025年1月,「天工大模型4.0」o1版和4o版正式上线天工APP和网页。2025年2月8日,昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 + 联网搜索”功能。

勇立潮头,敢为人先。今天,昆仑万维Matrix-Zero系列模型的开发和迭代也代表了公司对未来AI技术的提前布局,进一步赋能公司AI业务矩阵。交互生成模型的落地将变革可交互内容引擎,大大提升公司AI多矩阵产品的生产力。

Matrix-Zero世界模型预计4月份上线,将对公司AI游戏生产、AI短剧生产和编辑等业务进一步赋能,为用户和开发者带来新的平台和工具。当视频模型发展到可以逼真模拟物理世界时,游戏可能不再需要传统的3D引擎,许多实验和模拟将可以在虚拟环境中进行,而影视创作也将变得更加普及,甚至成为每个人的基本技能。虽然这些看似是未来的场景,但技术正一步步将它们变为现实,视频生成模型的火热正是这一趋势的重要体现。

未来大模型发展将更加关注智能体工具和用户交互。空间智能技术不仅为未来智能体研发提供了虚拟平台,也带给用户全新的与生成世界交互的体验,大大提升了交互的多样性。空间智能技术的发展也将是通往具身智能乃至AGI路上的一个重要技术里程碑。我们仍将持续升级迭代,研发更先进的AI平台、打磨体验更好的AI产品,进一步推动人工智能的繁荣发展。

相关文章

人工智能技术

更多>>

人工智能公司

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>
关于我们|联系我们|免责声明|会展频道

冀ICP备2022007386号-1 冀公网安备 13108202000871号

爱云资讯 Copyright©2018-2024