1月4日,爱诗科技正式发布通用实时世界模型 PixVerse R1。PixVerse R1支持最高1080P分辨率、可实现即时响应的通用实时世界模型,将视频生成从以往的“静态输出、等待成片”,推进至“实时交互、持续演化”。
实时世界模型,是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统,使数字场景能够持续演化,并即时响应用户操作。实时互动视频生成是其中主要应用之一。
与传统 AI 视频生成需要等待数十秒甚至数分钟、一次性输出固定片段不同,PixVerse R1 的核心能力在于“实时交互”。在生成过程中,视频画面会随着用户指令即时变化,用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性,使视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验。
这一变化,使 AI 视频从“生成结果”转变为“生成过程”。用户不再只是等待结果的观看者,而可以像导演一样介入创作节奏。
从技术层面看,PixVerse R1 基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建。相关机制使视频不再是由孤立片段拼接而成,而是一条可持续生成、可随时调整的视觉流。长期以来困扰 AI 视频生成的画面突变、逻辑断裂和高延迟问题,在这一框架下得到系统性突破。
据悉,爱诗科技成立于 2023 年,专注于 AI 视频生成大模型及应用研发。公司海外产品 PixVerse 及国内产品“拍我AI”目前全球用户规模已超过1亿,单月月活跃用户超过1600 万,产品被广泛应用于影视、广告、动漫及内容创作等场景。