阿里团队推出 AI 视频生成框架 Tora,基于轨迹导向的 DiT 技术,集成文本、视觉和轨迹条件生成视频,由轨迹提取器、时空 DiT 和运动引导融合器组成。Tora 契合 DiT 设计,能制作最长 204 帧、720P 分辨率视频,精确控制多种视频内容,实验证明其运动保真度高,能模拟物理运动,其独特设计为电影特效和虚拟现实等领域带来可能。
阿里团队推出 AI 视频生成框架 Tora,基于轨迹导向的 DiT 技术,集成文本、视觉和轨迹条件生成视频,由轨迹提取器、时空 DiT 和运动引导融合器组成。Tora 契合 DiT 设计,能制作最长 204 帧、720P 分辨率视频,精确控制多种视频内容,实验证明其运动保真度高,能模拟物理运动,其独特设计为电影特效和虚拟现实等领域带来可能。