VimiVimi是可控人物视频生成AIGC产品。基于商汤日日新大模型能力,它可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。
ToraTora是阿里推出的一个基于Diffusion Transformer(DiT)的视频生成框架,它代表了一种创新的轨迹导向型视频内容生成技术。Tora是首个集成文本、视觉和轨迹条件同时进行视频生成的系统,能够确保生成的视频内容精确地遵循指定的动态轨迹,同时真实地模拟物理世界的运动。