可灵 AI 推出全球首个统一多模态视频模型——可灵视频 O1,整合视频生成、编辑与理解功能于单一引擎。新模型支持图片、文字、视频等多模态输入,可执行文生视频、视频内容增删、风格重绘及镜头延展等多项任务,用户仅需输入指令即可完成复杂创作。
据官方介绍,O1 模型采用 Multimodal Transformer 与多模态长上下文技术,并引入 Multi-modal Visual Language(MVL)实现更深层的语义融合。
可灵 AI 推出全球首个统一多模态视频模型——可灵视频 O1,整合视频生成、编辑与理解功能于单一引擎。新模型支持图片、文字、视频等多模态输入,可执行文生视频、视频内容增删、风格重绘及镜头延展等多项任务,用户仅需输入指令即可完成复杂创作。
据官方介绍,O1 模型采用 Multimodal Transformer 与多模态长上下文技术,并引入 Multi-modal Visual Language(MVL)实现更深层的语义融合。
Previous: 阿里发布 Qwen-Image 更新版本