智东西12月2日消息,今天,千问APP接入万相系列最新模型Wan2.5,成为首个支持音视频同时输出的移动端AI助手。
阿里万相2.5是目前业界少数具备音画同步能力的视频模型之一,该模型同时支持理解和生成等多种任务,支持文本、图像、视频、音频多种模态的输入和输出,在权威大模型评测LMArena上,万相的图生视频能力位居全球第三,为国内第一。在千问APP上,用户只需一张照片和一段文字,无需模板,即可生成一段肢体动作自然、口型匹配准确的1080P高清唱跳视频,最长支持10S。

如用户输入一张图片和一段“小猫一边唱歌,一边跳舞”的文字,千问APP便能生成相关视频。据悉,千问App公测仅一周,下载量就突破1000万次,超越ChatGPT、Sora、DeepSeek成为史上增长最快的AI应用。




13


