九游会体育在巨擘评测集VBench中-j9九游会登录入口九游会官网j9·官方网站

发布日期:2025-08-08 04:29    点击次数:188

九游会体育在巨擘评测集VBench中-j9九游会登录入口九游会官网j9·官方网站

  新浪科技讯 2月25日晚间音书九游会体育,阿里云书记旗下视觉生成基座模子万相2.1(Wan)开源,这次开源接受最宽松的Apache2.0公约,14B和1.3B两个参数规格的一王人推理代码和权重一王人开源,同期赈济文生视频和图生视频任务,众人建树者可在Github、HuggingFace和魔搭社区下载体验。

  据先容,14B万相模子在提示衔命、复杂通顺生成、物理建模、笔墨视频生成等方面发扬杰出,在巨擘评测集VBench中,万相2.1以总分86.22%的得益卓著Sora、Luma、Pika等国表里模子,稳居榜首位置。1.3B版块测试恶果不仅跨越了更大尺寸的开源模子,以至还接近部分闭源模子,同期能在糜掷级显卡开动,仅需8.2GB显存就不错生成高质地视频,适用于二次模子建树和学术推敲。

  在算法策画上,万相基于主流DiT架构和线性噪声轨迹Flow Matching范式,研发了高效的因果3D VAE、可膨胀的预西席战略等。以3D VAE为例,为了高效赈济纵情长度视频的编码妥协码,万相在3D VAE的因果卷积模块中收场了特征缓存机制,从而代替成功对长视频端到端的编解码经过,收场了无尽长1080P视频的高效编解码。此外,通过将空间降采样压缩提前,在不失掉性能的情况下进一步减少了29%的推理时内存占用。

  万相团队的现实恶果表露,在通顺质地、视觉质地、格长入多主义等14个主要维度和26个子维度测试中,万相均达到了业界最先发扬,而况斩获5项第一。(文猛)

海量资讯、精确解读,尽在新浪财经APP

牵扯剪辑:何俊熹 九游会体育