大模型训练 个人定制LORA
等服务内容

24K 订阅
个人定制LoRA(低秩适配)服务中,用户可通过高效微调技术实现大模型的个性化定制,以下从服务流程、技术优势、应用场景、核心工具.

导出模型时选择通用格式(如Hugging Face模型格式),便于长期保存和跨平台迁移.

Wan Video 2.2

Wan2.2 是对我们视觉生成模型的一次重大升级,该模型现已开源,具备更强大的功能、更出色的性能和卓越的视觉质量

Wan2.2 是对我们视觉生成模型的一次重大升级,该模型现已开源,具备更强大的功能、更出色的性能和卓越的视觉质量。通过Wan2.2,我们专注于融入以下技术创新:

架构:Wan2.2 将“专家混合”(MoE)架构引入视频传播模型。通过将去噪过程与专业强大的专家模型交叉分步,可在保持相同计算成本的同时,扩大整体模型容量。

数据扩展:与Wan2.1相比,Wan2.2 基于显著更大的数据进行训练,图像数量增加了 +65.6%,视频数量也增加了 +83.2%。这一扩展显著提升了模型在运动、语义和美学等多个维度上的泛化,在所有开源和闭源模型中均实现了最佳性能。

电影美学:Wan2.2 融合了专门精心挑选的美学数据,并带有细粒度标签,适用于灯光、构图和色彩。这可实现更精确且可控的电影风格生成,从而实现具有可自定义美学偏好的视频创作。

高效高清混合型TI2V:万2.2开源采用我们先进的Wan2.2-VAE的5B型号,实现16×16×4的压缩比。该型号支持720P分辨率(24fps)的文本转视频和图像对视频生成,并可在4090等消费级显卡上运行。它是目前最快的720P@24fps型号之一,能够同时服务于工业和学术领域

wan2.2-T2V-A14B

T2V-A14B 型号支持以 480P 和 720P 分辨率生成 5s 视频。采用Mixture-of-Experts(MoE)架构,可提供卓越的视频生成质量。在我们新基准的万基准2.0榜单上,该模型在大多数关键评估维度上超越了领先的商业模型。

wan2.2-I2V-A14B2.2-I2V-A14B

专为图像与视频生成设计的 I2V-A14B 型号,支持 480P 和 720P 分辨率。采用Mixture-of-Experts(MoE)架构,通过减少不现实的相机动作,实现更稳定的视频合成,并增强对各种风格化场景的支持。

wan2.2-TI2V-5B2.2—TI 2 V—5 B

TI2V-5B 型号采用先进的 Wan2.2-VAE,可实现 16×16×4 的压缩比。该型号支持720P分辨率的文本转视频和图像转视频,分辨率为24fps,可在单个消费级GPU(如4090)上运行。它是目前最快的720P@24fps型号之一,既能满足工业应用又满足学术研究的需求。

GitHub:https://github.com/Wan-Video/Wan2.2

原版HugggingFace Repo:https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repacked/tree/main/split_files/diffusion_models

https://civitai.com/models/1817671/wan-video-22

资源下载此资源下载价格为4TB(VIP免费),请先

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注