MMagicAIGC 工具箱
MMagic (Multimodal Advanced, Generative, and Intelligent Creation) 是一个供专业人工智能研究人员和机器学习工程师去处理、编辑和生成图像与视频的开源 AIGC 工具箱。
MMagic 允许研究人员和工程师使用最先进的预训练模型,并且可以轻松训练和开发新的定制模型。目前 MMagic 支持多种图像和视频的生成/编辑任务。
主分支代码的最佳实践基于 Python 3.8+ 和 PyTorch 1.9+ 。
MMagic 支持各种基础生成模型,包括:
-
无条件生成对抗网络 (GANs)
-
条件生成对抗网络 (GANs)
-
内部学习
-
扩散模型
-
还有许多其他生成模型即将推出
MMagic 支持各种应用程序,包括:
-
图文生成
-
图像翻译
-
3D 生成
-
图像超分辨率
-
视频超分辨率
-
视频插帧
-
图像补全
-
图像抠图
-
图像修复
-
图像上色
-
图像生成
-
还有许多其他应用程序即将推出
主要特性
-
SOTA 算法
MMagic 提供了处理、编辑、生成图像和视频的 SOTA 算法。
-
强有力且流行的应用
MMagic 支持了流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用,例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插值,投影,编辑和其他流行的应用。请立即开始你的 AIGC 探索之旅!
-
高效的框架
通过 OpenMMLab 2.0 框架的 MMEngine 和 MMCV, MMagic 将编辑框架分解为不同的组件,并且可以通过组合不同的模块轻松地构建自定义的编辑器模型。我们可以像搭建“乐高”一样定义训练流程,提供丰富的组件和策略。在 MMagic 中,你可以使用不同的 APIs 完全控制训练流程。得益于 MMSeparateDistributedDataParallel, 动态模型结构的分布式训练可以轻松实现。