DeepSeek近日推出了其最新开源AI模型—Janus-Pro,该模型支持图像理解和图像生成,并提供了1B与7B两种不同规模的模型版本。Janus-Pro通过改进的训练策略和更大的数据集,显著提升了文本到图像的生成能力与指令跟随性能。它采用解耦的视觉编码路径,增强了多模态任务的灵活性和稳定性,能够根据文本生成高质量的图像,并理解与解析图像内容。
在多模态理解基准测试(MMBench)中,Janus-Pro-7B表现优异,得分高达79.2,超越了其他同类模型。其在文本到图像生成的指令执行中也取得了高分,表现出色的生成精准度,使其成为多任务处理和跨模态推理的强大工具。
Janus-Pro不仅支持商用,且全面开源,符合MIT协议,开发者和研究人员可以自由使用并进行二次开发。Janus-Pro的推出将推动AI领域在视觉和语言的结合上迈出重要一步,应用前景广阔。
在线体验与更多信息: