澜舟科技-孟子大模型

AI训练模型
23年6月5日
编辑

AIHubAI布道师

孟子大模型是什么？

孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据，同时支持多种理解和生成任务，能快速满足不同领域、不同应用场景的需求。

官网：https://www.langboat.com/portal/mengzi-model

孟子大模型可以做什么？

孟子预训练模型提供了一系列产品，包括孟子生成式大模型（孟子 GPT）、Mengzi-BERT-base、Mengzi-BERT-base-fin、Mengzi-T5-base、Mengzi-T5-base-MT、Mengzi-GPT-neo-base、Guohua Diffusion、句向量计算等，适用于各种自然语言处理任务，如文本分类、实体识别、关系抽取、阅读理解、文案生成、新闻生成、文本续写、小说生成等。

孟子大模型优势

一个模型，解决多种应用场景。

支持多种模型架构：如 GPT、BERT、T5 等。
轻量模型性能强化：通过多预训练任务融合、SMART 对抗训练、知识蒸馏等方式，提升模型性能。
基于知识图谱增强：通过基于实体抽取的增强、知识图谱增强（isa 关系）、知识图谱转文字等方式，增强模型的知识理解能力。
基于语言学知识增强：通过成分句法融合增强的 Mask 机制、语义角色 Embedding 融合增强、依存关系的注意力权重约束剪枝等方式，增强模型的语言理解能力。
小样本/零样本学习：通过 Prompts 模板构造、多任务学习技术等方式，提升模型的学习能力。
基于检索增强：通过知识解耦、可解释性强、外部知识组件实时更新等方式，提升模型的检索能力。