-
百川智能发布 Baichuan2-192K 大模型 可处理约35万个汉字
百川智能发布了 Baichuan2-192K 大模型,具有全球最长的上下文窗口长度,能够处理约35万个汉字。 与目前最优秀的大模型 Claude2相比,Baichuan2-192K 的上下文窗口长度超过了4.4倍,超过了 GPT-4的14倍。 Baichuan2-192K 在长窗口文本生成、理解、问答、摘要等方面表现出色,并在10项长文本评测中取得了7项 SOTA 成绩。 据悉,Baichuan2…- 1k
- 0
-
王小川旗下百川智能宣布完成3亿美元A1轮融资
百川智能公司今日宣布完成了3亿美元的A1轮战略融资,这次融资吸引了包括阿里、腾讯、小米等科技巨头和多家顶级投资机构的参与。 据悉,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天,便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型,且在…- 410
- 0
-
百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”
9 月 6 日消息,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。 百川智能此次还开源了模型训练的 Check Point,并宣布将发布 Baichuan 2 技术报告,详细介绍 Baichuan 2 的训练细节,IT之家附 Ba…- 594
- 0