-
GPT-4.5:OpenAI推出的最新大语言模型
GPT-4.5是OpenAI最新发布的大型语言模型,它通过无监督学习提升对世界的理解,减少幻觉,对话更自然,情商更高,尤其在写作、编程和创意任务中表现出色。同时,GPT-4.5在安全性上进行了优化,并通过API向开发者开放,支持多种功能调用。 -
QwQ-32B:阿里云开源的最新AI推理模型,更小尺寸,消费级显卡即可部署
QwQ-32B 是阿里云开源的320亿参数推理模型,具备强大的数学、代码和通用推理能力,性能比肩全球顶尖开源模型。它支持消费级显卡部署,降低硬件门槛,同时集成智能体能力,可灵活调整推理过程。采用Apache 2.0协议开源,用户可免费下载、商用和定制化开发,推动AI技术的广泛应用。 -
SpeciesNet - 谷歌开源的AI模型,助力野生动物识别和保护
SpeciesNet是谷歌开源的一款AI模型,专为识别野生动物而设计。它通过分析相机陷阱拍摄的照片,能够将图像分类为超过2000个标签,涵盖动物物种、分类群和非动物对象。模型基于6500万张图像训练,具备高准确性和广泛适用性,采用Apache 2.0开源许可,助力生物多样性研究和保护。 -
CogView4 - 智谱推出的开源文生图模型,支持汉字生成
CogView4是北京智谱华章推出的开源文生图模型,支持中英双语输入,擅长生成含汉字图像。它在DPG-Bench测试中排名第一,性能卓越。具备任意分辨率生成和长提示词输入能力,技术领先,遵循Apache 2.0协议,适用于广告、短视频等创意领域。 -
DeepSeek-V3:DeepSeek推出的开源自研 MoE 模型,性能与速度全面突破
DeepSeek-V3 是由深度求索公司推出的一款全新发布的自研 MoE(混合专家)模型,旨在突破当前大语言模型的性能瓶颈。通过 671B 参数和 37B 激活专家,DeepSeek-V3 在 14.8T token 的大规模预训练上取得了显著进展,展现出与世界顶尖闭源模型(如 GPT-4o 和 Claude-3.5-Sonnet)相当的表现。该模型在多项标准评测中超越了 Qwen2.5-72B … -
-
通义万相Wan2.1- 阿里推出的开源视频生成大模型
通义万相Wan2.1是阿里巴巴推出的开源视频生成大模型,专注于从文本生成高质量图像和视频。Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势,无论是创作者、开发者还是企业用户,都可以根据自己的需求选择合适的模型和功能,轻松实现高质量的视频生成。 -
Claude 3.7 Sonnet:Anthropic 最新推出的混合推理AI模型
Claude 3.7 Sonnet 是 Anthropic 公司推出的一款先进的人工智能模型,具备强大的推理和编码能力。它结合了即时响应与深度思考模式,用户可通过 API 控制思考时间,以平衡速度和回答质量。此外,它在数学、物理、指令遵循和软件开发等任务上表现出色,尤其在编码和前端开发方面有显著提升。 -
QwQ-Max-Preview:阿里通义千问推出的深度思考模型
QwQ-Max-Preview是阿里Qwen团队基于Qwen2.5-Max开发的推理模型预览版,擅长深度推理、数学、编程和AI智能体任务,未来将开源并推出正式版。 -
Moonlight - 月之暗面推出的开源MOE模型
Moonlight 是由月之暗面公司推出的开源 MoE(Mixture of Experts)语言模型,,使用 Muon 优化器训练,激活参数仅需 3B。该模型在训练效率和性能上表现出色,训练 FLOPs 明显减少,同时支持 64K 上下文处理能力。它适用于多种自然语言处理任务,包括语言理解和生成。 -
ALLaM - 专为阿拉伯语设计的AI大语言模型
ALLaM是由沙特数据与人工智能局(SDAIA)开发的阿拉伯语大型语言模型,专为理解和生成标准阿拉伯语及沙特方言设计。它经过5.2万亿tokens的双语预训练,具备强大的语言能力,并支持自定义系统提示,广泛应用于自然语言处理和文本生成等领域,旨在推动阿拉伯语技术发展并提升其在全球AI领域的地位。 -
协和·太初 - 北京协和医院和中科院联合推出的罕见病领域 AI 大模型
“协和・太初”是由北京协和医院和中国科学院自动化研究所共同研发的国内首个罕见病领域 AI 大模型。该模型基于我国罕见病知识库的多年积累和中国人群基因检测数据,是国际首个符合中国人群特点的罕见病大模型。 -
Phantom - 字节跳动推出的主体一致性视频生成框架
Phantom 是字节跳动推出的主体一致视频生成技术,通过跨模态对齐实现高质量视频创作。它支持单张或多张参考图像生成,可保留主体身份特征,生成生动的视频内容,适用于虚拟试穿、广告制作、动画等场景。 -
Muse:微软推出的AI游戏生成模型,能生成连贯的游戏画面和动作
Muse 是微软发布的首个专为游戏创意设计的生成式AI模型,基于大规模玩家数据训练,能够生成连贯、多样化的游戏视觉效果和控制器操作。它支持多模态生成,可快速生成游戏原型,助力开发者探索新玩法。 -
Grok 3:马斯克旗下XAI发布的新一代AI大模型
Grok 3是由埃隆·马斯克旗下公司xAI开发的的新一代大语言模型系列,包括Grok-3及其精简版Grok-3 mini。Grok 3计算能力是前代的十倍,具备思维链推理和逻辑一致性。数学、科学推理和编程能力领先,AIME'24得52分,科学知识75分,编程57分,AIME 2025得93分,LMSYS聊机竞技场得1400分。新增Big Brain和DeepSearch模式,优化复杂任务… -
-
kimi-latest:月之暗面推出的最新AI模型
Kimi Latest 是月之暗面公司推出的最新模型,与 Kimi 智能助手同步升级,使用最新 Kimi 大模型,上下文长度 128k,自动选择计费模型,支持自动上下文缓存。 -
SkyReels-A1:昆仑万维开源的基于视频基座模型的表情动作可控算法
SkyReels-A1 是昆仑万维开源的基于视频基座模型的表情动作可控算法,旨在提升人物视频生成的精准度和可控性。它支持通过视频驱动电影级表情捕捉,能够高保真地还原微表情变化、皮肤肌理以及肢体动作的细节。SkyReels-A1可以根据参考人物图片和驱动视频生成动态视频,同时保留人物的表情和肢体动作,确保效果真实且不失真。 -
SkyReels-V1:昆仑万维开源的AI短剧创作视频生成模型
SkyReels-V1 是昆仑万维开源的中国首个面向AI短剧创作的视频生成模型,专注于影视级人物表演、表情生成和动作模拟。它能够精细控制人物的口型、表情和肢体动作,提供33种人物微表情和400多种自然动作组合,模拟真实的情感表达。 -
Step-Audio:阶跃星辰推出的开源语音交互模型
Step-Audio 是阶跃星辰与吉利联合开发的业内首款开源产品级语音交互模型。它能够根据不同的场景需求,生成具有情绪、方言、语种、歌声及个性化风格的语音,支持自然、高质量的对话。 -
Step-Video-T2V:阶跃星辰推出的开源视频生成大模型
Step-Video-T2V是阶跃星辰与吉利联合开源的一款高性能视频生成大模型,具备300亿参数量,能够生成540P分辨率的高质量视频。它支持复杂运动场景、精准镜头控制和生动人物生成,能够根据文本输入生成符合物理规律的视频。 -
腾讯混元T1:腾讯推出的最新深度思考推理模型
腾讯混元 T1 是腾讯推出的最新深度思考推理模型,具备强大的分析和推理能力,能够清晰、有依据地回答复杂问题。T1 还支持联网搜索,结合实时信息提供更准确的答案。目前腾讯混元 T1已上线腾讯元宝, 处于小范围灰测阶段,可以在手机或电脑上下载腾讯元宝 APP 或访问其网页版体验。 -
Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界
Matrix-Zero 是昆仑万维发布的世界模型,包含两款子模型:3D 场景生成大模型和可交互视频生成大模型。3D 场景生成大模型能将图片转化为可自由探索的 3D 场景,具备全局一致性、支持不同风格输入、动态场景生成等亮点。可交互视频生成大模型则提供以用户输入为核心的视频生成方案,支持实时互动,具备精准控制的 action model。该模型将推动影视制作、游戏开发等领域的创新,提升内容生产效率。 -
Stable Diffusion-全球最强开源AI绘画模型
Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,任何人都可以拷贝使用,只需要输入一句提示词(prompt),就能够在几秒钟内创造出令人惊叹的绘画作品。 -
Goku:港大字节推出的AI视频生成模型
Goku是香港大学与字节跳动合作开发的视频生成模型,基于Rectified Flow Transformer架构,能够从文本、图像或图文输入生成高质量的视频。 -
VideoWorld:豆包等推出的开源视频生成模型,从无标签视频中学习知识
VideoWorld是豆包大模型团队联合北京交通大学、中国科学技术大学共同开发的视频生成实验模型,通过无标注的视频数据训练,探索AI如何从视觉输入中学习复杂任务。 -
Gemini 2.0 Pro:谷歌最新推出的高性能 AI 模型
Gemini 2.0 Pro 是 Google DeepMind 最新推出的高性能 AI 模型,专为编程和复杂任务优化。它具备最强的代码生成能力,能够处理复杂指令,并支持最高 200 万 Token 的上下文窗口。此外,模型可调用 Google 搜索和代码执行以增强推理能力。目前,该模型可供 Google AI Studio、Vertex AI 的开发者使用,同时 Gemini Advanced … -
DeepSeek-R1:深度求索发布的AI推理模型,性能对标 OpenAI o1 正式版
DeepSeek-R1 是深度求索推出的高性能推理模型,性能与 OpenAI o1 正式版相当。通过强化学习技术和极少标注数据,DeepSeek-R1 在数学、代码和自然语言推理等任务中表现卓越。该模型遵循 MIT License 开源,支持模型蒸馏,允许用户训练其他模型。此外,DeepSeek-R1 提供 API 服务,按 token 计费,广泛应用于科研、技术开发和企业智能化升级等领域。 -
-
OpenAI o3-mini:OpenAI最新发布的AI推理模型
o3-mini 是 OpenAI 推出的新一代推理模型,旨在为用户提供高效且经济的推理能力。它继承了前代 o1 模型的优点,同时通过优化提升了在 科学、数学、编程 等领域的推理能力,并保持了 低成本 和 低延迟。o3-mini 已经在 ChatGPT 和 API 中上线,适用于广泛的企业和开发者场景。 -
Qwen2.5-Max:阿里通义千问推出的旗舰MoE模型
Qwen2.5-Max是阿里云推出的超大规模MoE模型,采用超过20万亿tokens的预训练数据,展现卓越性能。该模型在多个基准测试中超越DeepSeek V3、GPT-4o等领先AI,支持指令模型和基座模型。用户可通过Qwen Chat平台直接对话或调用API进行集成。 -
Qwen2.5-VL:阿里通义千问推出的开源AI视觉语言模型
Qwen2.5-VL是由阿里通义千问推出的一款视觉语言理解模型,结合了图像、视频和文本处理能力。它能够精准识别图像中的物体、提取视频关键事件,并执行动态推理任务。通过物体定位、结构化数据输出和多模态理解,Qwen2.5-VL广泛适用于安全监控、电子商务、文档解析等领域。 -
Janus-Pro:DeepSeek推出的开源AI模型,支持图像理解和图像生成
Janus-Pro是由DeepSeek推出的开源大一统模型,支持图像理解和图像生成,提供 1B 和 7B 两种规模,适配多元应用场景。它通过改进的训练策略、扩展的数据集和更大规模的模型,显著提升了文本到图像的生成能力和指令跟随性能。 -
Qwen2.5-1M:阿里推出的开源AI模型,支持100万Token上下文
Qwen2.5-1M是阿里巴巴Qwen团队发布的支持100万Token上下文的开源语言模型系列,包括Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。它们结合了基于vLLM的推理框架和稀疏注意力机制,显著提升了处理长文本时的速度和效率。该模型在长上下文任务中表现优异,特别是在密钥检索等复杂任务中,超越了之前的Qwen2.5-Turbo和GPT-4o-mi… -
豆包大模型1.5:字节跳动推出的新一代多模态AI大模型
豆包大模型1.5是字节跳动推出的新一代多模态AI大模型,涵盖多个版本,包括Doubao-1.5-pro、Doubao-1.5-lite、Doubao-1.5-vision-pro和实时语音模型。该模型在知识、代码、推理、中文等多个权威测评中表现优异,性能全球领先,适用于教育、开发和商业等多个领域。豆包大模型1.5采用稀疏MoE架构,优化推理效率,支持多模态和语音交互,推动AI技术创新与应用。 -
-
子曰-o1:网易有道推出的开源轻量级AI推理模型
子曰-o1是网易有道推出的国内首个支持分步讲解的轻量级推理模型,采用14B架构,专为消费级显卡设计,可高效运行。通过链式思维推理和自我纠错,模型输出详细的解题步骤,帮助用户掌握逻辑思路。 -
混元3D 2.0:腾讯混元发布的3D开源模型2.0版本
混元3D 2.0是腾讯混元推出的3D开源大模型2.0版本,旨在通过先进的AI技术,快速生成高质量的3D模型。对比1.0版本,2.0版本也依然同时支持文、图生3D的能力,并在生成效果上得到显著提升,在几何结构上更加精细,纹理色彩更加丰富,支持更精细、更逼真的3D内容创作。 -
K1.5:Kimi 最新推出的多模态思考模型
Kimi k1.5 是Kimi推出的最新多模态思考模型,专为解决复杂的推理任务而设计。作为一款集数学推理、代码生成、视觉推理和多模态数据分析于一体的高性能AI模型,k1.5在推理速度和准确性上取得了突破性进展,标志着AI推理技术的进一步提升。 -
Step-2 文学大师版:阶跃星辰推出的文学创作大语言模型
Step-2 文学大师版是阶跃星辰推出的一款高级语言模型,专为文学创作优化。基于 Step-2 模型,文学大师版具备深刻的文学理解和创作能力,能够生成富有个性、思想深度和语言凝练的文本作品。与传统AI写作工具不同,它能够避免空泛的内容,提供更具逻辑性和情感共鸣的创作。