-
昆仑万维发布Mureka O1,全球首款音乐推理大模型
2025年3月26日,昆仑万维正式发布了全球首款音乐推理大模型——Mureka O1,以及其基座模型Mureka V6。这一创新成果标志着中国在AI音乐领域的技术突破,再次领跑全球。 核心亮点 全球首款音乐推理大模型:Mureka O1引入了业界首创的MusiCoT技术,利用思维链(Chain-of-Thought)方法,在生成音乐前预生成整体音乐结构,大幅提升音乐的结构连贯性和乐器编排精准度。 …... -
OpenAI GPT-4o 多模态图像生成功能正式上线
2025年3月26日,OpenAI 宣布其最新的 GPT-4o 模型的多模态图像生成功能正式上线。这一功能标志着图像生成技术的重大进步,提供了一个高质量、高自由度的图像生成解决方案。 主要特性 原生多模态支持:GPT-4o 原生支持端到端的语音和图像输入输出,增强了模型的多模态交互能力。 高质量图像生成:用户可以通过简单的文本提示生成高质量、逼真的图像,甚至进行图像的多轮对话修改。 灵活性和控制力…... -
谷歌推出 Gemini 2.5 Pro,具备高级推理能力的多模态 AI 模型
2025年03月25日,谷歌推出了 Gemini 2.5 Pro,具备高级推理能力的多模态 AI 模型,支持文本、图像、音频和视频等多种输入形式。该模型上下文窗口达到 100 万 token,显著提升了长上下文处理和多模态理解的性能。 主要特性 增强推理能力:提升复杂任务的处理准确性。 顶尖性能:在多个基准测试中处于领先地位。 高级编码:在代码生成、转换和智能体任务方面表现出色。 原生多模态:处理…... -
Trae 支持配置 DeepSeek V3 最新版,升级你的编程体验
2025年3月25日,字节跳动旗下AI编程工具 Trae 宣布支持配置 DeepSeek V3 最新版本(DeepSeek-V3–0324),为开发者带来更强大的 AI 编程体验。 Trae 是国内首个 AI 原生 IDE,深度理解中文开发场景,为开发者提供流畅、准确、优质的开发体验。其核心功能包括代码补全、错误修复、AI 刷题等,旨在提升开发效率和代码质量。 DeepSeek V3 最新版本 模…... -
阿里发布Qwen2.5-VL-32B-Instruct,性能超越72B前代版本
2025年03月25日,阿里通义千问团队正式开源Qwen2.5-VL-32B-Instruct多模态大模型,该模型在多项基准测试中展现出超越前代72B版本的卓越性能,引发业界广泛关注。 核心亮点: 性能突破:32B参数版本在MMMU(多模态理解)、MathVista(数学+视觉)等权威测试中,多项指标超越72B前代模型,同时领先Mistral-24B、Gemma-27B等同规模竞品。 三大核心能力…... -
DeepSeek 发布 V3 模型更新,编程能力大幅提升并采用更宽松的开源协议
2025年3月24日,DeepSeek发布了其V3模型的更新版本。此次更新并非是期待中的V4或R2版本,而是对V3模型的一次小版本升级。尽管如此,这一更新仍带来了显著的性能提升和更灵活的开源协议,为开发者和用户带来了诸多惊喜。 用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。 核心更新亮点 推理任务表现提高 强化学习技术:新版 V3 模型借鉴了…... -
百度「秒哒」全量上线,开启无代码应用开发新时代
2025年3月24日,在百度 AI Day 上,百度正式宣布其生成式应用开发平台「秒哒」全量上线。这一创新平台旨在通过无代码编程技术,让任何人都能通过自然语言交互轻松搭建应用,实现“代码平权”和“技术平权”。 核心功能亮点 无代码编程:用户无需编写代码,仅需通过自然语言描述需求,即可快速生成应用。秒哒支持多轮修改,用户可在生成后继续对话提出修改建议,即时查看修改效果。 多智能体协作:秒哒内置需求收…... -
全球首个体重管理AI大模型“减单”发布
近日,安徽医科大学联合中国科学技术大学附属第一医院及健康科技企业,在合肥正式发布全球首个体重管理AI大模型智能助手“减单”。这一创新成果旨在借助先进的人工智能技术,提升减重干预的个性化与诊疗效率,助力全民健康管理。 核心功能亮点 高效健康档案生成:通过与患者的互动,“减单”可在30秒内生成结构化的全周期健康画像,涵盖基础信息、患病史、肥胖史及饮食偏好等,极大节省了医生收集信息的时间。 智能食物识别…... -
天猫推出AI设计工具“家作”,助力商家高效生成媲美实拍场景图
2025年3月20日,天猫在上海AWE2025展上发布了电商行业首款AI设计工具“家作”,并进行了全新升级。这款工具专注于服务家装、家居、家电行业的商家,能够一键生成多种风格的场景图,并支持AI模特展示功能。 功能亮点 AI棚拍:上传商品图片,选择风格,一键生成多种场景图,快速提升商品展示效果。 AI模特:输入描述或参考图,生成逼真AI模特展示图,替代传统模特拍摄,节省成本。 AI抠图:一键精准提…... -
腾讯混元自研深度思考模型「T1」正式发布
2025年3月21日,腾讯正式推出其自研深度思考模型「混元T1」。这款模型以其强大的推理能力和高效的处理速度,标志着腾讯在人工智能领域的新突破。 核心亮点 推理能力卓越:混元T1在多项基准测试中表现出色,如在大语言模型评估增强数据集MMLU-PRO中取得87.2分,仅次于行业领先模型o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理测试中,成绩也达到业界领先水平…... -
腾讯混元开源5个3D生成模型,加速3D创作与应用落地
2025年3月18日,腾讯宣布开源其最新的5个3D生成模型,这些模型均基于Hunyuan3D-2.0打造,进一步推动了3D内容创作的效率和质量提升。... -
Trae功能上新:支持自定义主题,你的专属智能开发环境来了
厌倦了千篇一律的编辑器配色?字节跳动AI编程工具Trae功能上新,期待已久的自定义主题功能终于来了! 无论海量的社区主题,还是从VS code导入旧爱主题,都能让你的开发体验更加个性化。无论是极简控还是炫彩党,这里都能满足你的审美需求。只需几分钟,让你的代码界面从此与众不同! 3 秒直达主题设置面板 两种方式,秒速开启个性化之旅: 快捷键党专属: Mac:cmd k+cmd t Windows:c…... -
Skywork R1V-昆仑万维开源的多模态视觉推理模型
2025年3月18日,昆仑万维正式开源了其首款多模态视觉思维链推理模型 Skywork R1V,标志着多模态思考新时代的到来。Skywork R1V 是一款专注于通过多步逻辑推理解决复杂视觉任务的模型,能够处理视觉逻辑推理、数学问题、科学现象分析等多种任务。 核心技术亮点 文本推理能力的多模态高效迁移:通过视觉投影器,无需重新训练语言模型和视觉编码器,即可将文本推理能力高效迁移到视觉任务中,同时保…... -
百度发布文心大模型4.5,开启多模态智能新时代
2025年3月16日,百度正式推出新一代原生多模态基础大模型——文心大模型4.5,并在文心一言官网免费开放。作为百度在人工智能领域的最新成果,文心大模型4.5凭借其卓越的多模态理解能力和全面升级的语言能力,为智能应用带来了新的突破。 文心大模型4.5通过多个模态联合建模,实现了协同优化,能够对文字、图片、音频、视频等多种内容进行综合理解。它不仅在多模态理解方面表现出色,还在语言理解、生成、逻辑推理…... -
MarsCode更新:一键Apply功能上线JetBrains
2025年3月13日,北京引力弹弓科技有限公司旗下的 MarsCode编程助手 宣布,其全新功能 一键Apply 正式上线 JetBrains 开发工具。 MarsCode 是一款基于豆包大模型打造的智能编程助手,专注于为开发者提供代码补全、错误修复、AI刷题等多种功能。此次推出的一键Apply功能,进一步提升了开发效率。 功能亮点: 智能定位:AI自动解析代码上下文,精准识别目标文件路径。 Di…...