-
Trae 重磅更新,支持 AI 编程 + 智能体 + MCP
近日, 字节跳动旗下 AI 编程工具 Trae 迎来重大更新,正式支持 AI 编程、智能体和 MCP(多智能体协作协议)功能,为开发者带来前所未有的高效开发体验。 核心亮点 AI 编程 + MCP 强强联合:Trae 现已支持通过自然语言描述直接生成代码和调用工具,实现“言出法随”的开发模式。开发者无需手动编写代码或配置工具,只需输入需求,Trae 即可自动完成从设计到开发的全流程。 智能体功能升…... -
百度推出心响App,打造手机端超级智能体产品
近日,百度正式上线一款全新 AI 应用——心响 App,定位为「AI 任务完成引擎」,致力于成为用户的“超级大脑 + 最强辅助”。区别于传统对话式助手,心响不仅能理解用户指令,还能智能拆解任务、动态执行操作并交付可视化结果,实现真正意义上的全流程托管式 AI 协作体验。 心响支持旅游规划、图表生成、定时提醒、儿童故事、恋爱对话模拟等多个高频场景,用户只需一句话,即可触发一整套智能工作流。目前 Ap…... -
字节跳动推出扣子空间,多AI智能体平台
2025年4月19日,字节跳动coze团队正式推出扣子空间,一个创新的AI协同办公平台,旨在让用户与AI Agent高效协作,完成各种复杂任务。扣子空间现已开启内测,为用户提供从问题解答到任务执行的全方位支持。 核心亮点 任务自动化:扣子空间能够自动分析用户需求,将其拆解为多个子任务,并自主调用浏览器、代码编辑器等工具执行任务,最终输出完整的任务报告,如网页、PPT、飞书文档等。 专家Agent生…... -
豆包1.5·深度思考模型发布,开启AI推理新时代
2025年4月17日,火山引擎在FORCE LINK AI创新巡展·杭州站上,正式发布豆包1.5·深度思考模型,标志着AI技术在推理和多模态交互领域迈入新阶段。该模型具备强大的推理能力、低延迟响应和多模态交互功能,能够处理复杂任务并广泛应用于多个领域。 核心亮点 强大推理能力:豆包1.5·深度思考模型在数学、代码、科学等专业领域表现出色,达到或接近全球第一梯队水平。它还具备优秀的泛化能力,能够胜任…... -
OpenAI 发布新一代推理模型:o3 和 o4-mini,支持图像深度思考和自主调用工具
2025 年 4 月 16 日,OpenAI 正式发布了其最新的人工智能推理模型——OpenAI o3和OpenAI o4-mini,标志着其AI推理能力的重大突破。这两款模型是 OpenAI o 系列的最新成果,代表了该公司在 AI 推理技术上的重大突破。 o3:强大的多模态推理模型 o3 是 OpenAI 目前最强大的推理模型,它在多个领域表现出色,包括数学、编程、科学和视觉感知。该模型能够独…... -
OpenAI 发布 GPT-4.1:支持百万上下文的多模态旗舰模型
2025 年 4 月 14 日,OpenAI 正式发布全新大模型系列 GPT-4.1,在代码能力、指令遵循、长上下文处理与多模态理解等多个维度实现跨代提升。该模型可通过 API 接入,支持最长 1,000,000 tokens 上下文窗口,并在图像、语音、文本处理方面实现高度统一。 此次发布包括 GPT-4.1 标准版、mini 和 nano 三个子型号,分别面向高性能、低延迟与极致轻量场景。官方…... -
阿里通义发布 LHM,一张照片生成完整可驱动的 3D 数字人
近日,阿里通义团队开源发布了全新 3D 人体建模框架 LHM,该模型只需一张正面照片,即可在数秒内生成完整可驱动的 3D 数字人,并支持跳舞、运动等多种动作驱动,适用于虚拟人、游戏角色、XR 场景等多类应用。 LHM 基于多模态 Transformer 架构与高斯球体建模技术,具备出色的外观重建、动作绑定与细节还原能力,尤其在人脸区域表现出极高的保真度。相比传统视频或多视角建模方案,LHM 无需复…... -
Meta 发布 Llama 4:支持图文理解、千万上下文,开源大模型再突破!
2025 年 4 月 6 日,Meta 正式发布了全新一代开源大语言模型 —— Llama 4,在多模态理解、上下文处理、推理能力和推理效率等多个维度实现重大飞跃。此次更新同时推出两大主力模型 Llama 4 Scout 和 Llama 4 Maverick,并预告了超大规模的教师模型 Llama 4 Behemoth。 Llama 4 有哪些亮点? 原生多模态能力:支持图文联合输入,可用于图像问…... -
Midjourney 推出 V7 Alpha:图像生成再进化,加入个性化与草稿模式
2025 年 4 月 4 日,知名 AI 生图平台 Midjourney 正式推出 V7 Alpha 测试版。此次更新在图像质量、生成速度、交互方式等方面均有突破,标志着 AI 图像生成工具正在朝着更高智能、更强可控性和更丰富表达能力的方向演进。 📌 主要更新内容 1. 图像质量全面提升 V7 模型在人物结构、面部细节、手部比例和纹理处理方面表现更好,生成图像更真实自然。用户反馈显示,V7 的视觉…... -
Amazon 发布 AI 智能体 Nova Act,革新网页操作和任务自动化
2025年3月31日,Amazon正式发布其最新研发的AI智能体应用 Nova Act,这款智能体具备操控网页浏览器的能力,能够模拟人类在网络环境中的各种操作任务,包括点击、填写表单、选择日期、提交信息等。Nova Act 是 Amazon 在通用人工智能(AGI)领域的重要一步,标志着其在智能体技术的布局进入新阶段。 Nova Act 由 Amazon AGI Lab开发,背后团队由前OpenA…... -
智谱发布Agent产品AutoGLM沉思,可以像人类一样边想边干
2025年03月31日,智谱 AI 正式推出新一代智能体产品 —— AutoGLM 沉思,定位为“可自主思考并执行任务”的 AI Agent。该产品具备类人推理能力,能够在处理复杂问题时一边思考、一边搜索、一边生成内容,实现真正意义上的“边想边干”。... -
豆包新版深度思考开启测试,支持边想边搜
2025年3月28日,字节跳动旗下智能助手“豆包”宣布其全新“深度思考”功能正式进入测试阶段。此次升级显著强化了AI的推理与搜索能力,首次实现“边想边搜”的智能体验。 新版豆包通过将“思维链”与搜索引擎深度融合,可在思考过程中多轮调用工具与搜索信息,从而提供更为精准与完整的答案。无论是制定清明出游方案、撰写专业论文,还是在模糊条件下寻找信息,豆包都能进行多轮推理与交叉验证,提升整体智能表现。 例如…... -
昆仑万维发布Mureka O1,全球首款音乐推理大模型
2025年3月26日,昆仑万维正式发布了全球首款音乐推理大模型——Mureka O1,以及其基座模型Mureka V6。这一创新成果标志着中国在AI音乐领域的技术突破,再次领跑全球。 核心亮点 全球首款音乐推理大模型:Mureka O1引入了业界首创的MusiCoT技术,利用思维链(Chain-of-Thought)方法,在生成音乐前预生成整体音乐结构,大幅提升音乐的结构连贯性和乐器编排精准度。 …... -
OpenAI GPT-4o 多模态图像生成功能正式上线
2025年3月26日,OpenAI 宣布其最新的 GPT-4o 模型的多模态图像生成功能正式上线。这一功能标志着图像生成技术的重大进步,提供了一个高质量、高自由度的图像生成解决方案。 主要特性 原生多模态支持:GPT-4o 原生支持端到端的语音和图像输入输出,增强了模型的多模态交互能力。 高质量图像生成:用户可以通过简单的文本提示生成高质量、逼真的图像,甚至进行图像的多轮对话修改。 灵活性和控制力…... -
谷歌推出 Gemini 2.5 Pro,具备高级推理能力的多模态 AI 模型
2025年03月25日,谷歌推出了 Gemini 2.5 Pro,具备高级推理能力的多模态 AI 模型,支持文本、图像、音频和视频等多种输入形式。该模型上下文窗口达到 100 万 token,显著提升了长上下文处理和多模态理解的性能。 主要特性 增强推理能力:提升复杂任务的处理准确性。 顶尖性能:在多个基准测试中处于领先地位。 高级编码:在代码生成、转换和智能体任务方面表现出色。 原生多模态:处理…...