全部标签

AI资讯

Trae 重磅更新，支持 AI 编程 + 智能体 + MCP

近日，字节跳动旗下 AI 编程工具 Trae 迎来重大更新，正式支持 AI 编程、智能体和 MCP（多智能体协作协议）功能，为开发者带来前所未有的高效开发体验。核心亮点 AI 编程 + MCP 强强联合：Trae 现已支持通过自然语言描述直接生成代码和调用工具，实现“言出法随”的开发模式。开发者无需手动编写代码或配置工具，只需输入需求，Trae 即可自动完成从设计到开发的全流程。智能体功能升…...
- 4月23日
百度推出心响App，打造手机端超级智能体产品

近日，百度正式上线一款全新 AI 应用——心响 App，定位为「AI 任务完成引擎」，致力于成为用户的“超级大脑 + 最强辅助”。区别于传统对话式助手，心响不仅能理解用户指令，还能智能拆解任务、动态执行操作并交付可视化结果，实现真正意义上的全流程托管式 AI 协作体验。心响支持旅游规划、图表生成、定时提醒、儿童故事、恋爱对话模拟等多个高频场景，用户只需一句话，即可触发一整套智能工作流。目前 Ap…...
- 4月22日
字节跳动推出扣子空间，多AI智能体平台

2025年4月19日，字节跳动coze团队正式推出扣子空间，一个创新的AI协同办公平台，旨在让用户与AI Agent高效协作，完成各种复杂任务。扣子空间现已开启内测，为用户提供从问题解答到任务执行的全方位支持。核心亮点任务自动化：扣子空间能够自动分析用户需求，将其拆解为多个子任务，并自主调用浏览器、代码编辑器等工具执行任务，最终输出完整的任务报告，如网页、PPT、飞书文档等。专家Agent生…...
- 4月19日
豆包1.5·深度思考模型发布，开启AI推理新时代

2025年4月17日，火山引擎在FORCE LINK AI创新巡展·杭州站上，正式发布豆包1.5·深度思考模型，标志着AI技术在推理和多模态交互领域迈入新阶段。该模型具备强大的推理能力、低延迟响应和多模态交互功能，能够处理复杂任务并广泛应用于多个领域。核心亮点强大推理能力：豆包1.5·深度思考模型在数学、代码、科学等专业领域表现出色，达到或接近全球第一梯队水平。它还具备优秀的泛化能力，能够胜任…...
- 4月18日
OpenAI 发布新一代推理模型：o3 和 o4-mini，支持图像深度思考和自主调用工具

2025 年 4 月 16 日，OpenAI 正式发布了其最新的人工智能推理模型——OpenAI o3和OpenAI o4-mini，标志着其AI推理能力的重大突破。这两款模型是 OpenAI o 系列的最新成果，代表了该公司在 AI 推理技术上的重大突破。 o3：强大的多模态推理模型 o3 是 OpenAI 目前最强大的推理模型，它在多个领域表现出色，包括数学、编程、科学和视觉感知。该模型能够独…...
- 4月17日
OpenAI 发布 GPT-4.1：支持百万上下文的多模态旗舰模型

2025 年 4 月 14 日，OpenAI 正式发布全新大模型系列 GPT-4.1，在代码能力、指令遵循、长上下文处理与多模态理解等多个维度实现跨代提升。该模型可通过 API 接入，支持最长 1,000,000 tokens 上下文窗口，并在图像、语音、文本处理方面实现高度统一。此次发布包括 GPT-4.1 标准版、mini 和 nano 三个子型号，分别面向高性能、低延迟与极致轻量场景。官方…...
- 4月15日
阿里通义发布 LHM，一张照片生成完整可驱动的 3D 数字人

近日，阿里通义团队开源发布了全新 3D 人体建模框架 LHM，该模型只需一张正面照片，即可在数秒内生成完整可驱动的 3D 数字人，并支持跳舞、运动等多种动作驱动，适用于虚拟人、游戏角色、XR 场景等多类应用。 LHM 基于多模态 Transformer 架构与高斯球体建模技术，具备出色的外观重建、动作绑定与细节还原能力，尤其在人脸区域表现出极高的保真度。相比传统视频或多视角建模方案，LHM 无需复…...
- 4月8日
Meta 发布 Llama 4：支持图文理解、千万上下文，开源大模型再突破！

2025 年 4 月 6 日，Meta 正式发布了全新一代开源大语言模型 —— Llama 4，在多模态理解、上下文处理、推理能力和推理效率等多个维度实现重大飞跃。此次更新同时推出两大主力模型 Llama 4 Scout 和 Llama 4 Maverick，并预告了超大规模的教师模型 Llama 4 Behemoth。 Llama 4 有哪些亮点？原生多模态能力：支持图文联合输入，可用于图像问…...
- 4月6日
Midjourney 推出 V7 Alpha：图像生成再进化，加入个性化与草稿模式

2025 年 4 月 4 日，知名 AI 生图平台 Midjourney 正式推出 V7 Alpha 测试版。此次更新在图像质量、生成速度、交互方式等方面均有突破，标志着 AI 图像生成工具正在朝着更高智能、更强可控性和更丰富表达能力的方向演进。 📌 主要更新内容 1. 图像质量全面提升 V7 模型在人物结构、面部细节、手部比例和纹理处理方面表现更好，生成图像更真实自然。用户反馈显示，V7 的视觉…...
- 4月5日
Amazon 发布 AI 智能体 Nova Act，革新网页操作和任务自动化

2025年3月31日，Amazon正式发布其最新研发的AI智能体应用 Nova Act，这款智能体具备操控网页浏览器的能力，能够模拟人类在网络环境中的各种操作任务，包括点击、填写表单、选择日期、提交信息等。Nova Act 是 Amazon 在通用人工智能（AGI）领域的重要一步，标志着其在智能体技术的布局进入新阶段。 Nova Act 由 Amazon AGI Lab开发，背后团队由前OpenA…...
- 4月1日
智谱发布Agent产品AutoGLM沉思，可以像人类一样边想边干

2025年03月31日，智谱 AI 正式推出新一代智能体产品 —— AutoGLM 沉思，定位为“可自主思考并执行任务”的 AI Agent。该产品具备类人推理能力，能够在处理复杂问题时一边思考、一边搜索、一边生成内容，实现真正意义上的“边想边干”。...
- 3月31日
豆包新版深度思考开启测试，支持边想边搜

2025年3月28日，字节跳动旗下智能助手“豆包”宣布其全新“深度思考”功能正式进入测试阶段。此次升级显著强化了AI的推理与搜索能力，首次实现“边想边搜”的智能体验。新版豆包通过将“思维链”与搜索引擎深度融合，可在思考过程中多轮调用工具与搜索信息，从而提供更为精准与完整的答案。无论是制定清明出游方案、撰写专业论文，还是在模糊条件下寻找信息，豆包都能进行多轮推理与交叉验证，提升整体智能表现。例如…...
- 3月29日
昆仑万维发布Mureka O1，全球首款音乐推理大模型

2025年3月26日，昆仑万维正式发布了全球首款音乐推理大模型——Mureka O1，以及其基座模型Mureka V6。这一创新成果标志着中国在AI音乐领域的技术突破，再次领跑全球。核心亮点全球首款音乐推理大模型：Mureka O1引入了业界首创的MusiCoT技术，利用思维链（Chain-of-Thought）方法，在生成音乐前预生成整体音乐结构，大幅提升音乐的结构连贯性和乐器编排精准度。 …...
- 3月26日
OpenAI GPT-4o 多模态图像生成功能正式上线

2025年3月26日，OpenAI 宣布其最新的 GPT-4o 模型的多模态图像生成功能正式上线。这一功能标志着图像生成技术的重大进步，提供了一个高质量、高自由度的图像生成解决方案。主要特性原生多模态支持：GPT-4o 原生支持端到端的语音和图像输入输出，增强了模型的多模态交互能力。高质量图像生成：用户可以通过简单的文本提示生成高质量、逼真的图像，甚至进行图像的多轮对话修改。灵活性和控制力…...
- 3月26日
谷歌推出 Gemini 2.5 Pro，具备高级推理能力的多模态 AI 模型

2025年03月25日，谷歌推出了 Gemini 2.5 Pro，具备高级推理能力的多模态 AI 模型，支持文本、图像、音频和视频等多种输入形式。该模型上下文窗口达到 100 万 token，显著提升了长上下文处理和多模态理解的性能。主要特性增强推理能力：提升复杂任务的处理准确性。顶尖性能：在多个基准测试中处于领先地位。高级编码：在代码生成、转换和智能体任务方面表现出色。原生多模态：处理…...
- 3月26日