-
谷歌7大模型22项AI大招轰炸!70秒视频生成、Gemini安卓合体、200万tokens上下文
5月15日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌干了一场AI硬仗!时长不到2小时的开幕式期间,谷歌CEO桑达尔·皮查伊携一众谷歌高管总共提到121次“AI”。谷歌DeepMind的联合创始人兼CEO戴密斯·哈萨比斯首次在I/O大会上发表演讲,顺序仅次于皮查伊,足见AI大模型已经成谷歌的头等大事。 在昨天OpenAI发动奇袭、推出干掉传统语音助手的旗舰模型GPT-4o后,作为“全球AI一哥+…- 1.4k
- 0
-
Imagen 3:谷歌推出的高质量文本到图像生成模型
Imagen 3 是 DeepMind 开发的最新文本到图像模型,它能够生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。该模型支持多种视觉风格,从照片般逼真到油画质感,以及黏土动画场景。- 6.5k
- 0
-
Veo - Google推出的视频模型,可生成1分钟1080p视频
Veo 是 Google DeepMind 开发的先进视频生成模型,能够生成1080p高分辨率、长时长的高质量视频。它支持广泛的电影和视觉风格,准确捕捉提示的细微差别,并提供创意控制。- 8.9k
- 0
-
用 AI 将自拍照 P 进不同艺术作品,谷歌发布“艺术自拍 2”
谷歌旗下“艺术与文化”应用今日宣布,2018 年推出的“艺术自拍”功能在时隔近六年后,借助生成式 AI 的力量回归。官方表示,“艺术自拍 2”将再次使用户与艺术面对面,重新探访世界各地的艺术、历史和文化,“让您成为焦点”。- 623
- 0
-
VideoPoet:Google发布的用于视频生成的大语言模型
VideoPoet是基于大语言模型(LLM)来实现视频生成的,即采用LLM的自回归架构。VideoPoet的一个特色是它将许多视频生成能力无缝集成到一个LLM中。下图展示了VideoPoet的能力,它可以实现文本生成视频,图像生成视频,视频风格化,视频的inpainting和outpainting以及视频转语音。- 4.4k
- 0
-
谷歌即将发布对话式人工智能软件Gemini 挑战OpenAI的GPT-4
据报道,谷歌即将发布其对话式人工智能软件 Gemini。这家科技巨头已经让一些选定的公司提前获得 Gemini 的早期版本,该版本旨在与 OpenAI 的 GPT-4模型竞争。- 723
- 0
-
NotebookLM:谷歌推出的优秀的AI笔记和研究助手
Google NotebookLM 是由谷歌推出的一款强大的基于AI的研究助手,旨在帮助用户快速总结信息和做笔记。它结合了 Gemini 2.0 AI 模型,具有多模态理解能力,可以处理多种输入形式,如PDF、网站、YouTube 视频、Google 文档等。用户上传资料后,NotebookLM 会迅速提供见解,突出关键信息,并为其提供清晰的引用来源。此外,NotebookLM 还具有音频概述功能…- 2.5k
- 0
-
谷歌推出新 AI 工具 Imagen Editor,一句话对图片二次创作
谷歌近日推出了名为 Imagen Editor 生成式 AI 工具,可以根据用户输入的文本要求,在现有图片基础上进行二次创作- 499
- 0
-
Magi-谷歌全新AI搜索引擎
根据《纽约时报》的报道,面对来自微软和 OpenAI 的竞争压力,谷歌正在积极开发由人工智能技术驱动的全新搜索引擎「Magi」,以及使用人工智能技术对现有的搜索引擎进行升级。 报道指出,三星正在考虑用微软的 Bing 取代 Google 作为其 Galaxy 系列设备的默认搜索引擎。Galaxy 设备包括了智能手机和平板电脑。三星是最大的 Android 设备制造商,每年生产数亿部搭载 Andro…- 4.9k
- 0