AIHub 消息,昨天,NVIDIA GTC 大会如期而至。在大会上,英伟达创始人兼 CEO 黄仁勋介绍了 Omniverse(全宇宙)战略的最新进展,并发布了旨在生成逼真交互式 AI 数字化身的 Omniverse Avatars 平台。
其实,英伟达在 2020 年 10 月就开始测试面向企业的实时仿真模拟和协作平台 Omniverse,并在今年 4 月的 GTC 春季大会推出正式版本。
在当时,媒体已经纷纷将这个虚拟工作平台称为“工程师的元宇宙”,包括宝马、爱立信、沃尔沃和 Adobe 等众多公司都有采用 Omniverse。
黄仁勋曾将 Omniverse 描述成 “一款将 3D 世界连接至共享虚拟世界的平台”,并宣称它是未来数字孪生技术的基础。
在昨晚的 GTC 秋季大会,黄仁勋进一步扩展了 Omniverse 概念,并正式推出 Omniverse Avatar 和 Ominiverse Replicator。
前者旨在帮助开发者通过英伟达的 Omniverse 平台创建可以理解真人自然说话意图的交互式虚拟角色,而后者则是一种用于训练深度神经网络的合成数据生成引擎,从而提供创建训练 AI 所需的大量数据。Ominiverse Replicator 主要面向通用机器人和自动驾驶汽车。
另外,Omniverse 同时新增了英伟达早前发布的一系列 AR/VR 功能。
1. Omniverse Avatar
Omniverse Avatar 是 NVIDIA Omniverse 的一部分,这是一个用于 3D 工作流程的虚拟世界模拟和协作平台,目前处于公开测试阶段,拥有超过 70,000 名用户。
Omniverse Avatar 所使用的语音技术、计算机视觉、自然语言理解、推荐引擎、面部动画和图像元素,通过以下技术实现:
语音识别:基于 NVIDIA Riva。这个软件开发工具包可以识别多种语言的语音。Riva 还可通过文本语音转换功能生成接近真人的语音反馈。
自然语言理解:基于 Megatron 530B 大型语言模型。该模型可以识别、理解和生成人类语言。Megatron 530B 是一个预训练模型,它可以在很少或没有训练的情况下完成句子、回答主题广泛的问题、总结长而复杂的故事、翻译成其他语言,并应对许多它未接受过专门训练的情景。
推荐引擎:由 NVIDIA Merlin 提供。该框架使企业可以建立能够处理大量数据的深度学习推荐系统,以提出更明智的建议。
感知功能:来自用于视频分析的计算机视觉框架——NVIDIA Metropolis。
虚拟形象动画:由 AI 赋能的 2D 和 3D 面部动画和渲染技术——NVIDIA Video2Face 和 Audio2Face 驱动。
所述技术都集成在一个应用,并使用英伟达统一计算框架进行实时处理。在打包成可扩展、自定义微服务后,它们将能够通过 NVIDIA Fleet Command 在多个地点安全地部署、管理和协调。
英伟达指出,Omniverse Avatar 为 AI 助手的创建开辟了道路,而且可以根据各个行业的需求轻松定制。例如,AI 助手可以帮助处理数十亿次日常客户服务互动,比如餐厅订单,银行交易,个人预约和预订等,带来更多商机并提升客户满意度。
黄仁勋表示:“智能虚拟助手的前景一片光明。Omniverse Avatar 将我们的基础图像、模拟和 AI 技术结合在一起,打造出一些有史以来最复杂的实时应用。协作机器人和虚拟助手的案例令人难以置信,影响深远。”
在 NVIDIA GTC 的主题演讲中,黄仁勋分享了Omniverse Avatar 的各种示例:
用于客户支持的 Project Tokkio;
用于始终在线的车辆智能服务的 NVIDIA DRIVE Concierge;
用于视频会议的 Project Maxine。
在 Project Tokkio 的第一个演示中,黄仁勋向同事展示了与一个被制作成他自己的玩具复制品的虚拟形象进行实时对话——谈论生物学和气候科学等话题。
在第二个 Project Tokkio 演示中,他突出显示了餐厅售货亭中的客户服务化身,当他们订购素食汉堡、薯条和饮料时,他能够看到、交谈并理解两位顾客。演示由英伟达人工智能软件和Megatron 530B 提供支持,Megatron 530B 目前是世界上最大的可定制语言模型。
在 DRIVE Concierge AI 平台的演示中,仪表板中央屏幕上的数字助理帮助驾驶员选择最佳驾驶模式以准时到达目的地,然后按照他的要求设置汽车行驶里程低于 100 英里时的提醒。
另外,黄仁勋展示了 Project Maxine 将最先进的视频和音频功能添加到虚拟协作和内容创建应用程序的能力。
在嘈杂的咖啡馆中,视频通话中显示了一名讲英语的人,但可以在没有背景噪音的情况下清晰地听到。当她说话时,她的话会被实时转录并翻译成德语、法语和西班牙语,并使用与她相同的声音和语调。
Maxine使用计算机视觉来追踪人的面部,并识别其表情,3D动画可为其制作虚拟而逼真的头像。
可以想象,在企业和开发人员中,每个行业都需要某种形式的虚拟化身。
使用Omniverse Avatar平台,你可以为视频会议和协作平台、客户支持平台、内容创建、应用收益和数字孪生、机器人应用等等构建定制的AI助理。
NVIDIA的虚拟世界模拟Omniverse是打造虚拟世界的关键平台。从机器人、自动驾驶车队、仓库、工业厂房到整个城市,都能在Omniverse数字孪生中完成创建、训练和运行。
黄仁勋说,Omniverse面向数据中心规模设计,有朝一日有望能达到全球数据规模。
爱立信正构建整个城市的数字孪生环境,帮助确定如何放置和配置每个站点以获得最佳覆盖范围和网络性能,可对整个5G网络执行逼真远程仿真。
2. 通往虚拟世界的新门户
英伟达指出,Omniverse 平台将充当物理级准确的 3D 虚拟世界的结缔组织,并将获得 AR、VR 和多 GPU 渲染等新功能。
当然,Omniverse 主要是新增英伟达早前发布过的一系列 AR/VR 功能,包括:
NVIDIA CloudXR:这个企业级沉浸式串流框架已经集成到 Omniverse Kit(用于构建原生 Omniverse 应用和微服务的工具包),允许用户以交互方式将 Omniverse 体验串流至他们的移动 AR 和 VR 设备。
Omniverse VR:领先的完全图像、实时光线追踪 VR,可支持开发者在平台上构建自己的 VR 工具,而最终用户可以直接享受 VR 功能。
Omniverse Remote:提供 AR 功能和虚拟摄像头,支持设计师查看通过 iOS 和 Android 设备全光线追踪的 asset。
乘着 AI、高性能计算和元宇宙的东风,NVIDIA 今年过得可谓风生水起,市值一路扶摇直上,突破 7700 亿美元。其 Omniverse 平台更是被分析机构视作 NVIDIA 一项重要的平台扩张战略。
在这表面风光的背后,NVIDIA 的远见和前瞻性不容小觑。无论是如火如荼的 AI,还是方兴未艾的虚拟世界,NVIDIA 能成为科技热潮的直接受益者,都离不开过去多年对其软硬件产品的打磨。
此次 NVIDIA GTC 大会期间,我们还将看到更多覆盖深度学习、数据科学、高性能计算、机器人等领域的最新进展,而始于 NVIDIA CUDA 的加速计算正在这些领域催化效率提升,推动现代科技快速进化、走向未来。
参考链接:
-
https://nvidianews.nvidia.com/news/nvidia-announces-platform-for-creating-ai-avatars
-
https://www.youtube.com/watch?v=jhDiaUL_RaM&t=787s
关于 NVIDIA
NVIDIA 于 1999 年发明的 GPU 引发了 PC 游戏市场的增长,并重新定义了现代计算机图形、高性能计算和人工智能。该公司在加速计算和人工智能方面的开创性工作正在重塑价值数万亿美元的行业,例如运输、医疗保健和制造业,并推动许多其他行业的发展。
- Facebook正式改名Meta,扎克伯格All in元宇宙,开启新征程;
- 微软加入元宇宙大战:将Mesh直接植入Teams中,将不同元宇宙粘合起来;
- 中科深智完成B轮融资,利用AI技术打造元宇宙内容生产中台。
-
全球第一!阿里达摩院AI训练模型M6参数破10万亿,远超谷歌、微软; - 微软宣布推出Azure OpenAI服务,为开发者带来GPT-3模型,帮助企业建构更聪明的应用;
- 全球最大规模人工智能巨量模型 “源1.0”正式开源!2457 亿模型参数,超越美国GPT-3模型。
3.AI人物:
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。