清影ai生视频
当前位置:首页>AI工具>MobileAgent-阿里发布的自主多模式移动设备代理

MobileAgent-阿里发布的自主多模式移动设备代理

MobileAgent是什么?

MobileAgent是阿里巴巴和北京交通大学开发的可以模拟人类操作手机的自主多模态AI代理。该项目利用人工智能技术,特别是在多模态大型语言模型(如GPT-4V)的应用,以实现移动设备代理的自主决策和交互。

MobileAgent-阿里发布的自主多模式移动设备代理

MobileAgent的主要特点

MobileAgent是一个纯视觉解决方案,不需要系统代码,而是通过分析图像来理解和操作手机。能够自主完成打开淘宝找帽子添加到购物车,播放音乐,自主使用导航APP等任务。

  • 纯可视化解决方案,独立于 XML 和系统元数据。
  • 操作范围不受限制,可进行多应用操作。
  • 多种视觉感知工具,用于操作定位。
  • 无需探索和培训,即插即用。

如何使用MobileAgent?

目前MobileAgent已经开源,你可以自己按需部署体验。

项目地址:https://github.com/X-PLUG/MobileAgent

笔灵AI论文写作
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
0 条回复 A文章作者 M管理员
    暂无评论内容
error: