0

0

苹果新AI模型实现端侧GUI智能 性能超大型模型24倍

絕刀狂花

絕刀狂花

发布时间:2026-02-22 20:33:21

|

719人浏览过

|

来源于php中文网

原创

近日,外媒消息称,苹果科研团队已成功研发出一款名为ferret-ui lite的新型端侧人工智能代理。该轻量级模型可直接在终端设备上部署运行,并能依据用户指令,自主操作各类应用程序的图形界面(gui)。

苹果新AI模型实现端侧GUI智能 性能超大型模型24倍

据CNMO获悉,该项目是苹果在多模态大语言模型领域,尤其是Ferret系列持续深耕的重要成果。早在2023年末,苹果便推出了基础模型“FERRET”,旨在赋予AI对图像中局部区域的理解能力。随后,团队进一步推出专为移动UI理解优化的Ferret-UI,以及升级版Ferret-UI 2。尽管这些早期模型功能全面,但参数量庞大,主要面向服务器端部署。

苹果新AI模型实现端侧GUI智能 性能超大型模型24倍

而本次发布的Ferret-UI Lite则聚焦于效率与精简——它仅含30亿参数,核心使命是在算力与内存受限的终端设备(如智能手机)上,高效执行GUI交互任务。

星绘
星绘

豆包旗下 AI 写真、P 图、换装和视频生成

下载

研究团队指出,当前主流GUI代理普遍依赖参数量巨大的基础模型。这类模型虽具备较强的推理与任务规划能力,却因体积臃肿、计算开销高,难以实现在设备本地稳定运行。为突破这一瓶颈,Ferret-UI Lite融合多项创新设计,达成性能与轻量化的协同优化。其中关键一环是“实时区域裁剪与动态放大”机制:模型首先对整屏内容进行粗粒度分析,识别关键区域后,自动裁切并放大该区域,再进行精细化语义解析。此举显著缓解了小规模模型处理高分辨率界面图像时的信息捕捉压力。

苹果新AI模型实现端侧GUI智能 性能超大型模型24倍

实测数据显示,尽管参数量大幅缩减,Ferret-UI Lite在多项标准GUI理解与操作基准测试中,性能表现不仅媲美主流竞品,甚至超越参数规模达其24倍的同类大模型。其优势尤为体现在短周期、低复杂度的界面操作任务中。虽然在需多步协同、逻辑嵌套较深的长程交互场景中尚存提升空间,但作为完全离线运行的端侧AI代理,它带来了根本性价值:所有界面感知、指令解析与操作决策均在设备本地闭环完成,无需任何数据上传云端,从而从源头保障用户隐私与敏感信息的安全。

据悉,区别于此前主要基于iPhone截图开展验证的版本,Ferret-UI Lite的训练与评估工作主要依托Android系统、网页端及桌面级GUI环境展开。这一选择或受当前主流GUI自动化测试平台生态分布影响,同时也侧面印证了该模型在跨操作系统、跨设备形态场景下的适配潜力与泛化能力。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
android开发三大框架
android开发三大框架

android开发三大框架是XUtil框架、volley框架、ImageLoader框架。本专题为大家提供android开发三大框架相关的各种文章、以及下载和课程。

324

2023.08.14

android是什么系统
android是什么系统

Android是一种功能强大、灵活可定制、应用丰富、多任务处理能力强、兼容性好、网络连接能力强的操作系统。本专题为大家提供android相关的文章、下载、课程内容,供大家免费下载体验。

1793

2023.08.22

android权限限制怎么解开
android权限限制怎么解开

android权限限制可以使用Root权限、第三方权限管理应用程序、ADB命令和Xposed框架解开。详细介绍:1、Root权限,通过获取Root权限,用户可以解锁所有权限,并对系统进行自定义和修改;2、第三方权限管理应用程序,用户可以轻松地控制和管理应用程序的权限;3、ADB命令,用户可以在设备上执行各种操作,包括解锁权限;4、Xposed框架,用户可以在不修改系统文件的情况下修改应用程序的行为和权限。

2104

2023.09.19

android重启应用的方法有哪些
android重启应用的方法有哪些

android重启应用有通过Intent、PendingIntent、系统服务、Runtime等方法。本专题为大家提供Android相关的文章、下载、课程内容,供大家免费下载体验。

280

2023.10.18

Android语音播放功能实现方法
Android语音播放功能实现方法

实现方法有使用MediaPlayer实现、使用SoundPool实现两种。可以根据具体的需求选择适合的方法进行实现。想了解更多语音播放的相关内容,可以阅读本专题下面的文章。

376

2024.03.01

iPhone文本消息乱序错误如何解决?
iPhone文本消息乱序错误如何解决?

解决办法:1、强制关闭消息应用程序;2、重启你的iPhone;3、自动禁用设置并再次启用;4、关闭iMessage并重新打开;5、重置所有设置;6、使用ReiBoot修复iOS。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

378

2024.11.19

删除iPhone上所有照片的方法
删除iPhone上所有照片的方法

删除iPhone上所有照片的方法;1、删除整个照片库;2、从相册中删除所有照片;3、仅从图库中删除照片;4、仅删除视频,屏幕截图,自拍,实时或人像照片;5、删除某人的所有照片;6、永久删除已删除的照片等等。想了解更多相关的内容,请阅读专题下面的文章。

921

2024.12.11

iPhone静音开关不起作用
iPhone静音开关不起作用

若 iPhone 静音开关失效,先检查硬件,看开关状态、清洁缝隙。接着重启手机,查看静音及勿扰模式设置,更新系统。若都不行,可恢复出厂设置(提前备份)。若仍无效,可能是严重硬件问题,需联系苹果客服或去授权维修中心。

180

2025.03.20

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1030

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
swift开发文档
swift开发文档

共33课时 | 24.1万人学习

Mac PHP开发工具与环境搭建
Mac PHP开发工具与环境搭建

共8课时 | 1.8万人学习

极客学院Swift语言视频教程
极客学院Swift语言视频教程

共40课时 | 13.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号