12月13日最新消息,有用户反馈称:“豆包手机助手通过read_frame_buffer权限,直接从gpu渲染的图形缓冲区提取图像数据,绕过了系统上层的截图api;同时还启用了capture_secure_video_output权限,理论上可获取银行类应用的安全键盘等受保护界面内容。”
对此,豆包手机助手官方回应指出,上述说法是对产品技术实现机制的误读。 实际上,该应用调用的是Android系统原生截屏接口,并严格尊重应用所设置的Secure标记——这意味着它完全无法捕获银行APP等明确声明为安全保护的界面内容。
任何已安装豆包手机助手技术预览版的用户,均可自行开发一个包含Secure页面的测试APK,再通过AI对该页面进行内容解析,即可直观验证:AI确实无法识别或读取该类受保护界面。
关于网友提及的READ_FRAME_BUFFER权限,其真实用途在于支持AI在后台持续运行操作逻辑。具体而言,豆包手机助手将第三方应用置于虚拟屏幕空间中运行,以实现更灵活的交互调度。

立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
为获取虚拟屏内运行应用的实时画面(对应系统接口WindowManagerService.captureDisplay),并将其输入至豆包大模型进行视觉推理,需申请READ_FRAME_BUFFER权限。但需明确说明:该接口及对应权限均无法突破Android系统的Secure保护机制,对银行类APP等设置了Secure标志的应用界面依然无访问能力。
至于CAPTURE_SECURE_VIDEO_OUTPUT权限,则是为解决一个显示兼容性问题:当受保护页面投射到虚拟屏(例如点击灵动岛后出现的带粉色边框的应用窗口)时,默认会呈现为黑屏,导致用户无法查看与操作。启用该权限后,可确保此类内容正常显示并支持用户交互;但关键在于,投影后的页面依旧保留Secure标记,仅限用户肉眼可见,系统层面仍禁止任何形式的截屏或图像采集。
豆包手机助手实现手机自动化操作的核心流程如下:用户发出指令 → 客户端截取当前屏幕 → 图像上传至云端豆包大模型 → 模型完成视觉理解并返回操作建议 → 手机端执行对应动作 → 循环重复直至任务闭环。整个过程每步间隔约3秒,依赖连续截图与云端分析。
由于支撑界面理解所需的大模型参数量庞大,受限于当前移动芯片算力,尚不具备端侧部署条件,因此必须采用“截图上传—云端推理—指令下发”的架构。事实上,国内多家主流手机厂商推出的具备AI操控能力的智能助手产品,均采用相同技术路径,也普遍需要申请READ_FRAME_BUFFER等系统级权限。
最后需特别强调:豆包手机助手仅在收到明确用户指令后才触发截屏行为;所有截图均无法覆盖Secure标记区域;上传至云端的图像仅用于单次任务的视觉推理,任务结束后即刻销毁,不会在服务器端留存。

以上就是豆包手机助手发声:无法截屏银行键盘等受保护内容的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号