“万物跳转”是通义千问识别多模态内容中结构化实体并自动跳转或执行操作的能力,涵盖多模态感知锚定、跨平台上下文联动、硬件端侧物理控制及企业知识图谱嵌入四大路径。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您在使用通义千问过程中发现,输入一段文字、一张图片甚至一段视频后,AI能自动识别其中嵌套的网址、文档链接、商品ID、代码仓库路径、论文DOI、设备型号等结构化实体,并直接唤起对应服务或跳转至关联内容,则这正是“万物跳转”能力的体现。以下是该能力的具体实现方式与典型应用路径:
一、多模态实体感知与语义锚定
“万物跳转”的基础在于通义千问对非文本模态中隐含结构化信息的高精度识别能力。模型通过统一多模态表征空间,将图像中的二维码、PDF里的超链接文本、视频帧中一闪而过的SKU编号、语音转写结果中的ISBN码等,全部映射为可操作的语义锚点,而非仅作视觉或语音识别。
1、上传一张产品说明书扫描件(含PDF或图片格式),系统自动标出所有带下划线的URL、以“https://”开头的字符串及形如“ASIN:B0XXXXXX”的亚马逊商品编码;
2、点击任一标出项,触发内置协议解析器,判断其类型(网页/电商链接/技术文档/学术资源);
3、根据类型调用对应服务:网页类直接内嵌浏览器预览,ASIN类跳转至淘宝/京东商品页,DOI类接入知网或arXiv摘要接口。
二、跨平台上下文联动跳转
该能力突破了单次请求的边界限制,支持在连续对话中维持实体状态并实现上下文驱动的链式跳转。例如用户先提问“对比Qwen2.5-VL和Qwen3Next的参数量”,再追问“它们的GitHub release页面在哪”,系统无需重复识别,直接复用前序对话中已锚定的版本号与项目标识,生成准确跳转链接。
1、在对话中提及任意开源模型名称(如“Qwen3”)、芯片型号(如“昇腾910B”)或标准编号(如“GB/T 22239-2019”),模型自动关联权威知识源;
2、当用户发送“打开它”“查原文”“看参数表”等模糊指令时,系统回溯最近一次被识别的实体并执行默认动作;
3、若同一轮对话中存在多个候选实体,界面底部弹出轻量级选择浮层,列出所有可跳转目标及其来源位置(如“来自第2张图左下角”“出自用户第3条消息”)。
三、硬件端侧协同式物理跳转
在搭载通义千问的智能硬件上,“万物跳转”延伸至真实物理世界。AI不仅识别数字内容中的实体,还能驱动设备执行对应物理动作,形成“看见即控制”的闭环。例如机器人摄像头捕捉到空调遥控器上的红外编码图案,自动触发红外发射模块模拟按键;或车载系统识别路牌上的导航坐标,直接导入高德地图启动导航。
1、启用通义千问硬件设备的实时视觉模式(如人形机器人头部摄像头、车载中控屏前置镜头);
2、对准含结构化信息的物理对象:设备铭牌、电路板丝印、药品说明书、工业仪表盘;
3、设备边缘侧模型完成轻量化OCR与实体抽取后,将结果上传至云端进行语义校验与服务匹配;
4、返回指令至设备端,执行对应动作:红外模拟按键、蓝牙配对请求、PLC控制信号下发、AR标注叠加。
四、企业知识图谱嵌入式跳转
面向企业用户,“万物跳转”支持将私有知识库中的非公开实体纳入识别范围。当员工上传内部合同扫描件时,系统不仅能识别通用条款中的法律条文引用,还可匹配公司法务系统中已注册的模板编号、审批流程ID、历史相似案例编号,并一键跳转至对应OA流程节点或诉讼档案库。
1、管理员在通义千问企业后台配置知识图谱Schema,定义实体类型(如“采购订单号”“专利申请号”“SOP-023修订版”)及关联服务接口;
2、员工上传含该类实体的文档或截图,模型在识别阶段同步调用图谱本体推理引擎;
3、识别成功后,在文档预览界面右侧显示“关联业务”侧边栏,列出所有匹配的内部系统入口;
4、点击任一项,自动携带当前文档哈希值与实体定位坐标,单点登录跳转至目标系统指定页面。










