0

0

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

蓮花仙者

蓮花仙者

发布时间:2025-06-06 15:46:01

|

476人浏览过

|

来源于laoyaoba

转载

未来,移动通信网络支撑下的网联具身智能体将深度融入经济社会,推动各行业与日常生活的革命性变革。针对当前网联具身智能体上通信与多模态感知相互分立、各自为政,进而制约其智能能力的科学问题,北京大学电子学院程翔教授团队首次提出并系统论述了机器联觉(synesthesia of machines,som)的架构与概念,即面向通用任务的ai原生通信与多模态感知智能融合,利用大模型/无线基座模型,突破多模态通感智能融合的核心技术,提供网联智能发展新路径。由于通信与多模态感知智能融合数据集的体量和质量在训练阶段从根本上决定了未来ai原生的多模态通感系统的性能上限,海量、高质量的通信与多模态感知智能融合数据集至关重要。然而,现阶段的通信与多模态感知数据集(如图1所示)存在缺少完备的通信与多模态感知信息、场景简单单一以及数据集的可信度和可用性未得到充分验证等不足,难以满足未来ai原生系统对于数据集体量和质量的要求。因此,亟需开展海量、高质量的通信与多模态感知智能融合数据集构建研究,作为ai原生的多模态通感系统设计的核心数据基础,支撑机器联觉研究,赋能未来网联智能深度快速发展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图1 现有典型的通信与多模态感知数据集

然而,构建海量、高质量的通信与多模态感知智能融合数据集极具挑战。首先,实测多模态通感数据采集所需设备繁多且需严格时空同步,从而导致实测数据成本极高、复杂度极高、场景受限且不可控性强。其次,现阶段没有一个仿真平台能直接生成和采集通信与多模态感知仿真数据。为填补上述空白和克服上述挑战,程翔团队创新性地采用机器联觉架构,搭建了首个实测注入的通信与多模态感知仿真数据生成与采集平台,并基于此构建了海量、高质量的通信与多模态感知智能融合数据集SynthSoM: A Synthetic Intelligent Multi-Modal Sensing-Communication Dataset for Synesthesia of Machines (SoM),从根本上提升了AI原生多模态通感系统的性能上限。SynthSoM数据集的构建汇集了3个高可靠仿真软件AirSim、WaveFarer和Wireless InSite,包含4个步骤:高保真场景构建、完备场景条件仿真、动态场景生成、数据采集与导出,以及对SynthSoM数据集可信度和可用性的进一步验证,总体架构如图2所示。

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图2 SynthSoM数据集的构建架构

该工作的主要亮点如下:

(1) 平台层面:搭建了首个实测注入的通信与多模态感知仿真数据生成与采集平台,汇集了3个高可靠仿真软件AirSim、WaveFarer和Wireless InSite,实现了3个仿真软件的深度融合与精准匹配。

(2) 数据层面:包含144万张RGB图、289万张深度图、144万组激光雷达点云、49万组雷达波形、70万组信道矩阵和10万组路径损耗,总计共700万组以上的通信与多模态感知数据,是现有多模态通感数据量的5倍以上。

(3) 场景层面:包含空地多路协同网联具身智能场景(网联智能无人车、低空经济无人机)下城镇、郊区、乡村(如图3所示),具有多时段、多天气、多视角、多车流量密度、多频段、多种天线阵列等丰富场景条件,并在不同场景和条件设置过程中采用了多种先进技术和算法,包括射线追踪、激光雷达光散射增强(LISA)算法、协同自适应巡航控制(CACC)汽车跟随模型用于防碰撞检测等。

MagickPen
MagickPen

在线AI英语写作助手,像魔术师一样在几秒钟内写出任何东西。

下载

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图3 SynthSoM涵盖的五类空地协同场景:(a) 城镇十字路口 (b) 城镇超宽车道 (c) 城镇高架立交桥 (d) 郊区分岔路口 (e) 乡村山区公路

(4) 验证层面:为全面验证构建的仿真SynthSoM数据集的可信度和可用性,首次开展对于SynthSoM数据集的基于统计的定性分析以及实测注入的性能扩展性测试。针对基于统计的定性分析,结果表明在不同场景和条件下所采集的仿真数据与实测数据展现出一致的电磁传播机制;针对实测注入的性能扩展性测试,基于数字孪生技术,在北京大学校园场景搭建精准匹配的实测与仿真场景(如图4所示),采集时空一致的实测与仿真多模态通感数据。基于此,进一步开展在仿真数据训练,在实测数据测试(TSTR)以及在实测数据训练和测试(TRTR),如图5所示。测试结果表明TSTR和TRTR的精度分别为89.28%和90.35%,证明了仿真数据与实测数据的高吻合度使得简单深度学习小模型也有能力实现零样本泛化。

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图4 精准匹配的实测场景与仿真场景

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图5 实测注入的性能扩展性测试

(5) 开源层面:构建的海量、高质量的通信与多模态感知智能融合数据集SynthSoM和代码完全开源,可支撑不同多模态通感智能融合算法的交叉验证、模型校准和基线实现,从根本上提升AI原生多模态通感系统性能上限,支撑未来网联智能深度快速发展。

该研究成果以“SynthSoM: A synthetic intelligent multi-modal sensing-communication dataset for Synesthesia of Machines (SoM)”为题于5月20日正式发表于Nature子刊Scientific Data。北京大学为该研究工作的第一完成单位,合作单位包括山东大学。程翔和山东大学白露教授为该论文的共同通讯作者,程翔、博雅博士后黄子蔚和博士生于勇为共同第一作者,其他作者包括北京大学电子学院博士生孙铭然、韩增瑞、张瑞德和李思江。这项工作得到了国家自然科学基金委杰出青年科学基金、新基石科学基金会科学探索奖、中国博士后科学基金会博士后创新人才支持计划等的支持。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

409

2023.08.14

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 5万人学习

Excel 教程
Excel 教程

共162课时 | 14.2万人学习

jQuery 教程
jQuery 教程

共42课时 | 5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号