0

0

MotionLM:多智能体运动预测的语言建模技术

WBOY

WBOY

发布时间:2023-10-13 12:09:05

|

1615人浏览过

|

来源于51CTO.COM

转载

本文经自动驾驶之心公众号授权转载,转载请联系出处。

原标题:MotionLM: Multi-Agent Motion Forecasting as Language Modeling

论文链接:https://arxiv.org/pdf/2309.16534.pdf

作者单位:Waymo

会议:ICCV 2023

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

MotionLM:多智能体运动预测的语言建模技术

论文思路:

对于自动驾驶车辆安全规划来说,可靠地预测道路代理未来行为是至关重要的。本研究将连续轨迹表示为离散运动令牌序列,并将多智能体运动预测视为语言建模任务。我们提出的模型MotionLM具有以下几个优点:首先,它不需要使用锚点或显式潜变量来优化学习多模态分布。相反,我们利用标准的语言建模目标,最大化序列令牌的平均对数概率。其次,我们的方法避免了事后交互启发法,其中个体代理轨迹生成是在交互评分之后进行的。相反,MotionLM在单个自回归解码过程中生成了交互式代理未来的联合分布。此外,模型的顺序分解可以实现时间上的因果条件推断。我们提出的方法在Waymo Open Motion Dataset上取得了新的最先进性能,排名第一于交互式挑战排行榜

主要贡献:

在这篇文章中,我们将多智能体运动预测作为一项语言建模任务进行讨论。我们引入了时间因果解码器,对经过因果语言建模损失训练的离散运动令牌进行解码

本文将结合模型中的采样和简单的 rollout 聚合方案,以提高联合轨迹的加权模式识别能力。我们通过在 Waymo Open Motion Dataset 交互预测挑战中的实验,证明了这一新的方法在排名联合 mAP 指标上提高了6%,达到了最先进的性能水平

本文对本文的方法进行了广泛的消融实验,并对它的时间因果条件预测进行了分析,这在很大程度上是目前的联合预测模型所不支持的。

网络设计:

本文的目标是以一种通用的方式对多智能体交互上的分布建模,这种分布可以应用于不同的下游任务,包括最低限度的、联合的和条件预测。为了实现这一目标,需要一个有表现力的生成框架,能够捕捉到驾驶场景中的多种形态。此外,本文在这里考虑保存时间依赖性;即,在本文的模型中,推理遵循一个有向无环图,每个节点的父节点在时间上较早,子节点在时间上较晚,这使得条件预测更接近于因果干预,因为它消除了某些虚假的相关性,否则就会导致不服从时间因果关系。本文观察到,不保留时间依赖关系的联合模型可能在预测实际agent反应方面的能力有限,这是规划中的一个关键用途。为此,本文利用了未来解码器的自回归分解,其中代理的运动tokens有条件地依赖于所有先前采样的tokens,并且轨迹按顺序推出

MotionLM:多智能体运动预测的语言建模技术

图1。本文的模型自回归地为一组代理生成离散运动tokens序列,以产生一致的交互式轨迹预测。

MotionLM:多智能体运动预测的语言建模技术

请看图2,这是MotionLM的架构

本文首先将与每个建模代理相关的异构场景特征(左)编码为形状R、N、·、H的场景嵌入。其中,R为首次推出(rollouts)的数量,N为联合建模的代理数量,H为每次嵌入的维数。在推理过程中,为了并行采样,本文在批量维度上重复嵌入R次。接下来,一个轨迹解码器以一种时间因果的方式(中心)为多个代理推出(rolls out) T 个离散运动tokens。最后,通过使用非最大抑制初始化的k-means聚类的简单聚合,可以恢复 rollouts 典型模式(右图)。

MotionLM:多智能体运动预测的语言建模技术

图3。展示了三个WOMD场景的前两种预测联合推出(joint rollout)模式。

颜色梯度表示了从t = 0秒到t = 8秒的时间变化。联合模式由绿色过渡到蓝色,次联合模式由橙色过渡到紫色的概率最大。我们观察到了三种类型的交互:相邻车道中的智能体会根据变道时间给予变道智能体让行(左侧),行人会根据车辆的进度走在过往车辆后面(中间),转弯车辆要么会给过路的骑车人让路(最可能的模式),要么会在骑车人接近之前转弯(次要模式)(右侧)

MotionLM:多智能体运动预测的语言建模技术

请看图4。这张图展示了联合推出(左侧)、干预后因果贝叶斯网络(中间)和因果条件反射(右侧)的因果贝叶斯网络表示

实线表示时间上的因果相关性,而虚线表示因果信息流。没有时间依赖约束的模型将支持因果条件作用,但不支持时间因果条件作用,这在试图预测agent反应时可能是有问题的。

实验结果:

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

MotionLM:多智能体运动预测的语言建模技术

引用:

Seff, A., Cera, B., Chen, D., Ng, M., Zhou, A., Nayakanti, N., Refaat, K. S., & Sapp, B. (2023). MotionLM: Multi-Agent Motion Forecasting as Language Modeling. ArXiv. /abs/2309.16534

MotionLM:多智能体运动预测的语言建模技术

原文链接:https://mp.weixin.qq.com/s/mtai0ra8penfuj7ujcfd6a

Tome
Tome

先进的AI智能PPT制作工具

下载

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

40

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

67

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

47

2025.11.27

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2911

2024.08.16

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

69

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

37

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

82

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2.1万人学习

swoole进程树解析
swoole进程树解析

共4课时 | 0.2万人学习

ThinkPHP6.x 微实战--十天技能课堂
ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号