老司机开车了!用飞桨玩AirSim智能驾驶

P粉084495128

发布时间：2025-07-28 11:02:55

308人浏览过

来源于php中文网

原创

本文介绍如何用飞桨PARL强化学习框架在微软AirSim仿真环境实现智能驾驶。先说明环境配置，包括安装Win10、VS2019、虚幻引擎、AirSim等及验证方法；再讲用Python控制汽车的步骤；最后详述基于飞桨PARL的DQN算法实现，含代码清单、逻辑，还提及相关训练地图和视频。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

老司机开车了!用飞桨玩airsim智能驾驶 - php中文网

老司机开车了!用飞桨玩AirSim智能驾驶

https://www.bilibili.com/video/BV1UY4y1e7s5?share_source=copy_web

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网

训练过程视频：PARL_AirSim_DQN.mp4

前言

PARL 是由百度大脑出品的、高性能、易用的国产强化学习（RL）框架。
微软AirSim环境是基于Unreal游戏引擎开发的，面向四轴无人机和无人驾驶汽车的虚拟现实环境。
AirSim目前star数高达12.9k，是微软公司最火的人工智能项目之一。
百度PARL的RL程序目前还无法在AirSim环境中运行。
本文实现了AirSim环境中运行基于PARL的强化学习算法。

一、环境要求与配置

win10 操作系统
Anaconda Navigator
Python3.7+
PaddlePaddle2.x
PARL2.x
宽带网络+加速器
内存16G或更多
显卡NVIDIA RTX3060Ti以上

注册账号

注册微软统一账号：Win10系统菜单中找到windows 商店注册即可。
注册Unreal账号：打开游戏引擎官网https://www.unrealengine.com/zh-CN 注册账号，并打通github.com认证授权（二次开发Unreal代码需要用到）。

下载软件

下载Visual Studio Community 2019
1. 使用C++的桌面开发
2. 安装组件：Window 10 SDK(10.0.18362.0)
下载Epic Game Launcher并安装4.26以上版本的“虚幻引擎”
重启Epic Game Launcher并关联项目文件

吐槽大师
吐槽大师（Roast Master） - 终极 AI 吐槽生成器，适用于 Instagram，Facebook，Twitter，Threads 和 Linkedin

下载
下载AirSim源代码：git clone https://github.com/Microsoft/AirSim.git

本地编译AirSim源代码（Windows环境）

打开Developer Command Prompt for VS 2019,在项目根目录下输入命令：build.cmd
检查插件目录：$ProjectRoot\Unreal\Plugins\ 看插件是否生成。

验证安装

打开Developer Command Prompt for VS 2019,在$ProjectRoot\Unreal\Environments\Blocks目录下输入命令：update_from_git.bat
弹出窗口点击确定，关联当前引擎
进入目录双击Blocks.sln, VS2019自动启动。
编译选项设置为：Development_Editor + Win64
点击菜单“调试”-->“开始调试”，虚幻编辑器启动，看一遍教程
点击“运行”，点击确定，出现下图表示AirSim环境安装成功！

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网

二、使用Python控制汽车

1. 配置Anaconda环境

略

2. pip安装AirSim依赖包

    # 安装Unreal和python之间的通讯协议
    pip install msgpack-rpc-python    # 安装airsim的python库
    pip install airsim

3. 下载并安装Unreal 的 Landscape Mountains环境

请参考：《下载与安装示例》章节，不再赘述。

4. 启动VS Code,打开文件夹PythonClient\car\，运行hello_car.py，效果如下：

老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网

三、使用飞桨PARL强化学习算法驾驶汽车

下载AirSim预编译的windows版本的训练地图：老司机开车了!用飞桨玩AirSim智能驾驶 - php中文网

AirSim_Paddle
│  setup_path.py│
│  agent.py│  model.py│  replay_memory.py│  train.py│  
└─airgym
    │  __init__.py
    │  
    └─envs
            airsim_env.py
            car_env.py
            drone_env.py
            __init__.py

环境代码清单：

setup_path.py AirSim环境设置

airgym目录

__init__.py python包配置

envs目录

```
     airsim_env.py   基础环境配置
```

     car_env.py    汽车训练环境配置

```
     `__init__.py`    python包配置
```

DQN算法代码清单：

train.py 主程序，训练DQN模型
model.py 飞桨PARL三件套之一
agent.py 飞桨PARL三件套之一
replay_memory DQN系列算法的“记忆回放”

代码逻辑

初始化AirSim_Gym 游戏环境
初始化飞桨PARL库的DQN算法
预热“记忆回放”
循环开始触发动作，训练自动驾驶

    ...
    while True:
        step += 1
        # 获取记忆回放中的4帧
        context = rpm.recent_obs()        # 把当前动作返回帧加进去
        context.append(obs)        # 数组增加一维
        context = np.stack(context, axis=0)        # 选择一个动作，e-greedy算法
        action = agent.sample(context)        # 触发动作
        next_obs, reward, isOver, _ = env.step(action)        # 回写记忆回放
        rpm.append(Experience(obs, action, reward, isOver))        # train model
        if (len(rpm) > MEMORY_WARMUP_SIZE) and (step % LEARN_FREQ == 0):            # s,a,r,s',done
            (batch_all_obs, batch_action, batch_reward, batch_done) = rpm.sample_batch(BATCH_SIZE)            # 抽帧
            batch_obs = batch_all_obs[:, :CONTEXT_LEN, :, :]            batch_next_obs = batch_all_obs[:, 1:, :, :]            # 把抽出的帧放入learn方法中学习
            train_loss = agent.learn(batch_obs, batch_action, batch_reward,                                     batch_next_obs, batch_done)            loss_lst.append(float(train_loss))
            print("loss" + str(train_loss))

        total_reward += reward
        obs = next_obs
        if isOver:            break    return total_reward, step, np.mean(loss_lst)

保存训练结果。

四、源代码和演示视频

训练视频：PARL_AirSim_DQN.mp4 完整源代码在work目录

五、项目总结

本项目在AirSim仿真环境中首次集成了飞桨PARL强化学习框架。
使用了飞桨PARL库自带的DQN系列算法，验证了AirSim环境中使用飞桨框架的可行性。

ChatGPT生成Python代码怎么提问_提示写法是什么【教程】

OpenClaw集成其他工具_OpenClaw集成使用方法【方法】

QClaw能不能帮我下载B站视频_QClaw资源下载技能与指令输入【解答】

Cursor支持哪些语言开发_Cursor编程能力介绍【介绍】

OpenClaw报告生成_OpenClaw报告功能详解【详解】

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

178

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

532

2026.03.04