如何使用c++和ONNX Runtime部署深度学习模型？ (AI推理)

冰火之心

发布时间：2026-01-22 12:23:02

951人浏览过

来源于php中文网

原创

c++可直接调用onnx runtime实现高性能轻量部署，需严格匹配模型输入输出名称、shape与dtype，正确管理内存并配置执行提供者与优化选项。

如何使用c++和onnx runtime部署深度学习模型？ (ai推理)

可以直接用 C++ 调用 ONNX Runtime 进行模型推理，无需 Python 中转，性能高、部署轻量。关键在于正确加载模型、匹配输入输出张量形状与数据类型，并避免内存生命周期错误。

ONNX Runtime C++ API 初始化和会话创建

必须显式设置 Ort::Env 和 Ort::SessionOptions，否则默认行为可能触发调试日志或禁用优化。Windows 下若链接失败，大概率是没正确导入 onnxruntime.lib（不是 DLL）或 ABI 不匹配（如 /MD 与 /MT 混用）。

Ort::Env 建议用 ORT_LOGGING_LEVEL_WARNING 避免刷屏
启用图优化：调用 session_options.SetGraphOptimizationLevel(ORT_ENABLE_ALL)
CUDA 执行提供者需手动注册：OrtSessionOptionsAppendExecutionProvider_CUDA(options, 0)，且必须在 Ort::Session 构造前完成
Linux 下注意 LD_LIBRARY_PATH 包含 libonnxruntime.so 路径

输入张量构造与内存管理

ONNX Runtime 不接管用户分配的内存，Ort::Value::CreateTensor 的第 4 个参数（data pointer）必须保证在整个 Run() 调用期间有效。常见崩溃源于栈内存传入或提前 free()。

MindShow

MindShow官网 | AI生成PPT，快速演示你的想法

下载

推荐用 std::vector<float></float> 分配输入数据，再用 .data() 传指针
输入 shape 必须与模型期望完全一致，包括 batch 维度 —— 即使只推一个样本也要是 {1, 3, 224, 224}，不能是 {3, 224, 224}
数据排布默认是 NCHW；若模型导出为 NHWC，需在预处理时重排，或用 Ort::Value::CreateTensor 指定 Ort::MemoryInfo::CreateCpu(..., OrtArenaAllocator) 并自行处理 layout
图像归一化必须与训练时一致：例如 (pixel - [123.675, 116.28, 103.53]) / [58.395, 57.12, 57.375]，顺序错会导致输出全零

运行推理并读取输出结果

session.Run() 返回的是 std::vector<:value></:value>，每个元素对应一个输出节点。直接调用 .GetTensorData<float>()</float> 得到指针，但必须先确认输出 shape 和数据类型，否则越界读写。

立即学习“C++免费学习笔记（深入）”；

用 output_values[0].GetTensorTypeAndShapeInfo().GetShape() 检查维度，比如分类模型常为 {1, 1000}
用 output_values[0].GetTensorTypeAndShapeInfo().GetElementType() 确认是否为 ONNX_TENSOR_ELEMENT_DATA_TYPE_FLOAT
不要假设输出名是 "output" —— 查看模型用 netron 或 onnx.shape_inference.infer_shapes() 确认实际 output name
若输出是 int64（如 token ids），需用 .GetTensorData<int64_t>()</int64_t>，混用类型会读出垃圾值

Ort::Session session(env, L"model.onnx", session_options);
std::vector<const char*> input_names = {"input"};
std::vector<const char*> output_names = {"output"};
<p>std::vector<int64_t> input_shape = {1, 3, 224, 224};
std::vector<float> input_tensor_values(1 <em> 3 </em> 224 * 224, 0.0f);
// ... 填充 input_tensor_values</p><p>auto memory_info = Ort::MemoryInfo::CreateCpu(OrtArenaAllocator, OrtMemTypeDefault);
auto input_tensor = Ort::Value::CreateTensor<float>(
memory_info, input_tensor_values.data(), input_tensor_values.size(), 
input_shape.data(), input_shape.size());</p><p>auto output_tensors = session.Run(
Ort::RunOptions{nullptr}, 
input_names.data(), &input_tensor, 1,
output_names.data(), 1
);</p><p>float* output_data = output_tensors[0].GetTensorData<float>();
std::vector<int64_t> output_shape = output_tensors[0].GetTensorTypeAndShapeInfo().GetShape();</p>

最易被忽略的是：模型输入/输出名称、shape、dtype 三者必须与 ONNX 文件定义严格一致，任何一项不匹配都会导致静默错误（如输出全零）或段错误。建议首次部署时用 Python 的 onnxruntime.InferenceSession 同样输入跑一遍，比对输出数值和 shape，再迁移到 C++。

C++如何快速实现动态加载DLL/SO插件？（插件化架构）

C++怎么操作温湿度传感器_C++环境监测教程【采集】

C++如何构建跨平台的系统监控工具？（硬件状态采集）

C++如何一键检测程序的内存占用情况？（性能监控）

C++如何构建基于io_uring的高性能异步磁盘I/O库？（Linux底层优化）

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

linux python windows session 栈 ai c++ win 深度学习 typedef batch 数据类型 Session Token 指针栈 pointer windows linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++函数参数设计黄金法则：const&、值传递与输出参数选择【性能与安全】下一篇：c++中如何使用std::async_c++异步执行任务并获取结果【汇总】

作者最新文章

sublime如何安装Material主题_Sublime最流行主题配置【插件】

2026-03-08 13:56

win11怎么设置剪贴板历史 win11怎么开启多重复制粘贴【实战】

2026-03-08 13:57

电脑散热器怎么选风冷与水冷【科普】

2026-03-08 13:59

Sublime怎么设置透明 Sublime怎么修改窗口透明度效果【装逼】

2026-03-08 14:00

谷歌浏览器怎么设为默认谷歌浏览器修改默认应用【设置】

2026-03-08 14:03

win11怎么设置窗口磁贴 win11怎么使用布局组合功能【攻略】

2026-03-08 14:06

sublime中如何一键全选所有匹配项？（批量修改）

2026-03-08 14:11

C++如何优雅地处理文件读取结束标志？（新手避坑）

2026-03-08 14:13

MAC如何使用预览App裁剪证件照？（无须PS操作法）

2026-03-08 14:13

MAC如何解决外接硬盘只能读不能写？（NTFS修复指南）

2026-03-08 14:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

336

2023.10.31

php数据类型

本专题整合了php数据类型相关内容，阅读专题下面的文章了解更多详细内容。

224

2025.10.31

c语言数据类型

本专题整合了c语言数据类型相关内容，阅读专题下面的文章了解更多详细内容。

138

2026.02.12

session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍：1、会话超时：服务器为Session设置了一个默认的超时时间，当用户在一段时间内没有与服务器交互时，Session将自动失效；2、会话数量限制：服务器为每个用户的Session数量设置了一个限制，当用户创建的Session数量超过这个限制时，最新的会覆盖最早的等等。

334

2023.10.17

session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法：1、延长session的生存时间；2、使用持久化存储；3、使用cookie；4、异步更新session；5、使用会话管理中间件。

775

2023.10.18

cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容，阅读专题下面的文章了解更详细的内容。

2025.08.19

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6604

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

842

2023.09.14

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

热门下载

网站特效

网站源码

网站素材

前端模板