0

0

c++怎么实现深度学习中的Softmax函数_c++ 数值溢出处理与向量运算【实战】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-11 11:38:02

|

476人浏览过

|

来源于php中文网

原创

必须减去最大值以保证数值稳定性:使所有指数项≤1,避免exp溢出inf或下溢0,确保至少一项为1,防止softmax输出全0或nan导致梯度崩溃。

c++怎么实现深度学习中的softmax函数_c++ 数值溢出处理与向量运算【实战】

Softmax 函数在 C++ 中的正确实现方式

直接用 exp(x) 对每个元素计算再归一化,大概率会遇到 infnan —— 尤其当输入向量含较大正值(如 100)时,exp(100) 超出 double 表示范围。关键不是“怎么写公式”,而是“怎么稳住数值”。

标准解法是减去最大值(max-shift trick):

std::vector softmax(const std::vector& logits) {
    double max_val = *std::max_element(logits.begin(), logits.end());
    std::vector exps;
    double sum = 0.0;
    for (double x : logits) {
        double exp_x = std::exp(x - max_val); // 防溢出
        exps.push_back(exp_x);
        sum += exp_x;
    }
    std::vector result;
    for (double exp_x : exps) {
        result.push_back(exp_x / sum);
    }
    return result;
}

为什么必须减去最大值?数值稳定性原理

softmax(x)_i = exp(x_i) / sum_j exp(x_j),分子分母同乘 exp(-c) 后等价于 exp(x_i - c) / sum_j exp(x_j - c)。只要 c 是常数,结果不变。选 c = max(x) 可保证:

  • 所有 x_i - c ≤ 0,所以 exp(x_i - c) ∈ (0, 1]
  • 至少有一个项为 exp(0) = 1,避免全下溢成 0
  • 不会出现 inf(除非原始输入本身是 inf

漏掉这步,在训练初期 logits 波动大时,softmax 输出可能全为 0nan,梯度直接崩掉。

立即学习C++免费学习笔记(深入)”;

用 Eigen 库做向量化加速时的常见陷阱

如果用 Eigen::VectorXd 替代 std::vector,不能直接写 exp(logits) —— 默认不自动做 max-shift。必须手动处理:

Interior AI
Interior AI

AI室内设计,上传室内照片自动帮你生成多种风格的室内设计图

下载
Eigen::VectorXd softmax_eigen(const Eigen::VectorXd& logits) {
    double max_val = logits.maxCoeff();
    Eigen::VectorXd shifted = logits.array() - max_val;
    Eigen::VectorXd exps = shifted.array().exp();
    double sum = exps.sum();
    return exps / sum;
}

注意点:

  • .array() 必须显式调用,否则 .exp() 无定义
  • logits.maxCoeff() 返回 double,不是引用;别误写成 &logits.maxCoeff()
  • logits 是空向量,maxCoeff() 会抛异常 —— 生产环境需前置检查
  • 对小向量(size ),Eigen 的开销可能比原生循环大,别盲目优化

极端情况:全 NaN 输入或含 inf 的处理策略

真实训练中,前层梯度爆炸可能导致 logitsinfnan。此时 max_elementexp 行为未定义(C++ 标准不保证),可能静默返回错误结果。

建议在 softmax 前加轻量级校验:

  • std::isnan(x)std::isinf(x) 扫描输入
  • 发现 nan 直接返回全 0 向量(或抛异常,视 pipeline 设计而定)
  • 发现 +inf:只保留该位置为 1,其余为 0(数学上合理)
  • 发现 -inf:可设为极小负数(如 -1e30)再进 softmax,避免 exp(-inf)=0 导致除零

这些分支判断成本极低,但能防止 silent failure —— 这类 bug 往往要到 loss 突然卡死才暴露,排查成本远高于预防。

相关专题

更多
c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

52

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

98

2025.10.23

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

34

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

14

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

33

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

18

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

12

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.7万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号