0

0

如何高效地在状态依赖型树结构中求解最大累积收益路径

花韻仙語

花韻仙語

发布时间:2026-01-13 23:45:10

|

535人浏览过

|

来源于php中文网

原创

如何高效地在状态依赖型树结构中求解最大累积收益路径

本文介绍一种基于动态规划思想的广度优先搜索(bfs)算法,用于在每层有3个分支、共100层、且节点收益依赖于父节点选择的树中,以 o(n) 时间复杂度求得最大累积收益值(无需返回具体路径)。

在该问题中,树具有明确的层级结构(100 层),每个非叶节点恰好有 3 个子节点(动作选择:1、2、3),且任一节点的即时收益不仅由自身动作决定,还依赖于其父节点所选动作——即存在状态转移依赖关系。这排除了简单贪心或静态查表法,但并未破坏最优子结构性质:从根到某节点的最优累积收益,必然等于其父节点的最优累积收益,加上该节点在对应父动作约束下的最大可能收益

因此,我们可采用自顶向下的动态规划策略,配合 BFS 遍历实现高效计算:

  • 维护一个队列,存储 (node_id, parent_action, cumulative_payoff) 元组;
  • 初始时将根节点的三种可能动作及其初始收益入队(注意:根无父节点,其收益为预定义基准值);
  • 每次出队一个节点,根据其 parent_action 查表计算其三个子动作的即时收益,更新子节点的累积收益,并将子节点入队;
  • 同时维护全局变量 max_cumulative,实时更新最大值;
  • 遍历完成后直接返回 max_cumulative。

该方法时间复杂度为 O(N),其中 N 是树中总节点数(≈ 3¹⁰⁰,但实际只需遍历一次所有节点);空间复杂度为 O(W),W 为最大层宽(即 BFS 队列峰值长度,最坏为 3⁹⁹,但可通过逐层处理优化为 O(3ˡ))。

白果AI论文
白果AI论文

论文AI生成学术工具,真实文献,免费不限次生成论文大纲 10 秒生成逻辑框架,10 分钟产出初稿,智能适配 80+学科。支持嵌入图表公式与合规文献引用

下载

⚠️ 注意事项:

  • 原始代码中混用了概率传播(get_prob)、矩阵乘法与循环逻辑,偏离了核心优化目标,且存在 t 递增位置错误、accumulated_payoffs 结构混乱等问题,不适用于本题;
  • 实际实现时应避免显式构建整棵树(内存爆炸),而采用“按层生成+滚动更新”方式:仅保存当前层各节点的最优累积收益(长度为 3ˡ),再据此计算下一层;
  • 若收益函数 get_payoffs(prev_action) 返回的是一个长度为 3 的数组(对应子动作 1/2/3 的收益),则第 l 层的状态可表示为 dp[l][a] = max_{prev_a} { dp[l-1][prev_a] + payoff(prev_a, a) },即标准的二维 DP 转移,空间可压缩至 O(3)。
def find_max_cumulative_payoff(num_layers, payoff_func):
    # payoff_func(prev_action) -> [payoff_for_action1, payoff_for_action2, payoff_for_action3]
    if num_layers == 0:
        return 0

    # dp[a] = max cumulative payoff ending with action 'a' at current layer
    dp = [0.0, 0.0, 0.0]  # layer 0 (root): no parent, assume base payoff = 0

    for layer in range(1, num_layers):
        new_dp = [-float('inf')] * 3
        for prev_a in range(3):
            payoffs = payoff_func(prev_a)  # list of 3 floats
            for a in range(3):
                new_dp[a] = max(new_dp[a], dp[prev_a] + payoffs[a])
        dp = new_dp

    return max(dp)

# 示例:定义状态依赖收益函数
def example_payoff(prev_action):
    # 简化示例:prev_action=0 → 子动作收益为[5, 8, 2];以此类推
    table = {
        0: [5, 8, 2],
        1: [7, 3, 9],
        2: [1, 6, 4]
    }
    return table[prev_action]

print(find_max_cumulative_payoff(100, example_payoff))  # O(100×9) = O(1)

综上,面对深度大、分支固定、收益具马尔可夫依赖性的树形决策问题,逐层动态规划 + 状态压缩是最优解法:它规避了指数级路径枚举,利用最优子结构剪除无效计算,将复杂度从 O(3¹⁰⁰) 降至线性级别,是理论最优且工程可行的标准方案。

相关专题

更多
全局变量怎么定义
全局变量怎么定义

本专题整合了全局变量相关内容,阅读专题下面的文章了解更多详细内容。

75

2025.09.18

python 全局变量
python 全局变量

本专题整合了python中全局变量定义相关教程,阅读专题下面的文章了解更多详细内容。

96

2025.09.18

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

400

2023.08.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

1

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

2

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

5

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

1

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 6.6万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 18.7万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 12.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号