0

0

Python 实现金字塔结构末尾词提取的正确方法

心靈之曲

心靈之曲

发布时间:2026-02-17 21:15:02

|

199人浏览过

|

来源于php中文网

原创

Python 实现金字塔结构末尾词提取的正确方法

本文详解如何从带序号的文本行中正确构建数字金字塔,并精准提取每层最右侧(即逻辑上“最后一词”)的单词,解决因层级划分逻辑错误导致误取首词的常见问题。

本文详解如何从带序号的文本行中正确构建数字金字塔,并精准提取每层最右侧(即逻辑上“最后一词”)的单词,解决因层级划分逻辑错误导致误取首词的常见问题。

在处理类似“金字塔解密”类任务时,核心难点不在于排序,而在于如何将排序后的数据按三角形层级(1, 2, 3, … 个元素)准确分组。原代码中 current_number += level 的递推方式混淆了“行号”与“行内最大序号”,导致每层匹配条件失效——它实际在查找序号恰好等于 current_number 的单条记录,而非该层应包含的所有序号。

正确的金字塔结构由三角数(Triangular Number)定义:第 n 层包含 n 个元素,因此前 n 层共含 T(n) = 1 + 2 + ... + n = n(n+1)/2 个元素。例如:

  • 第1层:序号 1 → 索引 0(累计总数 T(1)=1)
  • 第2层:序号 2,3 → 索引 1,2(累计总数 T(2)=3)
  • 第3层:序号 4,5,6 → 索引 3,4,5(累计总数 T(3)=6)

因此,第 n 层的最后一个序号是 T(n),对应排序后列表中的索引为 T(n) - 1(0-based)。只需依次计算 T(1), T(2), T(3), ...,直到超出总长度,即可定位每层末尾词的位置。

以下是优化后的完整实现:

一览妙笔
一览妙笔

自媒体、编剧、营销人员写作工具

下载

立即学习Python免费学习笔记(深入)”;

def unscramble_lines_from_file(file_path):
    """从文件读取并按序号升序解析为 (num, word) 元组列表"""
    try:
        with open(file_path, 'r') as f:
            lines = [line.strip() for line in f if line.strip()]
        # 解析每行:提取首个整数和后续非空字符串作为单词
        parsed = []
        for line in lines:
            parts = line.split()
            if len(parts) < 2:
                raise ValueError(f"Invalid line format: '{line}'")
            num = int(parts[0])
            word = ' '.join(parts[1:])  # 兼容单词含空格的情况
            parsed.append((num, word))
        return sorted(parsed, key=lambda x: x[0])
    except FileNotFoundError:
        raise FileNotFoundError(f"File '{file_path}' not found.")
    except ValueError as e:
        raise ValueError(f"Parse error: {e}")

def get_triangular(n):
    """返回第 n 个三角数 T(n) = n*(n+1)//2"""
    return n * (n + 1) // 2

def extract_pyramid_edge_words(sorted_pairs):
    """
    从已排序的 (序号, 单词) 列表中,
    提取金字塔每层最右端单词(即该层对应的最大序号位置的单词)
    """
    if not sorted_pairs:
        return ""

    # 构建按序号顺序排列的单词列表(索引 i 对应序号 i+1 的单词)
    # 注意:序号可能不连续,需映射到连续索引
    max_num = max(pair[0] for pair in sorted_pairs)
    word_by_num = [""] * (max_num + 1)  # 1-indexed
    for num, word in sorted_pairs:
        if 1 <= num <= max_num:
            word_by_num[num] = word

    # 按金字塔层级提取:第 n 层末尾序号为 T(n),取 word_by_num[T(n)]
    words = []
    n = 1
    while True:
        t_n = get_triangular(n)
        if t_n > max_num:
            break
        if t_n < len(word_by_num) and word_by_num[t_n]:
            words.append(word_by_num[t_n])
        n += 1

    return " ".join(words)

# 示例使用(模拟 text_file.txt 内容)
sample_text = """3 select
2 paragraph
5 always
6 poem
1 chick
4 planet"""

# 手动解析示例(或替换为真实文件路径)
lines = [line.strip() for line in sample_text.split('\n') if line.strip()]
parsed = []
for line in lines:
    parts = line.split(maxsplit=1)
    parsed.append((int(parts[0]), parts[1].strip()))
sorted_pairs = sorted(parsed, key=lambda x: x[0])

result = extract_pyramid_edge_words(sorted_pairs)
print("Pyramid edge words (last word of each level):", result)
# 输出:chick select poem

关键修正点说明:
层级定位逻辑正确:使用 T(n) = n(n+1)/2 直接获取第 n 层末尾序号,避免循环匹配错误;
数据结构清晰:先构建 word_by_num 数组实现 O(1) 查找,杜绝重复解析;
健壮性增强:显式处理文件异常、格式错误、序号越界等边界情况;
可扩展设计:支持单词含空格(如 "5 a beautiful phrase"),通过 maxsplit=1 安全分割。

注意事项:

  • 输入序号必须为正整数且覆盖 1..T(k) 的完整范围,否则金字塔末尾层可能缺失;
  • 若存在重复序号,后出现的会覆盖前者(可根据需求改为报错或列表存储);
  • 实际部署时建议添加日志或单元测试验证 T(n) 计算与索引映射的准确性。

掌握三角数在层级结构中的应用,是解决此类“隐式分组”问题的关键思维跃迁——它让代码从脆弱的循环试探,升级为数学确定性的精准定位。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

541

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

27

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

39

2026.01.06

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

473

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

158

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

64

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

20

2026.02.13

Redis高可用架构与分布式缓存实战
Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开,系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示,帮助开发者构建高可用、可扩展的分布式缓存系统。

26

2026.02.13

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

29

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号