0

0

Python教程:在多行文本文件中根据关键词查找并打印指定行

DDD

DDD

发布时间:2025-11-22 11:41:02

|

935人浏览过

|

来源于php中文网

原创

Python教程:在多行文本文件中根据关键词查找并打印指定行

本教程详细介绍了如何使用python在多行文本文件中查找包含特定关键词的行。通过文件逐行读取和字符串包含性检查的组合,我们将展示一种简洁高效的方法来定位并输出所需内容。文章涵盖了文件路径处理、核心代码实现,并提供了进一步优化和扩展的建议,帮助开发者灵活处理文本数据。

在日常编程任务中,我们经常需要处理文本文件,其中一项常见需求是从包含多行文本的文件中查找并提取含有特定关键词的行。无论是日志分析、数据清洗还是信息检索,高效地定位目标行都是一项基本而重要的技能。本教程将指导您如何利用Python的强大功能,以简洁明了的方式实现这一目标。

核心原理:逐行读取与关键词匹配

Python提供了一种直观的方式来处理文件内容:逐行读取。其核心思想是打开文件,然后迭代文件对象,每次迭代都会返回文件中的一行。对于每一行,我们只需检查它是否包含我们感兴趣的关键词。如果包含,则执行相应的操作,例如打印该行。这种方法对于大多数文本文件处理场景都非常高效,因为它一次只将一行内容加载到内存中。

实现步骤与代码示例

实现这一功能主要包括以下几个步骤:

  1. 指定文件路径: 确定您要操作的文本文件在系统中的位置。
  2. 安全地打开文件: 使用 with open() 语句打开文件,这能确保文件在使用完毕后自动关闭,即使发生错误也能妥善处理。
  3. 逐行遍历文件: 迭代打开的文件对象,每次循环获取文件中的一行内容。
  4. 关键词匹配: 在每次循环中,使用 in 运算符检查当前行是否包含指定的关键词。
  5. 处理匹配行: 如果当前行包含关键词,则执行您需要的操作,例如将其打印到控制台。

以下是一个具体的Python代码示例,演示了如何查找并打印包含特定关键词的行:

立即学习Python免费学习笔记(深入)”;

import os

def find_lines_with_keyword(filepath, keyword):
    """
    在指定文件中查找并打印包含特定关键词的所有行。

    Args:
        filepath (str): 目标文本文件的路径。
        keyword (str): 要查找的关键词。
    """
    try:
        # 使用 'utf-8' 编码打开文件,以处理大多数文本文件
        with open(filepath, 'r', encoding='utf-8') as file_object:
            print(f"正在文件 '{filepath}' 中查找关键词 '{keyword}'...")
            found_count = 0
            # enumerate(file_object, 1) 用于获取行号,从1开始计数
            for line_num, line in enumerate(file_object, 1):
                # 检查当前行是否包含关键词
                if keyword in line:
                    # 使用 strip() 移除行尾的换行符和首尾空白,使输出更整洁
                    print(f"第 {line_num} 行: {line.strip()}")
                    found_count += 1

            if found_count == 0:
                print("未找到包含指定关键词的行。")
            else:
                print(f"共找到 {found_count} 行包含关键词 '{keyword}'。")
    except FileNotFoundError:
        print(f"错误:文件 '{filepath}' 不存在。请检查文件路径。")
    except UnicodeDecodeError:
        print(f"错误:无法使用 'utf-8' 编码读取文件 '{filepath}'。尝试其他编码或检查文件内容。")
    except Exception as e:
        print(f"处理文件时发生意外错误:{e}")

# --- 示例用法 ---
# 1. 创建一个示例文件用于测试
sample_file_name = "text.txt"
with open(sample_file_name, "w", encoding="utf-8") as f:
    f.write("Hello, World!
")
    f.write("MrBeast is rich.
")
    f.write(":3 avg valorant player
")
    f.write("Another line with World in it.
")
    f.write("The world is big.
")

print("--- 示例 1:查找 'World' ---")
find_lines_with_keyword(sample_file_name, "World")

print("
--- 示例 2:查找 'MrBeast' ---")
find_lines_with_keyword(sample_file_name, "MrBeast")

print("
--- 示例 3:查找不存在的关键词 'Python' ---")
find_lines_with_keyword(sample_file_name, "Python")

print("
--- 示例 4:查找不存在的文件 ---")
find_lines_with_keyword("non_existent_file.txt", "World")

# 清理示例文件
if os.path.exists(sample_file_name):
    os.remove(sample_file_name)

注意事项与最佳实践

  1. 文件路径的绝对与相对:

    • 相对路径: 如果文件与您的Python脚本在同一目录下,可以直接使用文件名(如 "text.txt")。如果文件在子目录中,则使用 subdirectory/text.txt。
    • 绝对路径: 对于文件位置不确定或需要跨目录访问的情况,使用文件的完整路径。
      • Windows系统: 路径分隔符通常是反斜杠 。为了避免与转义字符冲突,建议使用原始字符串(在路径前加 r,如 r"C:UsersJohn DoeDesktop ext.txt")或使用正斜杠 /(如 "C:/Users/John Doe/Desktop/text.txt"),或者双反斜杠 \(如 "C:\Users\John Doe\Desktop\text.txt")。
      • Linux/macOS系统: 路径分隔符是正斜杠 /(如 "/home/user/documents/text.txt")。
    • 为了更好的跨平台兼容性,可以使用 os.path.join() 来构建路径,它会根据操作系统自动选择正确的分隔符。
  2. 处理行尾符:

    • 当从文件中读取一行时,Python会包含行尾的换行符( )。在打印或进一步处理之前,通常建议使用 line.strip() 方法来移除这些空白字符(包括换行符和首尾空格),使输出更整洁。
  3. 大小写不敏感搜索:

    Otter.ai
    Otter.ai

    一个自动的会议记录和笔记工具,会议内容生成和实时转录

    下载
    • 如果需要进行大小写不敏感的关键词查找,可以将行和关键词都转换为小写(或大写)再进行比较。
    • 示例:if keyword.lower() in line.lower():
  4. 存储所有匹配行:

    • 如果不仅仅是打印,而是需要收集所有匹配的行以供后续处理,可以将它们存储在一个列表中。

    • 示例:

      def get_matching_lines(filepath, keyword):
          matching_lines = []
          try:
              with open(filepath, 'r', encoding='utf-8') as file_object:
                  for line in file_object:
                      if keyword in line:
                          matching_lines.append(line.strip())
          except FileNotFoundError:
              print(f"文件 '{filepath}' 不存在。")
          return matching_lines
      
      # 调用示例
      results = get_matching_lines("text.txt", "World")
      print("匹配到的行:", results)
  5. 错误处理:

    • 文件不存在(FileNotFoundError)或其他文件操作错误是常见的。使用 try...except 块来捕获这些异常,可以使您的程序更加健壮。
    • 在 open() 函数中指定 encoding 参数(如 encoding='utf-8')是一个好习惯,可以避免因编码问题导致的 UnicodeDecodeError。
  6. 大型文件处理的效率:

    • 对于非常大的文件,逐行读取是内存高效的,因为它一次只将一行加载到内存中。因此,这种方法对于大多数场景都是适用的。

总结

通过本教程,我们学习了如何利用Python简洁地在多行文本文件中查找并打印包含特定关键词的行。核心方法是结合 with open() 进行安全的文件操作,并通过 for line in file_object 进行逐行迭代,最后使用 in 运算符进行字符串包含性检查。通过掌握这些基本技巧,并结合文件路径处理、错误处理以及大小写不敏感搜索等最佳实践,您将能够高效地处理各种文本文件搜索任务。这种方法不仅易于理解和实现,而且对于大多数文件大小都具有良好的性能表现。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

241

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

150

2025.10.17

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.7万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号