
本文介绍一种健壮、可扩展的方法:读取目标数字列表,逐个在csv文件中精确匹配各字段,避免因换行符、空格或子串误匹配导致的查找失败。
在处理类似“从 numberstofind.txt 中读取多个数值,并在 midvalues1.csv 中查找包含该数值的整行”这类任务时,初学者常犯的关键错误包括:
- 只读取首行(如 fp.readline()),忽略后续数字;
- 未清理换行符和空白(如 line.strip() 缺失),导致 -56\n 无法匹配 CSV 中的 -56;
- 使用子串匹配(in)而非字段级匹配,可能引发误匹配(例如搜索 -6 会错误匹配 -62 或 16);
- 重复打开/关闭文件且逻辑冗余,代码难以维护、易出错。
以下是一个专业、可复用的解决方案:
import csv
# 步骤1:安全读取待搜索数字(自动过滤空行和空白)
with open("numberstofind.txt", "r", encoding="utf-8") as f:
search_numbers = [line.strip() for line in f if line.strip()]
# 步骤2:对每个数字,在CSV中逐行、逐字段搜索
for idx, target in enumerate(search_numbers, start=1):
found = False
with open("midvalues1.csv", "r", encoding="utf-8") as csv_file:
reader = csv.reader(csv_file)
for row in reader:
# 精确匹配:检查 target 是否完整等于某一个单元格(避免子串误匹配)
if target in row:
matched_line = ",".join(row)
print(matched_line)
print(f"Found {target}!")
# 写入结果到独立文件
with open(f"ident{idx}.txt", "w", encoding="utf-8") as out_f:
out_f.write(matched_line + "\n")
found = True
break # 找到首个匹配即退出(如需全部匹配,移除此行)
if not found:
print(f"Data '{target}' not found!")✅ 关键优化说明:
- ✅ 使用 csv.reader 正确解析 CSV 字段,避免手动 line.split(',') 带来的引号/逗号转义问题;
- ✅ if target in row: 是字段级匹配(row 是字符串列表),比 target in line(整行字符串)更精准、更安全;
- ✅ enumerate(..., start=1) 自动编号输出文件(ident1.txt, ident2.txt…),逻辑清晰;
- ✅ 显式指定 encoding="utf-8" 防止中文或特殊字符读取异常;
- ✅ 使用 with 语句管理文件,确保自动关闭,无需手动 f.close()。
⚠️ 注意事项:
立即学习“Python免费学习笔记(深入)”;
- 若 CSV 中数字可能带空格(如 "-56 "),建议统一预处理:row = [cell.strip() for cell in row];
- 如需部分匹配但防误判(例如匹配 -56 但不匹配 -156),可改用正则:re.search(rf'(^|,)\s*{re.escape(target)}\s*(,|$)', line);
- 对于超大文件,可将 CSV 先加载为列表缓存一次,避免多次重复读取(本例中小文件推荐当前流式处理)。
该方法结构清晰、容错性强,适用于任意数量的搜索项与标准CSV格式,是生产环境中推荐的实践模式。










