0

0

Python字符串系统学习路线第561讲_核心原理与实战案例详解【指导】

冷漠man

冷漠man

发布时间:2025-12-25 20:47:48

|

513人浏览过

|

来源于php中文网

原创

python字符串不可变,s += 'x'循环性能差因每次全量拷贝;推荐list缓存后join;编码需匹配来源;re.sub默认只替换首个且不跨行;f-string编译期解析最高效。

python字符串系统学习路线第561讲_核心原理与实战案例详解【指导】

str 类型不是“字符串对象的容器”,而是不可变的 Unicode 序列——所有看似修改的操作(如 replace()upper())都返回新对象,原对象内存地址不变。

为什么 s += 'x' 在循环中性能极差?

因为每次 += 都触发一次新字符串分配 + 全量拷贝。10 万次拼接可能产生百万级字节复制。

  • list 缓存片段,最后 ''.join(list) —— 这是 Python 官方推荐的高效拼接模式
  • io.StringIO 适合多阶段构建,尤其配合 print(..., file=buf)
  • 避免在 for 循环里用 ++= 拼接字符串,哪怕只有几轮

encode()decode()编码参数到底怎么选?

核心原则:谁生成,谁声明;谁接收,谁适配。常见错误是硬写 'utf-8' 却忽略来源实际是 gbk(比如 Windows 记事本默认保存的中文文件)。

  • 读文件时,明确用 open(path, encoding='gbk'),而不是靠 str.encode().decode() 补救
  • bytes.decode('utf-8', errors='ignore') 会静默丢字符;生产环境优先用 errors='replace' 或捕获 UnicodeDecodeError
  • 'utf-8-sig' 编码可自动跳过 BOM,处理 Excel 导出的 CSV 更稳妥

正则中的 re.sub() 为什么有时不替换?

最常被忽略的是:默认只替换第一个匹配;且 ^$ 在多行模式外只匹配整个字符串首尾。

万兴爱画
万兴爱画

万兴爱画AI绘画生成工具

下载

立即学习Python免费学习笔记(深入)”;

import re
text = "apple\nbanana\ncherry"
# ❌ 不会换行匹配:
re.sub(r'^b\w+', 'XXX', text)  # 无效果
# ✅ 加 flags=re.MULTILINE 才生效:
re.sub(r'^b\w+', 'XXX', text, flags=re.MULTILINE)
# ✅ 替换全部匹配要加 count=0(默认是 1):
re.sub(r'a\w+', 'YYY', text, count=0)
  • count 参数默认为 1,想全替换必须显式写 count=0
  • re.compile() 预编译正则,重复调用时能省下解析开销
  • 替换内容含反向引用(如 r'\1_\2')时,确保分组存在,否则抛 IndexError

格式化字符串:f-string、format()% 三者关键区别

f-string 是语法糖,编译期解析;format() 是运行时方法调用;% 已被标记为 legacy,新项目禁用。

  • f-string 中不能有反斜杠 \、未闭合括号,也不能嵌套另一个 f-string
  • '{:.2f}'.format(3.1415) 支持位置/关键字混合,但 f'{x:.2f}' 不支持动态格式(如 f'{x:.{n}f}' 要拼接表达式)
  • format()!s / !r / !a 修饰符,f-string 里得写成 f'{str(x)}' / f'{repr(x)}'

字符串的“不可变性”和“编码边界”是多数 bug 的源头。写 encode 前先确认源字符集,做拼接前先判断是否真需要多次修改——这两点比记住多少方法名都重要。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

910

2023.08.02

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

201

2023.11.20

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

866

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

454

2024.06.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

678

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

3

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 19.9万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号