Python中换行符在内存中统一为 ,但文件读写时受平台和newline参数影响:Windows文本模式自动转 ,Linux/macOS保持 ;splitlines()比split(' ')更安全,能处理各种换行符。

Python中换行符到底是
还是
取决于你运行的系统和字符串来源。Python在内存中统一用
表示换行,但写入文件或与外部交互时,会受newline参数和平台影响。Windows默认文本模式下print()或f.write()会自动把
转成
;Linux/macOS保持
不变。
常见误判场景:
- 从Windows记事本复制含
的文本到Python字符串里,实际是两个字符:' ',不是单个' ' - 用
open(..., 'r').read()读取Windows生成的文件,若没指定newline='',Python仍按通用换行模式处理(自动识别//并统一转为) -
repr(s)能帮你确认真实字符:repr('a b')→"'a\nb'",repr('a b')→"'a\r\nb'"
用splitlines()比split('
')更安全
str.splitlines()专为换行设计,能正确处理
、
、
、、等所有Unicode行边界,且默认不保留换行符;而split('
')只切
,遇到
会留下末尾的
。
text = "line1
line2
line3"
print(text.split('
')) # ['line1
', 'line2', 'line3']
print(text.splitlines()) # ['line1', 'line2', 'line3']额外注意点:
立即学习“Python免费学习笔记(深入)”;
-
splitlines(keepends=True)可保留换行符,适合需要原样分段再拼接的场景 - 它对空行也有效:
"a b".splitlines()→['a', '', 'b'] - 不依赖系统
os.linesep,跨平台行为一致
写文件时控制换行符用newline参数
这是最容易被忽略的关键参数。直接写f.write('a
b')时,如果文件以文本模式打开(默认),Python会根据系统自动转换换行符。要强制输出
,必须显式指定newline='':
with open('out.txt', 'w', newline='') as f:
f.write('line1
line2') # 确保写入的是
,不是
对比:
-
open('f.txt', 'w'):Windows下写' '→ 文件存' ' -
open('f.txt', 'w', newline=''):无论什么系统,写什么就存什么 -
open('f.txt', 'wb')(二进制模式):同样绕过换行转换,但需传bytes,如b'line1 line2'
读文件时newline=None(默认)启用通用换行支持;设为''则关闭转换,原样返回所有换行符。
正则匹配换行时别漏掉re.DOTALL
.默认不匹配
,所以re.search('a.b', 'a
b')匹配失败。多数人第一反应是改用[sS],但更规范的做法是加re.DOTALL标志:
import re text = "start middle end" re.search(r'start.*end', text) # None(默认不跨行) re.search(r'start.*end', text, re.DOTALL) # Match object
其他相关点:
-
^和$默认只匹配字符串首尾,加re.MULTILINE后才匹配每行首尾 - 组合使用:
re.DOTALL | re.MULTILINE - 如果只是简单替换换行,优先用
str.replace(' ', ' '),比正则快且直观
跨平台处理换行最麻烦的往往不是语法,而是混用不同来源的字符串(用户输入、网络响应、文件读取)又没做标准化。建议在数据入口处统一用str.replace('
', '
').replace('
', '
')归一化,后续逻辑就能专注业务,不用反复判断换行符类型。










