str.strip()仅移除字符串首尾连续空白字符,不处理中间空格;lstrip()/rstrip()同理,且按字符集合而非顺序或前缀匹配;误用如lstrip("https://")会导致意外删字符。

str.strip() 不会动中间的空格,只管开头和结尾
很多人误以为 strip() 会“清理所有空白”,其实它只作用于字符串首尾连续的空白字符(包括空格、\t、\n、\r、\f、\v),中间哪怕全是空格也原封不动。
比如:" a b c ".strip() 结果是 "a b c" —— 开头两个空格和结尾两个空格没了,但中间的两个空格还在。
- 如果想删掉所有空白,得用
.replace(" ", "")或正则re.sub(r"\s+", "", s) -
strip()是惰性的:遇到第一个非目标字符就停,不会继续往里扫 - 传入参数时(如
s.strip("x")),也是只处理两端连续出现的"x",不是全局替换
str.lstrip() 和 str.rstrip() 的“单边性”容易被当成万能裁剪工具
lstrip() 只动左边,rstrip() 只动右边,这点看似简单,但实际出问题常是因为没意识到它们的“字符集合”逻辑:
例如:"...xxx...".lstrip(".") → "xxx...";但 "..x.x..".lstrip(".") → "x.x..",因为 lstrip() 一旦碰到非 "." 字符(这里是 "x")就立刻停止,后面哪怕还有 "." 也不再处理。
- 它们不是按“前缀/后缀”匹配,而是按“字符集合”逐个吃掉左侧/右侧属于该集合的字符
-
"123abc456".lstrip("123")→"abc456",但"321abc456".lstrip("123")同样 →"abc456"(顺序无关) - 如果误传了字符串如
s.lstrip("https://"),它会把每个字符'h','t','t','p',':'...都当独立可删字符,可能导致意外删掉域名里的"t"或"p"
常见误用场景:URL 清洗、缩进处理、数字前导零
这些场景下,边界函数行为和预期偏差最大:
- 去 URL 协议头?别用
.lstrip("http://")—— 改用.removeprefix("http://")(Python 3.9+)或url.removeprefix("https://").removeprefix("http://") - 处理多行文本缩进?
text.rstrip("\n")只删末尾换行,但text.rstrip()会把末尾所有空白(包括空格、制表符)全干掉,可能破坏对齐 - 删数字前导零?
"00123".lstrip("0")→"123"没问题,但"000".lstrip("0")→"",需额外判断空字符串
性能与兼容性:strip 类方法在长字符串上很轻量,但别滥用
它们都是 C 实现,O(n) 时间复杂度,且只遍历一次首尾,不建新字符串直到真需要。但要注意:
- 反复链式调用如
s.strip().lstrip("x").rstrip("y")会创建多个中间字符串,不如一次性用正则或手动切片 - 在 Python 2 中
unicode对象也支持,但传入 Unicode 字符串时,某些控制字符(如\u2028行分隔符)可能不被默认空白集识别 - Windows 换行
\r\n:所有 strip 方法都认\r和\n,所以"\r\nhello\r\n".strip()正确返回"hello"
真正容易被忽略的是:这些方法对空字符串、None、不可变对象类型检查很严格,传错类型直接抛 AttributeError,而不是静默失败。










