
本文讲解如何正确统计目标字符串的所有**不同排列**在源字符串中作为子串出现的次数,重点解决因重复字符导致排列重复计数的问题,并提供简洁、健壮的 python 实现方案。
在处理字符串排列匹配问题时,一个常见误区是直接使用 itertools.permutations() 生成所有排列后逐个检查——这在目标字符串(needle)含重复字符(如 "aab")时会产生大量重复排列,导致误计数。例如,permutations('aab') 会生成 6 个元组(因为 3! = 6),但实际不同排列只有 3 个:"aab", "aba", "baa"。原始代码将其全部转为列表并遍历,又用变量名 str 覆盖了内置类型,进一步埋下隐患。
正确做法是利用 set 自动去重:set(permutations(N)) 会将相同字符序列的排列合并为唯一项(注意:permutations 返回的是 tuple,如 ('a','a','b'),而 tuple 是可哈希的,因此能被 set 正确去重)。同时,应避免覆盖内置名称,将拼接后的字符串变量命名为 substring 或 pattern 等语义化名称。
以下是优化后的完整实现:
from itertools import permutations
N = input().strip() # 不需要 str(input()),input() 默认返回字符串
H = input().strip()
# 生成所有不重复的排列(自动去重)
unique_perms = set(permutations(N))
counter = 0
for perm_tuple in unique_perms:
substring = "".join(perm_tuple) # 拼接为字符串
if substring in H: # Python 的 in 操作符高效判断子串存在性
counter += 1
print(counter)更简洁的写法(一行计算):
from itertools import permutations
N, H = input().strip(), input().strip()
print(sum("".join(p) in H for p in set(permutations(N))))⚠️ 注意事项:
- 该方法时间复杂度为 O(|N|! × |N| + |N|! × |H|),适用于 |N| ≤ 8 的小规模场景;若 N 较长(如 > 10),需改用滑动窗口 + 字符频次统计(如 Counter)的线性解法,避免生成全排列。
- input().strip() 可防止首尾空格干扰;
- set(permutations(N)) 依赖元组的不可变性与哈希性,对纯字母字符串完全安全;
- 不推荐在循环中重复调用 "".join(...) 多次——当前已优化为每次只拼一次。
总结:核心在于理解“distinct permutations”的本质是去重后的排列集合,而非全排列数量;善用 set 和语义化命名,即可写出准确、可读、健壮的解决方案。










