
如何解析字符串层级结构
问题:
如何区分字符串中不同层级的分隔符,以便按层级正确解析字符串?
回答:
确定分隔符层级
- 首先需要确定字符串中分隔符的层级关系。
例如,下述字符串中的竖线 (|) 有不同的层级:
str = 'a [ b { c | d } | e ]'- 第一个竖线 (|) 分隔 c 和 d;
- 第二个竖线 (|) 分隔 b 和 e。
为了让程序识别层级,可以使用以下方法:
# 定义字典,存放分隔符位置和层次
c = {}
# 循环遍历字符串
n = 0
find = 1
while n < len(str):
# 进入较高层级
if str[n] in ("[", "{"):
find += 1
# 退出较低层级
if str[n] in ("]", "}"):
find -= 1
# 记录当前分隔符的位置和层次
if str[n] == "|":
c.setdefault(find, [n])
if n in c[find]:
c[find].append(n)
n += 1输出结果:
{
1: [1],
2: [4, 11],
3: [7, 8]
}- 键值表示层级。
- 值表示该层级中分隔符的位置。
解析字符串层级
了解分隔符层级后,即可逐层解析字符串:
# 初始化存储结果的列表
result = [str]
# 逐层解析
for level in sorted(c.keys(), reverse=true):
temp = []
for pos in c[level]:
temp.extend(result.pop().split(str[pos]))
result.append(temp)输出结果:
['A', 'B { C | D } | E']
['A', ['B { C | D }', 'E']]
['A', ['B', '[ C | D ]', 'E']]
['A', ['B', ['C', 'D'], 'E']]










