我需要按特定数量的标签分割字符串 (。我想出了正则表达式
pattern = 和 |
|
|
|
|
|
|
|
re.split
基本上它可以完成工作
test_string = 'Some text some text some text.
Another text another text
.
Some text some text some text.
Another text another text
. ', ' some list . ', ' another list ']`但我想捕获开始和结束标签并将标签保留在分割文本中。类似的东西
['Some text some text some text.
Another text another text
. ', '
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
回答您的具体问题:
并且匹配而不是拆分。
\1指的是开始标记中捕获的内容。类似于:
但是,在大多数真实情况下,这不足以处理 HTML,您应该考虑 DOM 解析器。