Python正则表达式中,如何正确匹配并保留括号?
正则表达式匹配小括号的困惑
python 正则表达式提供 findall() 函数来查找并返回匹配子字符串的列表。在匹配小括号时,需要注意以下区别:
当正则表达式不包含捕获组时,findall() 返回匹配结果的列表。例如:
import remy_sin = re.compile(r'sin(.+?)', re.dotall)print(re.findall(my_sin, 'sin(30)'))
输出结果:
立即学习“Python免费学习笔记(深入)”;
['sin(30)']
括号本身被包含在匹配结果中。
当正则表达式包含一个或多个捕获组时,findall() 会返回一个包含捕获组内容的列表。例如:
trigonometric_functions = re.compile(r'(cos|sin|tan|arcsin|arccos|arctan)(.+?)', re.dotall)print(re.findall(trigonometric_functions, 'sin(30)'))
输出结果:
立即学习“Python免费学习笔记(深入)”;
['sin']
括号不包含在匹配结果中,因为正则表达式中的小括号形成一个捕获组。要保留括号,可以使用非捕获组形式:
trigonometric_functions = re.compile(r'(?:cos|sin|tan|arcsin|arccos|arctan)(.+?)', re.DOTALL)