如何使用php正则表达式进行懒惰匹配?
php 中的懒惰匹配通过 ? 限定符实现,它让正则表达式引擎匹配尽可能少的字符。例如,/(regex)?/ 将匹配字符串中尽可能少的、满足正则表达式 (regex) 的部分。它可确保更精确的结果,例如提取 html 标签的内容时避免捕获嵌套的内容。
如何使用 PHP 正则表达式进行懒惰匹配
什么是懒惰匹配?
懒惰匹配是一种正则表达式概念,它允许正则表达式遍历字符串时匹配尽可能少的字符。与贪婪匹配相比,它匹配的字符更少,从而通常导致更精确的结果。
立即学习“PHP免费学习笔记(深入)”;
使用 ? 限定符
在 PHP 中,可以使用 ? 限定符来指定懒惰匹配。它指示正则表达式引擎尽可能少地匹配重复出现或可选的元素。
语法:
/(regex)?/
实战案例:
假设我们有一个 HTML 字符串,我们想提取其中的所有
标签的内容:
<p>段落 1</p><p>段落 2<span>文本</span></p><p>段落 3</p>
使用贪婪匹配,正则表达式 /
(.*)/ 将返回:
段落 1<p>段落 2<span>文本</span></p>段落 3
由于第一个
标签的内容包含嵌套的 标签,贪婪匹配导致它匹配了所有子标签。
使用懒惰匹配,正则表达式 /
(.*?)/ 将返回:
段落 1段落 2<span>文本</span>段落 3
懒惰匹配仅匹配第一个
标签的内容,因为它只匹配尽可能少的内容。
其他示例: