PHP正则表达式提取URL参数失败?
php正则非预期截取:解析url参数的注意点
对于url参数提取的常见需求,您希望保留&referer=和&username之间的部分。以下是一个示例url:
web.admin.com/admin/usermanage/investuser?start=2018-01-02%2000:00:00&end=2018-01-02%2010:41:46&itype=3&isfirst=3&referer=http://testhf.irongbei.com/muserregister/register2?v=10f454&key=311bcdec754052e40fe025a54f488f9a&rbref=rbzc&isshow=&username=&pname=&plattype=0&istatus=1&buy_type=0&channel_source=62
但令人意外的是,正则表达式提取到的并不是预期中的部分。
这是因为提供的url中存在一个问题:当url作为参数嵌入另一个url时,它应该被编码(urlencode)。例如,http://test.com?example应该编码为http://test.com?example。
立即学习“PHP免费学习笔记(深入)”;
如果没有进行编码,参数中的&符号可能会被误认为是url中的分隔符,从而导致提取结果不正确。
正确的做法:
确保url已正确编码。在php中,可以使用urlencode()函数对要嵌入的url进行编码:
$encodedUrl = urlencode('http://testhf.irongbei.com/MUserRegister/register2?v=10f454&key=311bcdec754052e40fe025a54f488f9a&rbref=rbzc&isShow=&username=&pname=&plattype=0&istatus=1&buy_type=0&channel_source=62');