我在修改一个 WordPress 插件,需要从 WordPress 生成的网页源码里截取一部分。但是源码里偶尔有 反斜杠+数字 的情况,匹配的结果异常,结果里会吞掉 反斜杠和后面的两位数字。
<?php
header('Content-type: text/html; charset=UTF8');
// 自己写 demo 测试,不管单引号还是双引号定义的字符串,都不会“吞掉”
$str="
<div class=\"post_t\">
文本文本
\f
\1
\9999
<div></div>
</div>";
$regexp="/\"post_t\".*<div/s";
preg_match($regexp, $str ,$match);
echo $match[0];
// 但是插件里的这个字符串变量不是我定义的,匹配结果也不一样:
// \f 反斜杠后面是字母的话没有变化,输出 \f
// \1 反斜杠和数字一起消失,最多消失前两个数字,所以输出是空的
// \9999 输出 99
我百思不得其解,就算是反斜杠部分被当成了其他进制,也不该吞掉啊。不知各位有没有遇到过这个情况,有什么经验吗,谢谢!