php中的正则函数:正则匹配,正则替换,正则分割所有的操作都不会影响原来的字符串.

2024-04-13 07:21| 来源: 网络整理| 查看: 265

### 有一个长期的误解, 如果要分组, 必须用小括号和 |, 而不能用中括号和 |. `[ab|AB] `表示的不是匹配 ab或 AB, 而是表示匹配 a,b, |, A, B 这5个字符中的任意一个字符. 要表示匹配 ab或 AB, 必须/只能用 `(ab|AB) `才可以总之, 使用字符串函数还是使用正则匹配, 主要看被处理的 (通常是要被匹配的或要被替换的字符串) 是确定的不变的子串, 还是不确定的, 如果是确定的, 已知的那就用字符串函数, 如果是不确定的, 模糊的那就用正则匹配, 当然正则匹配由于需要正则引擎的支持, 所以效率和速度肯定更慢. ### 要匹配单词的开头或结尾, 匹配位置的时候, 有两种情形, 如果是在vim中, 使用的匹配符号是 `\ `, 但是, 如果是在通用的 , perl正则表达式, php的 preg正则表达式, 则要用 `\b...\b` 这里的 \b 表示的是 boundary 即边界 , 注意他匹配的是 "空格, 标点符号, 回车符等的位置 ", 是位置, 并不包含空格等这些符号本身. 要掌握一个函数，只要掌握其参数和返回值就可以了，参数要掌握完整的参数表，包括那些可选参数。正则函数的 features：

1.php的正则函数，分为三种功能，正则匹配match，正则替换replace，正则分割

php的正则函数有两种体系，一种是pcre的pcre_... 一种是 posix体系的 ereg_ 或 eregi_... php的正则函数的参数顺序，基本上都是相同的，即： funcName( $patter, [$replacement], $string, [$supplement]) php的正则函数都有对应的非正则函数版本，比如：匹配的有 strpos， strstr，字符串替换的有 str_replace, 字符串分解的有 explode， str_split等是所有的正则函数(和字符串操作函数, 包括字符串分割/替换/匹配操作)，都不会对原来的字符串参数造成影响，通常只是对字符串参数的一个拷贝进行操作的。而且现在的函数都不允许传引用参数了. 而且大多字符串操作函数, 都可以在对应的字符串参数位置对数组进行操作. 第一，分割字符串，正则分割分割后的结果，都是放在另外的一个数组中。分割的方式有两种，一种是根据指定的分割字符来分割，如preg_split, split, explode; 另一种是根据指定的 "等数" 字符数来分割，如str_split

$split_result = preg_split($patter, $string [,$limit] [,$flags]) 与他类似的posix函数 split： $result = split($patter, $string [,$limit])

返回结果：返回分解后的单元，放在函数外部的另外的一个数组变量来接收。可能的分解情况：

分解模式$patter没有包含原字符串中，则返回整个字符串的单元素数组；分解模式 $patter=//, 即模式字符串中不包含任何东西，则会将原字符串的拷贝分解为一个一个的字符。并且首尾会多两个空白元素其他正常分解模式。

$limit 是指 **最多*分解成（并返回）$limit 个分解单元，这个参数最容易被误解，它不是说先把整个字符串分割，然后返回 $limit个子串，然后剩下的就不要了，实际上不是这样的，正确的意思是：每次分割总是要把全部字符串分割完并返回，而是说 **整个**字符串最多分割成$limit个子串。如果不确定，要全部返回就用 -1. $flag,说的是返回的子串应该满足些什么条件，最常用的有一个： PREG_SPLIT_NO_EMPTY。

正则表达式的最小匹配原则

要掌握正则表达式的几个匹配原则:

就是默认的是最长/贪婪匹配, 要实现最小/懒惰匹配, 需要在 .* 的后面加上? 因为问号是匹配 0次或1次, 所以最多就是匹配一次. 这就是最小匹配原则 , 注意一定是 .* 后面加?, 而不是在字符元字符的后面加上问号,比如 a*? 可能就是错误的??? 也就是最小匹配, 有一个固定的写法,就死 .*? 这里起最小匹配作用的是 ? 问号

最早先赢的原则: 最先匹配的字符具有更高的优先级 the match that begins earliest wins

正向匹配原则, 不管是贪婪匹配, 还是最小匹配, 都是遵循从左到右的匹配原则, 意思是说, 当一个匹配开始后, 如果在中间遇到另一个开头字符的时候, 他不会认为是另一个匹配的开始....

==================

第二, 替换字符串, 正则替换

str_replace的原型: $result_after_replace = str_replace( $find, $replacement, $str [, $count_replace]) 这个函数中, 不允许传引用参数, 最后的那个可选参数是被替换的次数. 如果$find $replacement是数组, 则表示一对一替换.

[@str_replace("要替换的旧内容", "要取代原内容的新字符", $被替换内容的变量名)] [@str_replace(array('旧1','旧2','旧3'), array('新1','新2','新3'), $被替换内容的变量名)] // 一对一替换 [@str_replace(array('旧1','旧2','旧3'), '新内容', $被替换内容的变量名)] // 一对多替换.

正则替换的函数原型: $result_after_replace = preg_replace($pattern, $replacement, $string [, [$limit=-1] [, $replaceCount]]) 跟 str_replace有些类似. 同样的也可以处理数组, $pattern 和 $replace 都可以是数组, 替换法则也是一样, 只是多了一个 $limit 参数. 而且在数组的正则替换中, 可以使用后向引用, 在后向引用中, 使用 `$n来表示模式中的部分. 如果$n` 后面还有其他数字或字母, 为了区别, 要将 n用大括号括起来. `${n}abc`等.

同样的:

正则替换函数, 不会改变原来的原始字符串. 下面是体现上述正则匹配几个原则的首先匹配优先\ 最小匹配 \ 的一个好例子:

【本文地址】

公司简介

联系我们

php中的正则函数:正则匹配,正则替换,正则分割 所有的操作都不会影响原来的字符串.

php中的正则函数:正则匹配,正则替换,正则分割所有的操作都不会影响原来的字符串.