正则表达式及php中的正则函数
正则表达式 (regular expression), 常简写为 regex, 用于在字符串中进行比较复杂的匹配
perl 和 ereg现有两种类型的正则表达式 perl 和 POSIX, perl 类型 更规范,执行效率越高, POSIX 类型常用于 Unix
php 提供了两套正则表达式函数库
preg_ 系列以 perl 为基础
ereg_ 系列以 POSIX 为基础
preg_ 系列更常用,ereg_ 将要被淘汰
原子基本字符
ASCII码中,除了下面要介绍的字符之外的,所有字符。基本字符与下面要介绍的各种特殊字符与模式结合使用,就形成了所谓的正则表达式。
单元符号 ()圆括号中的基本字符在匹配时被看做一个整体。
该整体会保存在内存中,可作为整体获取,例如 "/go(abc)g\\1le/" 可以匹配 goabcgabcle, \\1 对应了 abc。
这种方法可用于匹配不同格式的日期 "/2014(.*)06\1(13)/" 可匹配 2014/06/13 或 2014-06-13 , 但不可匹配 2014-06/13 。这里 \\1(13) 如不加括号会被认为内存中的第 113 号。
也可以用模式修饰符 x 实现 "/2014(.*)06\1 13/x",
原子表 []与单元符号相反,原子表用于匹配其中的中任意一个原子。
原子表中 x-y 匹配 x 到 y 范围内的字符, 常见用法如下
需要注意的是 ^ 符号在原子表中表示排除,而在元字符中表示开头
转义字符就是一些常用原子表表达式的简写
元字符 metacharacter
运算顺序
从高到底
()
* ? + {}
^ $ \b
|
基本字符
模式修饰符
模式修饰符在正则之外使用,格式为 /正则/U , U 代表模式修饰符
正则表达式应用
PHP preg_ 系列函数preg_match
执行一个正则表达式匹配,没什么可多说的,例子如下
$subject="标题:{title}<br>作者:{author}<br>内容:{con}";$pattern=("/{(.*)}/U");preg_match($pattern,$subject,$matches);print_r($matches);
输出
Array([0]=>{title}[1]=>title)
这里只匹配了一个就停止了是因为我们加了模式修饰符 U
preg_match_all与 preg_match 的区别在于,preg_match_all 在第一个匹配找到后,从结束位置继续进行搜索,使用相同的目标字符和正则表达式
$subject="标题:{title}<br>作者:{author}<br>内容:{con}";$pattern=("/{(.*)}/U");preg_match_all($pattern,$subject,$matches);print_r($matches);
输出结果如下
Array([0]=>Array([0]=>{title}[1]=>{author}[2]=>{con})[1]=>Array([0]=>title[1]=>author[2]=>con))preg_replace
用给定内容替换正则表达式匹配的内容,并返回修改后的字符串,以下是一个实现非常简单的类 smarty 模板例子
$subject="标题:{title}<br>作者:{author}<br>内容:{con}";$pattern=array("/{title}/","/{author}/","/{con}/");$replacement=array("Myregex","gipanda","simplesmarty");echopreg_replace($pattern,$replacement,$subject);
输出
标题:Myregex作者:gipanda内容:simplesmartypreg_replace 与 e 模式修正符
模式修正符 e 用于执行 replacement 中的内容
$subject="test<fontcolor=red>a</font>test";$pattern=("/(a)/e");echopreg_replace($pattern,"md5('\\1')",$subject);
输出
test0cc175b9c0f1b6a831c399e269772661test
不加模式修正符 e 会输出
testmd5('a')test
md5() 没有被当做函数执行
preg_split按给定正则(一般式原子表)分割字符串
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。