编程语言


Linux正则表达式特性详解及BRE与ERE的异同点

网络编程 Linux正则表达式特性详解及BRE与ERE的异同点 06-21

 Linux正则表达式(Regular Expression)主要遵从POSIX BRE或者POSIX ERE标准。什么是POSIX呢,POSIX Portable Operating System Interface 可移植操作系统接口ERE是BRE的扩展版本,具体更强的处理能力,并增加了一些元字符(metacharactor)。

  BRE主要的能力集有:

  1) 普通字符(Literal text),如a,b,c等

  2)非打印字符,包括TAB,回车,换行,回车换行(WINDOWS)

  3)任意字符.

  4)字符集,包括单词型字符([[:alnum:]]),非单词型字符([^[:alnum:]]),数字([[:digit:]]),非数字([^[:alnum:]]),空格、TAB、换行等空白字符([[:space:]])以及非空白字符([^[:space:]])

  5)边缘匹配符,不管是BRE还是ERE,都只支持匹配行首或行尾,不像perl,还可以匹配单词首和单词尾

  6)匹配重复次数(Quantifier/Repetition)

  7)分组及后向引用

  8)多项匹配(Alteration),使用元字符|,该特性只ERE支持,BRE没有此功能

  BRE与ERE似乎对ASCII和UNICODE是否都支持尚待确认;

  正前向查找和负前向查找不支持;

  正后向查找和负后向查找不支持;

  BRE与ERE在能力上区别仅在多项匹配的能力上,其他方面没有大的差别,主要的区别体现在元字符上。

  BRE只定义了4组元字符:

  [] 用于在多个字符中选定一个字符进行匹配,[]内可以有-以示范围,但-本身不是元字符

  . 用于匹配任意字符

  ^ 用于匹配时表示“非”的含义,还有一个用法是匹配行首

  $ 用于匹配行尾

  ERE在此基础上增加了3组元字符的定义:

  {} 用于表示重复匹配的次数。BRE中只将{}当作普通字符对待,要使用此功能必须加进行转义,即“{}”

  () 用于分组。BRE中只将()当作普通字符对待,要使用此功能必须加进行转义,即“()”

  | 完全为ERE新增的多项匹配能力定义的,BRE无多项匹配能力,只将|作普通字符对待

以上内容是小编给大家介绍的Linux正则表达式特性详解及BRE与ERE的不同,希望大家喜欢。

Linux下如何使用grep命令查找带有tab(退格)的字符
需要在日志文件统计删除的主帖,而日志文件是tab(退格)字符隔开的;假设日志文件名叫delete.log。保存格式和保存的数据如下,删除日期帖子类型(1

WEB开发时常用的正则表达式(PHP和Javascript)
在WEB开发中,正则表达式通常用来检测、查找替换某些符合规则的字符串,如检测用户输入E-mai格式是否正确,采集符合规则的页面内容等等。下面分别

比较全面的C 、Java、JavaScript中的正则表达式详解
什么是正则表达式?正则表达式(RegularExpression)就是用某种模式去匹配一类字符串的公式。如你要在一篇文章中查找第一个字是罗最后一个字是浩的三个


编辑:编程语言

标签:字符,能力,多项,正则表达式,此功能