python正则表达式 您所在的位置:网站首页 区间的表达形式 python正则表达式

python正则表达式

2023-10-24 19:51| 来源: 网络整理| 查看: 265

re.search(pattern, string)函数

从string中查找第一个符合pattern正则表达式模式的子串。 参数说明:

pattern:要搜寻的正则表达式;string:要检索的字符串;

具体实例:

import re a = re.search(r'fox','the quick brown fox jumpred') #第一个参数为正则表达式,第二个参数为要处理的字符串 print(a.span()) # span方法获取的是正则表达式匹配到的位置 b = re.search(r'www','the quick brown fox jumpred') print(b) #如果匹配不到则会返回None

输出结果为:(16,19),None

正则表达式区间的表达方式

有一些常见的字符组非常大,比如,我们要匹配的是任意数字,如果依照上述代码,每次我们都需要使用[0123456789] 这种方式明显很不明智,而如果要匹配从a-z的字母,我们也这样编写代码的话,肯定会让我们崩溃。

为了适应这一点,正则表达式引擎在字符组中使用连字符(-)代表区间,所以我们匹配任意数字可以使用[0-9],所以如果我们想要匹配所有小写字母,可以写成[a-z],想要匹配所有大写字母可以写成[A-Z]。

可能我们还有个需求:匹配连字符。因为-会被正则表达式引擎理解为代表连接区间,所以这个时候我们需要对-进行转义。示例:

a = re.findall(r'[0-9]','xxx007abc') b = re.findall(r'[a-z]','abc001ABC') c = re.findall(r'[A-Za-z0-9]','abc007ABC') d = re.findall(r'[0-9\-]','0edu 007-edu') print(a) print(b) print(c) print(d)

执行结果如下:

['0', '0', '7']

['a', 'b', 'c']

['a', 'b', 'c', '0', '0', '7', 'A', 'B', 'C']

['0', '0', '0', '7', '-']

正则表达式区间取反的表达方式

到目前为止,我们定义的字符组都是由可能出现的字符定义,不过有时候我们可能希望根据不会出现的字符定义字符组,例如:匹配不包含数字的字符组。

a = re.findall(r'[^0-9]','xxx007abc') b = re.search(r'[^0-9]','xxx007abc') print(a) print(b)

执行结果如下:

['x', 'x', 'x', 'a', 'b', 'c']

可以通过在字符数组开头使用 ^ 字符实现取反操作,从而可以反转一个字符组(意味着会匹配任何指定字符之外的所有字符)。

 

接下来再看一个表达式:n[^e] 这意味着字符n接下来的字符是除了e之外所有的字符。

a = re.findall(r'n[^e]','final') b = re.search(r'n[^e]','final') c = re.findall('r[n[^e]]','Python') print(a) print(b) print(c)

执行结果如下:

['na']

[]

这里我们可以发现a和b匹配的是na,字符a因为不是e所以可以被匹配,而变量c的值为空,在这里正则表达式引擎只匹配到了字符串n的位置,而n之后没有任何可以匹配[^e]的字符了,所以这里也匹配失败。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有