JAVA学习(三):replaceAll的妙用:正则表达式的捕获与反向引用 |
您所在的位置:网站首页 › 正则表达式最大值的数字是多少 › JAVA学习(三):replaceAll的妙用:正则表达式的捕获与反向引用 |
在java里,替换字符串中指定的内容,有两个方法,replace和replaceAll。两个方法的不同点在于:replace不能使用正则表达式,而replaceAll可以使用正则表达式,所以replaceAll的功能更强大,与正则表达式配合,可以实现一些很强大的功能。 需求:把字符串"a3344b234c333a4444a3322abc33"中的数字全部去掉,要怎么做?当然,这个用replace,也可以做,只是很麻烦了。如果用replaceAll,处理就非常方便。 这样就搞定了。然后,我们改一下需求:依旧是上面的字符串,但现在要求,只把a后面的数字去掉,要怎么弄?首先,要去掉的是数字,其次,数字必须是跟在a后面的。而对这样一个需求,我一开始想到的是用非捕获组。也就是把a放在非捕获组里,但运行一下程序,没用。非捕获组,只是不把a放入捕获组里,但还是会匹配。所以结果是不对的 括号内以?:开头,代表的就是非捕获组。但看结果,实际上是a也去掉了,明显与需求不符。当然,就这个需求可以把第二个参数写成a即可轻松实现,但这并不是我所要讲的东西, 如果需求再改一下,把a或b后面的数字去掉,这样,第二个参数就没办法用固定的字符串了。这个时候,就需要用到反向引用。一个正则表达式,在进行分组捕获的时候,最多可以保留10个组的数据。序号从0-9。在正则表达式外,进行分组引用,以$开头,$0代表第一个分组,$1代表第二个,以此类推。所以就可以把a捕获到分组里面,再在第二个参数里引用,这样就可以实现需求,代码运行效果 整个正则表达式为一个分组,序号是0,(a)的序号就是1。如果要把a或b后面的数字去掉,也简单 现在,我们再改需求。。。呃,这应该是开发最头疼的事情,程序写得差不多了,需求改了!那也没得办法啊,该改的还是要改。只不过,好改不好改,改得多与少,也和自已写的代码的布局有很大的关系,而这也是反映一个程序员的能力的一个方面吧。言归正传,现要需求是:把连续出现的数字去重。这个又要怎么做?这个时候,还是要用反向引用,这一次,不单要在正则表达式外面引用,正则表达式本身也要使用反向引用。在正则表达式内部,通过\0、\1……来引用第一个、第二个……分组 在正则表达式里面,(\\d)捕获一个数字,然后\\1引用前面的分组,+代表至少出现一次,最多不限制。也就是一个数字,至少要连续出现两次,才能够匹配上这个正则表达式,最多不限制。再改需求。。。我保证,这是最后一次改需求!!!把a或b后面连续出现的数字去重。如果是只把紧跟在a或b后面的数据去重,这个好做 那如果要把a或b后面所有重复的数字去重,这个,我也没有实现。但有个表达式,可以拿来研究一下 这个结果是怎么来的?首先,我们要明白一点,捕获组出现嵌套时,组的序号,从外面算起还是从里面算起?组的序号是从外层算起的,怎么理解这一点呢?首先,整个表达式是一个分组,而它的序号是0。所以越外层的分组,序号越小。在上面的正则表达式里,([ab])分组的序号是1,后面外层括号的分组序号是2,里层分组的序号是3。所以\\3引用的分组是(\\d)。分组2用了量词*,代表可以不出现,也可以出现任意次。拿第一个a来说,第二个分组首先会捕获33,然后又会捕获44,把之前捕获的33覆盖掉,所以这个时候第三个分组里就是4,在replaceAll的第二个参数里引用了第一个分组和第三个分组,结果就是a4,这就是下面的结果了。 最后,来一个简单点的需求,有字符串"abc",我要把每个字母都连续重复一次,也就是要变成"aabbcc"。怎么做? 更简单点的 欢迎加入测试群:91425817,一起讨论测试的那此事。 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |