一 正则表达式概念详解
(1)什么是正则表达式
它是一种字符串匹配的模式(pattern),主要是用来查找和匹配字符串的,尤其在python爬虫上用的多
在实际开发过程中经常会有查找符合某些复杂规则的字符串的需要,比如:邮箱、图片地址、手机号码等,这时候想匹配或者查找符合某些规则的字符串就可以使用正则表达式了
(2)正则表达式的特点
1正则表达式的语法很令人头疼,可读性差
2正则表达式通用行很强,能够适用于很多编程语言
(3)re模块的介绍
1首先,我们要导入模块re,re是内置模块,所以不需要额外安装
import re
2 re模块的使用:使用match方法进行匹配操作
re.match()必须从字符串开头匹配!match方法尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。主要参数如下:
re.match(pattern, string) # pattern 匹配的正则表达式 # string 要匹配的字符串
实例:
import re a = re.match('test','testasdtest') print(a) #返回一个匹配对象 print(a.group()) #返回test,获取不到则报错 print(a.span()) #返回匹配结果的位置,左闭右开区间 print(re.match('test','atestasdtest')) #返回None
运行效果:
本文作者为BUG之神,转载请注明。