正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能不一样,不过只要学会了任意一门语言的正则表达式用法,其他语言中大部分也只是换了个函数的名称而已,本质都是一样的。下面,我来介绍一下python中的正则表达式是怎么使用的。
1.正则表达式的语法规则
2.常见函数
1)re.match
从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none
语法:*re.match(匹配的正则表达式, 要匹配的字符串)
2)re.findall
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表
3)re.search
扫描整个字符串并返回第一个成功的匹配
3.python正则表达式提取数字
d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;.?这个是匹配小数点的,可能有,也可能没有;d*这个是匹配小数点之后的数字的,所以是0个或者多个;