Python基础篇之正则表达式

百变鹏仔 3个月前 (02-07) #Python

文章标签基础

正则表达式并不是python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。下面这篇文章主要介绍了关于python正则表达式基础的相关资料，需要的朋友可以参考下。

前言

之前有人提了一个需求，我一看此需求用正则表达式最合适不过。考虑到之前每次使用正则表达式，都是临时抱佛脚，于是这次我就一边完成任务一边系统的学习了一遍正则表达式。主要参考PyCon2016上的一个视频Regular Expressions。

我将分几篇文章对正则表达式进行总结。

以下是第一部分，基础：

立即学习“Python免费学习笔记（深入）”；

基础部分

这里总结了正则表达式最基础的用法，其中大部分内容对我（以及大部分程序员）来说都是平时经常用到的，所以我就一笔带过了，只对其中的几处用例子说明。

. 除了换行之外的其他所有字符

^ 行首

$ 行尾

[abcd] abcd其中的一个字符

[^abcd] 除了abcd之外的任意字符

[a-d] 相当于[abcd]

[a-dz] 相当于[abcdz]

单词边界

w 字母数字或下划线相当于[a-zA-Z0-9_]

W 与w相反

d 数字，相当于[0-9]

D 与d相反

s 空白字符，相当于[ ]

S 与s相反

{5} 在此之前的正则表达式部分（下同）准确的出现5次

{2,5} ~出现2到5次

{2,} ~出现2次或多次

{,5} ~出现0到5次

* ~出现0次或多次

？ ~出现0次或1次

+ ~出现1次或多次

ABC|DEF 匹配ABC或者DEF

转义字符，如表示匹配*，$表示匹配$*

、用以下几个例子简单说明一下：

：

&gt;&gt;&gt; re.search(r'hello', 'hello')<_sre.sre_match>&gt;&gt;&gt; re.search(r'hello', 'hello world')<_sre.sre_match>&gt;&gt;&gt; re.search(r'hello', 'hello,world')<_sre.sre_match>&gt;&gt;&gt; re.search(r'hello', 'hello_world') &gt;&gt;&gt;</_sre.sre_match></_sre.sre_match></_sre.sre_match>

其实这里，大体上和W一支，但是可以匹配行首行尾等非显示类的字符，而W不可以。

&gt;&gt;&gt; re.search(r'$100', '$100')<_sre.sre_match>&gt;&gt;&gt; re.search(r'$100', '$100') &gt;&gt;&gt;</_sre.sre_match>

想要匹配那些在正则表达式中有特殊含义的字符，如$、^、*等，就需要用进行转义。

raw string:

另外，前面例子中，模式字符串（pattern）前面都加了一个r，这个r的意思是raw string，后面所接的字符串，Pyhton解释器无需对其进行转义。因为，在Python字符串中和正则表达式中都有特殊含义，所以如果不是raw string，那么要表达一个字符，就需要四个了（在Python解释器中先转义一次，2个表示1个，剩下2个，在正则表达式中又转义一次，最终剩下一个）。例如：

&gt;&gt;&gt; re.search(r'hello', 'hello')<_sre.sre_match>&gt;&gt;&gt; re.search('hello', 'hello') &gt;&gt;&gt; re.search('\bhello\b', 'hello')<_sre.sre_match>&gt;&gt;&gt; re.search('\\hello\\', '\hello\') <_sre.sre_match>&gt;&gt;&gt; re.search(r'\hello\', '\hello\') <_sre.sre_match>&gt;&gt;&gt; print('\hello\')hello</_sre.sre_match></_sre.sre_match></_sre.sre_match></_sre.sre_match>

【

文章推荐

Python基础篇之正则表达式

Python实现字典的key和values的交换

使用Python脚本来获取Cisco设备信息的示例

Python的Django中django-userena组件的简单使用教程

零基础写python爬虫之神器正则表达式

零基础写python爬虫之抓取百度贴吧代码分享