Python 正則表達(dá)式語法詳解：新手友好版

編程獅（w3cschool.cn） 2025-05-28 14:31:48 瀏覽數(shù) (2076)

反饋

在處理文本數(shù)據(jù)時(shí)，正則表達(dá)式是一種功能強(qiáng)大的工具。Python 的 re 模塊提供了豐富的正則表達(dá)式功能，可以幫助我們高效地進(jìn)行文本匹配、搜索、替換和提取數(shù)據(jù)。本文將通過簡單的示例，深入淺出地講解 Python 正則表達(dá)式的語法和常見用法。

正則表達(dá)式基礎(chǔ)

正則表達(dá)式（Regular Expression，簡稱 regex）是一個(gè)特殊的字符序列，用于定義文本搜索模式。它可以幫助我們在文本中查找、匹配、替換和分割特定的字符或字符串。

常用元字符

正則表達(dá)式中包含一些具有特殊含義的元字符：

. ：匹配任意字符（換行符除外）
^ ：匹配字符串開頭
$ ：匹配字符串結(jié)尾
* ：匹配前面的字符出現(xiàn) 0 次或多次
+ ：匹配前面的字符出現(xiàn) 1 次或多次
? ：匹配前面的字符出現(xiàn) 0 次或 1 次
{n} ：匹配前面的字符出現(xiàn) n 次
{n, m} ：匹配前面的字符出現(xiàn)至少 n 次但不超過 m 次
[] ：匹配括號內(nèi)指定的任意字符
[a-z] ：匹配指定范圍內(nèi)的任意字符（如 a 到 z）
\d ：匹配任意數(shù)字（等同于 [0-9]）
\s ：匹配任意空白字符（如空格、制表符、換行符）
\w ：匹配任意字母或數(shù)字（等同于 [a-zA-Z0-9_]）

Python `re` 模塊常用方法

1. `re.match()` 方法

re.match() 方法用于檢查字符串開頭是否匹配給定的模式。如果匹配成功，返回一個(gè)匹配對象；否則返回 None。

示例：檢查字符串是否以特定模式開頭

import re


pattern = '^a...s$'  # 匹配以 'a' 開頭，后面跟任意三個(gè)字符，再以 's' 結(jié)尾
test_string = 'abyss'  # 編程獅示例字符串
result = re.match(pattern, test_string)


if result:
    print("搜索成功。")
else:
    print("搜索失敗。")

輸出：

搜索成功。

2. `re.findall()` 方法

re.findall() 方法用于在字符串中提取所有匹配模式的子串，并返回一個(gè)列表。

示例：提取字符串中的所有數(shù)字

import re


string = '你好 12 世界 89。W3Cschool 編程獅 34'
pattern = '\d+'  # 匹配一個(gè)或多個(gè)數(shù)字
result = re.findall(pattern, string)
print("字符串中的數(shù)字:", result)

輸出：

字符串中的數(shù)字: ['12', '89', '34']

3. `re.search()` 方法

re.search() 方法用于在字符串中查找第一個(gè)匹配模式的部分。如果找到，返回一個(gè)匹配對象；否則返回 None。

示例：檢查字符串中是否包含特定模式

import re


string = "Python 是有趣的編程語言"
match = re.search('Python', string)  # 搜索框中帶有 Python 關(guān)鍵詞的文本內(nèi)容


if match:
    print("字符串中找到匹配的模式。")
else:
    print("字符串中未找到匹配的模式。")

輸出：

字符串中找到匹配的模式。

4. `re.sub()` 和 `re.subn()` 方法

re.sub() 方法用于替換字符串中匹配模式的部分，返回替換后的字符串。re.subn() 方法則返回一個(gè)元組，包含替換后的字符串和替換的次數(shù)。

示例：移除字符串中的所有空白字符

import re


string = 'abc 12\ de 23 \n f45 6'
pattern = '\s+'  # 匹配一個(gè)或多個(gè)空白字符
replace = ''
new_string = re.sub(pattern, replace, string)
print(new_string)

輸出：

abc12de23f456

5. `re.split()` 方法

re.split() 方法用于按照匹配模式分割字符串，并返回一個(gè)列表。

示例：按照數(shù)字分割字符串

import re


string = 'Twelve:12 Eighty nine:89.'
pattern = '\d+'  # 匹配一個(gè)或多個(gè)數(shù)字
result = re.split(pattern, string)
print(result)

輸出：

['Twelve:', ' Eighty nine:', '.']

正則表達(dá)式進(jìn)階技巧

1. 使用修飾符

修飾符可以改變正則表達(dá)式的匹配行為。常見的修飾符包括：

re.IGNORECASE：忽略大小寫
re.MULTILINE：多行模式
re.DOTALL：. 匹配包括換行符在內(nèi)的所有字符

示例：忽略大小寫的匹配

import re


string = 'Hello W3Cschool'
pattern = 'hello'
match = re.search(pattern, string, re.IGNORECASE)  # 匹配時(shí)忽略大小寫


if match:
    print("忽略大小寫匹配成功。")
else:
    print("匹配失敗。")

輸出：

忽略大小寫匹配成功。

2. 使用分組

通過在正則表達(dá)式中使用括號 ()，可以對匹配的部分進(jìn)行分組，方便提取特定數(shù)據(jù)。

示例：提取日期中的年、月、日

import re


date_string = '2025-05-28'
pattern = '(\d{4})-(\d{2})-(\d{2})'  # 分組提取年、月、日
match = re.match(pattern, date_string)


if match:
    year, month, day = match.groups()
    print(f"年份：{year}，月份：{month}，日期：{day}")
else:
    print("日期格式不正確。")

輸出：

年份：2025，月份：05，日期：28

編程獅課程推薦

如果你想更系統(tǒng)地學(xué)習(xí) Python 編程和正則表達(dá)式，歡迎訪問 Python零基礎(chǔ)到高薪就業(yè)。我們提供了以下相關(guān)課程：

Python 基礎(chǔ)入門：從零開始學(xué)習(xí) Python 編程，掌握基本語法和數(shù)據(jù)結(jié)構(gòu)。
Python 數(shù)據(jù)處理與分析：學(xué)習(xí)如何使用 Python 進(jìn)行數(shù)據(jù)處理，重點(diǎn)講解正則表達(dá)式的應(yīng)用。
Python Web 開發(fā)實(shí)戰(zhàn)：基于 Django 或 Flask 框架的 Web 開發(fā)課程，實(shí)際項(xiàng)目中運(yùn)用正則表達(dá)式。

在編程獅，我們致力于為每一位學(xué)習(xí)者提供高質(zhì)量的編程教育資源，幫助你實(shí)現(xiàn)從入門到精通的飛躍！