欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

Python 正則表達(dá)式(轉(zhuǎn)義問題)

系統(tǒng) 1821 0

先說一個(gè)比較?宓氖慮椋涸諦聰好滓衾質(zhì)蘊(yùn)?下載器的時(shí)候遇到一個(gè)問題,因?yàn)楸4娴奈募际怯靡魳返臉?biāo)題命名的,所以碰到一些諸如「??峙/out border」等含有非法字符(哼哼,說的就是你 →_→ Windows)的標(biāo)題的時(shí)候,就會(huì)保存失敗。于是我想起了迅雷的解決方法:把所有的非法字符替換成下劃線。

于是就引入了正則表達(dá)式的使用。一番搜索囫圇吞棗后,我寫下了這樣的函數(shù):

復(fù)制代碼 代碼如下:

def sanitize_filename(filename):
return re.sub('[\/:*?<>|]', '_', filename)

最近意識(shí)到了這個(gè)函數(shù)里的好多問題:

  • Python 和 Shell 不同,無論單引號(hào)還是雙引號(hào),反斜杠都是轉(zhuǎn)義符。走狗屎運(yùn)的是,Python 對(duì)于沒意義的轉(zhuǎn)義 \/ 的處理是保持原樣。
  • 即便如此, sanitize_filename('\\/:*?<>|') 依舊返回 \_______ 而不是全部都是下劃線。

于是感覺得正正經(jīng)經(jīng)看看文檔了。

Raw strings

看了文檔后才意識(shí)到,Python 正則表達(dá)式模塊的轉(zhuǎn)義是獨(dú)立的。例如匹配一個(gè)反斜杠字符需要將參數(shù)寫成:'\\\\':

Python 將字符串轉(zhuǎn)義:\\\\ 被轉(zhuǎn)義為 \\
re 模塊獲得傳入的 \\ 將其解釋為正則表達(dá)式,按照正則表達(dá)式的轉(zhuǎn)義規(guī)則將其轉(zhuǎn)義為 \
如此麻煩的前提下,Raw String 就大有作為了,顧名思義就是(除了結(jié)尾的反斜杠)不會(huì)被轉(zhuǎn)義的字符串。于是匹配一個(gè)反斜杠字符就可以寫作 r'\\'。

所以上面的 sanitize_filename 改成了:

復(fù)制代碼 代碼如下:

def sanitize_filename(filename):
return re.sub(r'[\\/:*?<>|]', '_', filename)

Regex 和 Match

于是正經(jīng)看看 re 模塊吧~以下為流水帳,供急性子觀看。

Python 的正則表達(dá)式模塊 re 中主要的對(duì)象其實(shí)是這倆:

正則表達(dá)式 RegexObject
匹配 MatchObject
RegexObject 是正則表達(dá)式對(duì)象,所有 match sub 之類的操作都?xì)w它所有。由 re.compile(pattern, flag) 生成。

復(fù)制代碼 代碼如下:

>>> email_pattern = re.compile(r'\w+@\w+\.\w+')
>>> email_pattern.findall('My email is abc@def.com and his is user@example.com')
['abc@def.com', 'user@example.com']

其中的方法:

search 從任意字符開始匹配,返回 MatchObject 或者 None
match 從第一個(gè)字符開始匹配,返回 MatchObject 或者 None
split 返回由匹配分割的 List
findall 返回所有匹配的 List
finditr 返回 MatchObject 的迭代器
sub 返回替換后的字符串
subn 返回 (替換后的字符串, 替換次數(shù))
re 模塊里提供的函數(shù)如 re.sub re.match re.findall 實(shí)際上都可以認(rèn)為是一種省去直接創(chuàng)建正則表達(dá)式對(duì)象的捷徑。而由于 RegexObject 對(duì)象本身可以反復(fù)使用,這也是它相對(duì)于這些捷徑函數(shù)的優(yōu)勢所在。

MatchObject 則是匹配對(duì)象,表示一次正則表達(dá)式匹配的結(jié)果。由 RegexObject 的一些方法返回。匹配對(duì)象永遠(yuǎn)是 True 的,另外還有一大堆用來取得正則表達(dá)式中分組(group)相關(guān)信息的方法。

復(fù)制代碼 代碼如下:

>>> for m in re.finditer(r'(\w+)@\w+\.\w+', 'My email is abc@def.com and his is user@example.com'):
... print '%d-%d %s %s' % (m.start(0), m.end(0), m.group(1), m.group(0))
...
12-23 abc abc@def.com
35-51 user user@example.com

參考
  • The Python Standard Library: http://docs.python.org/2/library/re.html

更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 成人视品 | 免费午夜影片在线观看影院 | 青青青国产依人精品视频 | 日韩色区 | 国产成人精品免费影视大全 | 欧美另类色图 | 日韩中文一区二区三区 | 强伦女教师视频 | 国产亚洲视频在线 | 天天操操操操操操 | 一级视频在线免费观看 | 久久伊人免费视频 | 日本高清www午色夜黄 | 午夜影院18 | 在线播放一区二区三区 | 91看片在线免费观看 | 午夜免费小视频 | 日韩欧美一区二区三区在线视频 | 欧美操片 | 一级毛片免费不卡在线 | 久久精品呦女 | 日韩伦理免费在线观看 | 久久激情综合色丁香 | 欧美成年网站 | 中文字幕日本亚洲欧美不卡 | 欧美人人干 | 我和我的祖国电影在线观看免费版高清 | 久草视频在线播放 | 国产色 | 伊人亚洲| 成人亚洲区无码偷拍 | 奇米9999| 久久精品一区二区三区不卡牛牛 | 香港全黄一级毛片在线播放 | 亚洲人视频 | 国产一区二区精品丝袜 | 天天操婷婷 | 久久一日本道色综合久久m 亚洲三级视频 | 欧美成人四级hd版 | 91一区二区三区在线观看 | 成人av一区二区三区 |