??? 參考文檔: http://blog.csdn.net/tao_627/article/details/51019972
??? 需求:從一篇文章中篩選出正常的數(shù)字
???
??
def
numberChange
():
f =
open
(
'C:\Users\Administrator\Desktop\mytest.txt'
,
'r'
)
s = f.read()
# 或多或少的好好讀書電鋸驚魂20202 和水電費(fèi)后是否會(huì)時(shí)候1212沒收到風(fēng)10.12海大富的是粉紅色的和辦法的1244525.000會(huì)發(fā)生的粉紅色的合法化好0.01給對(duì)方會(huì)感受到發(fā)給還是干活0001還打飛機(jī)大嫁風(fēng)尚蝴蝶結(jié)個(gè)房間小電風(fēng)扇豆腐干很多事123,450,000.000好盛大黑色的十一萬(wàn)八千四百三十二的還好丁世德11萬(wàn)2200海大富會(huì)閃爍二十萬(wàn)零三
for
i
in
[
"utf8"
,
"gb2312"
]:
try
:
data = s.decode(i)
break
except
:
pass
# 匹配中的 ‘u’不可少
number = re.compile(
ur'([一二三四五六七八九零十百千萬(wàn)億]+|[0-9]+[,]*[0-9]+.[0-9]+)'
)
pattern = re.compile(number)
all = pattern.findall(data)
for
i
in
all:
print
i
# 打印的內(nèi)容
# 20202
# 1212
# 10.12
# 1244525.000
# 0001
# 123, 450, 000
# 十一萬(wàn)八千四百三十二
# 11
# 萬(wàn)2200
# 二十萬(wàn)零三
f.close()
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061
微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元

