判讀是否存在文件夾importtensorflowastfimportosfolder='./floder'ifnottf.gfile.Exists(folder):#若文件夾不存在,則自動創(chuàng)建文件夾tf.gfile.MakeDirs(folder)若存在刪除文件夾下所有文件iftf.gfile.Exists(folder):#返回一個listforfilein(tf.gfile.ListDirectory(folder)):#添加絕對路徑,并刪除文件tf
系統(tǒng) 2019-09-27 17:54:49 1939
實例如下:#-*-coding:utf-8-*-fromnumpyimport*importnumpyasnpimportpandasaspdfrommathimportlogimportoperator#計算數(shù)據(jù)集的香農(nóng)熵defcalcShannonEnt(dataSet):numEntries=len(dataSet)labelCounts={}#給所有可能分類創(chuàng)建字典forfeatVecindataSet:currentLabel=featVec[-
系統(tǒng) 2019-09-27 17:54:47 1939
給類或?qū)嵗壎ㄆ渌椒ǎê瘮?shù)),需要注意問題:(1)定義方法(函數(shù))時,要加self,如:defset_age(self,age):self.age=age(2)實例綁定方法與類綁定方法是不一樣的,實例綁定方法時是要借助函數(shù)的,類綁定方法時可以直接賦值的,如:classStudet(object):def__init__(self,name):self.name=name實例綁定方法:s1=Studet('Boo')fromtypesimportMetho
系統(tǒng) 2019-09-27 17:54:09 1939
本文實例講述了Python中@property的理解和使用。分享給大家供大家參考,具體如下:重看狗書,看到對User表定義的時候有下面兩行@propertydefpassword(self):raiseAttributeError('passwordisnotareadableattribute')@password.setterdefpassword(self,password):self.password_hash=generate_password_
系統(tǒng) 2019-09-27 17:54:06 1939
前言web是一個開放的平臺,這也奠定了web從90年代初誕生直至今日將近30年來蓬勃的發(fā)展。然而,正所謂成也蕭何敗也蕭何,開放的特性、搜索引擎以及簡單易學(xué)的html、css技術(shù)使得web成為了互聯(lián)網(wǎng)領(lǐng)域里最為流行和成熟的信息傳播媒介;但如今作為商業(yè)化軟件,web這個平臺上的內(nèi)容信息的版權(quán)卻毫無保證,因為相比軟件客戶端而言,你的網(wǎng)頁中的內(nèi)容可以被很低成本、很低的技術(shù)門檻實現(xiàn)出的一些抓取程序獲取到,這也就是這一系列文章將要探討的話題――網(wǎng)絡(luò)爬蟲。有很多人認為w
系統(tǒng) 2019-09-27 17:54:02 1939
OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學(xué)文字識別(OpticalCharacterRecognition,OCR)。可以實現(xiàn)OCR的底層庫并不多,目前很多庫都是使用共同的幾個底層OCR庫,或者是在上面進行定制。Tesseract是一個OCR庫,目前由Google贊助(Google也是一家以O(shè)CR和機器學(xué)習(xí)技術(shù)聞名于世的公司)。Tesseract是目前公認最優(yōu)秀、最精確的開源OCR系統(tǒng)。除了極高的精確度,Tesseract也具有很高的靈活
系統(tǒng) 2019-09-27 17:53:50 1939
requests提供了一個叫做session類,來實現(xiàn)客戶端和服務(wù)端的會話保持使用方法1.實例化一個session對象2.讓session發(fā)送get或者post請求session=requests.session()session.get(url,headers)下面就用人人網(wǎng)來實戰(zhàn)一下#coding=utf-8importrequestssession=requests.session()#登錄的表單urlpost_url="http://www.ren
系統(tǒng) 2019-09-27 17:53:16 1939
??近期涉及到了關(guān)于doc文檔讀取的處理,也查了很久,為了便于大家使用,故集大成一下。Doc文檔讀取有如下幾種:1、從doc讀取文本目前沒有找到直接的方式,一般是先轉(zhuǎn)為docx文件在處理。所使用工具為doc2doc(批量時可用),或人工另存處理。2、從docx讀取文本一般使用python-docx庫的方法,但只支持創(chuàng)建新文檔和讀取一些基本的文件數(shù)據(jù),如文件大小和文件標(biāo)題,不支持正文讀取。或直接從docx中讀取xml的方法。3、從pdf讀取文本一般使用pdf
系統(tǒng) 2019-09-27 17:53:01 1939
一.什么是圖片懶加載?-案例分析:抓取站長素材http://sc.chinaz.com/中的圖片數(shù)據(jù)#!/usr/bin/envpython#-*-coding:utf-8-*-importrequestsfromlxmlimportetreeif__name__=="__main__":url='http://sc.chinaz.com/tupian/gudianmeinvtupian.html'headers={'User-Agent':'Mozill
系統(tǒng) 2019-09-27 17:52:42 1939
Python3快速入門(八)——Python3JSON1、JSON簡介JSON(JavaScriptObjectNotation)是一種輕量級的數(shù)據(jù)交換格式,是基于ECMAScript的一個子集。2、json模塊簡介Python3中可以使用json模塊來對JSON數(shù)據(jù)進行編解碼,包含兩個函數(shù):json.dumps():對數(shù)據(jù)進行編碼。json.loads():對數(shù)據(jù)進行解碼。在json的編解碼過程中,Python的數(shù)據(jù)類型與json類型會相互轉(zhuǎn)換。json
系統(tǒng) 2019-09-27 17:51:32 1939