部分轉載:http://www.blogjava.net/zhenandaci/archive/2008/05/31/204646.html作者:Jasper文本分類(textcategorization)問題就是將一篇文檔歸入預先定義的幾個類別中的一個或幾個,而文本的自動分類則是使用計算機程序來實現這樣的分類。通俗點說,就好比你拿一篇文章,問計算機這文章要說的究竟是體育,經濟還是教育,計算機答不上就打它的屁屁(……)。注意這個定義當中著重強調的兩個事實。
系統 2019-08-29 21:59:32 1931
半次元COS圖爬取-寫在前面今天在瀏覽網站的時候,忽然一個莫名的鏈接指引著我跳轉到了半次元網站https://bcy.net/打開之后,發現也沒有什么有意思的內容,職業的敏感讓我瞬間聯想到了cosplay,這種網站必然會有這個的存在啊,于是乎,我準備好我的大爬蟲了。把上面的鏈接打開之后,被我發現了吧,就知道我的第八感不錯滴。接下來就是找入口,一定要找到圖片鏈接的入口才可以做下面的操作這個頁面不斷往下拖拽,頁面會一直加載,當時當你拖拽一會,就停下來了,就是這
系統 2019-09-27 17:56:54 1930
一個簡易的TCP端口掃描器,使用python3實現。需求:掃描目標網站開放哪些端口號,將所有開放的端口號輸出。分析:使用socket連接,如果連接成功,認為端口開放,如果連接失敗,認為端口關閉(有可能端口開放但連接失敗,這里簡單認為端口不開放)使用到的庫:socket,threading過程:先定義一個函數,對給定的(ip,port)進行掃描,看其是否能連接成功。deftcpPortScan(ip,port,openPort):sock=socket.so
系統 2019-09-27 17:55:41 1930
本文實例講述了Python函數裝飾器原理與用法。分享給大家供大家參考,具體如下:裝飾器本質上是一個函數,該函數用來處理其他函數,它可以讓其他函數在不需要修改代碼的前提下增加額外的功能,裝飾器的返回值也是一個函數對象。它經常用于有切面需求的場景,比如:插入日志、性能測試、事務處理、緩存、權限校驗等應用場景。裝飾器是解決這類問題的絕佳設計,有了裝飾器,我們就可以抽離出大量與函數功能本身無關的雷同代碼并繼續重用。概括的講,裝飾器的作用就是為已經存在的對象添加額外
系統 2019-09-27 17:55:08 1930
本文實例講述了python實現無證書加密解密的方法,分享給大家供大家參考。具體實現方法如下:無證書加密就是雙方不需要維護證書,加密與解密只需要雙方約定一個key就可以,無證書加解密的方式應用更廣泛一些,python官方也有這方面的相關例子說明,地址是:https://pypi.python.org/pypi/pycrypto,主要用的是fromCrypto.CipherimportAES這個模塊,代碼如下:復制代碼代碼如下:'''/***AES加密字符串*
系統 2019-09-27 17:54:57 1930
該代碼主要是基于python實現判斷指定文件夾下是否存在指定后綴的文件。代碼如下:importosYour_Dir='你的文件夾/'Files=os.listdir(Your_Dir)forkinrange(len(Files)):#提取文件夾內所有文件的后綴Files[k]=os.path.splitext(Files[k])[1]Str2=['.wav','.mp3','.mp4']iflen(list(set(Str2).intersection(s
系統 2019-09-27 17:54:47 1930
前言嘗試用python語言寫腳本是好的開始,證明我們有了自動化的思想,這對優秀的程序開發人員是很重要的,電子計算機本來就是要減少重復工作的。首先我們要用到python自帶的一些包,python語言讓人愛不釋手的一點,就是它自帶了許多簡捷迅速的包,堪稱攻堅手術刀,用到的包:os(操作系統相關庫),shutil(高級的文件,文件夾,壓縮包處理模塊)。經典的開頭#-*-coding:utf-8-*-importosimportshutilimportsystyp
系統 2019-09-27 17:54:28 1930
前言最近因為工作原因,發現一個Python的時間組件,很好用分享出來!(忘記作者名字了,在這里先感謝了),下面話不多說,來一起看看詳細的介紹吧。示例代碼:#-*-coding:utf-8-*-'''獲取當前日期前后N天或N月的日期'''fromtimeimportstrftime,localtimefromdatetimeimporttimedelta,dateimportcalendaryear=strftime("%Y",localtime())mon
系統 2019-09-27 17:54:18 1930
如下所示:importosos.system()os.popen().read().strip()#上面2種方法是python執行終端/控制臺命令的常見方法#os.system('pingwww.baidu.com')執行成功返回0#ping=os.popen('pintwww.baidu.com').read().strip()返回輸出結果#注:os.system()執行完成會關閉所以當執行后續命令需要依賴前面的命令時,請將多條命令寫到一個os.syst
系統 2019-09-27 17:54:00 1930
使用python爬取微博評論:本文首發于《凹凸數讀》,關注后臺回復“源碼”獲取相關python代碼2019年5月27日凌晨,翟天臨又上了熱搜。我們爬取了翟天臨2月道歉微博下的30萬余條評論,看看畢業生們是如何吐槽他的?本文首發于《凹凸數讀》,關注后臺回復“源碼”獲取相關python代碼
系統 2019-09-27 17:53:21 1930