文章目錄python常用數據存儲方法txtjsoncsvmsyql安裝pymysql連接建庫建表插入刪除修改查詢mongodb安裝連接建庫建文檔增刪改查redis安裝連接操作公用方法字符串列表集合有序集合散列其他sqlalchemypostgresqlmysqloracleMicrosoftSQLServersqlitepython常用數據存儲方法txtwithopen('test.txt','w',encoding='utf8')asf:f.write(
系統 2019-09-27 17:54:52 1927
#!/usr/bin/python#coding:utf-8importnumpyasnpa=np.array([1,2,3])b=np.array([[1,2,3],[4,5,6],[7,8,9]])#shape是維度,dtype是元素的類型printa.shapeprinta.dtype#使用函數生成等差數列數組x1=np.arange(1,11,2)x2=np.linspace(1,9,5)printx1,x2#求數組中的最大值和最小值printnp
系統 2019-09-27 17:54:45 1927
認識錯誤編寫的程序不能正常執行,或者執行的結果不是我們期望的,俗稱BUG,是程序員在開發時非常常見的,初學者常見錯誤的原因包括:手誤對已經學習過的知識理解還存在不足對語言還有需要學習和提升的內容在學習語言時,不僅要學會語言的語法,而且還要學會如何認識錯誤和解決錯誤的方法每一個程序員都是在不斷地修改錯誤中成長的常見錯誤:1>手誤2>將多條print寫在一行每行代碼負責完成一個動作3>縮進錯誤Python是一個格式非常嚴格的程序設計語言4>python2.x默
系統 2019-09-27 17:54:37 1927
python內部自帶大整數運算能力,整數運算不會溢出,只要內存足夠,就oK下面的例子演示了兩個32位整數加法的情況(通過位運算實現),為了模擬溢出的效果,必須人工的進行位運算,~運算符除了求反,還是二進制的補運算符,運算過后的二進制數字按照補碼解釋,例如~(00111100)=(11000011)=-61defgetSum(a,b):""":typea:int:typeb:int:rtype:int"""MAX=0X7fffffffMIN=0X800000
系統 2019-09-27 17:54:25 1927
正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。Python自1.5版本起增加了re模塊,它提供Perl風格的正則表達式模式。re模塊使Python語言擁有全部的正則表達式功能。compile函數根據一個模式字符串和可選的標志參數生成一個正則表達式對象。該對象擁有一系列方法用于正則表達式匹配和替換。re模塊也提供了與這些方法功能完全一致的函數,這些函數使用一個模式字符串做為它們的第一個參數。python正則表達式的使用(實
系統 2019-09-27 17:54:15 1927
一、讀取excel這里介紹一個不錯的包xlrs,可以工作在任何平臺。這也就意味著你可以在Linux下讀取Excel文件。首先,打開workbook;復制代碼代碼如下:importxlrdwb=xlrd.open_workbook('myworkbook.xls')檢查表單名字:復制代碼代碼如下:wb.sheet_names()得到第一張表單,兩種方式:索引和名字復制代碼代碼如下:sh=wb.sheet_by_index(0)sh=wb.sheet_by_n
系統 2019-09-27 17:54:06 1927
在處理數據和進行機器學習的時候,遇到了大量需要處理的時間序列。比如說:數據庫讀取的str和time的轉化,還有time的差值計算。總結一下python的時間處理方面的內容。一、字符串和時間序列的轉化time.strptime():字符串=>時間序列time.strftime():時間序列=>字符串importtimestart="2017-01-01"end="2017-8-12"startTime=time.strptime(start,"%Y-%m-%
系統 2019-09-27 17:54:04 1927
python使用super()出現錯誤解決辦法當我們在python的子類中調用父類的方法時,會用到super(),不過我遇到了一個問題,順便記錄一下。比如,我寫了如下錯誤代碼:classA():defdosomething(self):print"It'sA"classB(A):defdosomething(self):super(B,self).dosomething()if__name__=='__main__':b=B()b.dosomething(
系統 2019-09-27 17:54:02 1927
OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學文字識別(OpticalCharacterRecognition,OCR)。可以實現OCR的底層庫并不多,目前很多庫都是使用共同的幾個底層OCR庫,或者是在上面進行定制。Tesseract是一個OCR庫,目前由Google贊助(Google也是一家以OCR和機器學習技術聞名于世的公司)。Tesseract是目前公認最優秀、最精確的開源OCR系統。除了極高的精確度,Tesseract也具有很高的靈活
系統 2019-09-27 17:53:50 1927
在日常PC端的Python爬蟲過程工作中,Chrome瀏覽器是我們常用的一款工具。鑒于Chrome瀏覽器的強大,Chrome網上應用商店很多強大的插件可以幫助我們快速高效地進行數據爬蟲。今天推薦的6款Chrome插件,可以大大提升我們的爬蟲效率。EditThisCookieEditThisCookie是一個Cookie管理器,可以很方便的添加,刪除,編輯,搜索,鎖定和屏蔽Cookies。可以將登錄后的Cookies先保存到本地,借助cookielib庫,直
系統 2019-09-27 17:53:24 1927
說到流處理,Spark為我們提供了窗口函數,允許在滑動數據窗口上應用轉換,常用場景如每五分鐘商場人流密度、每分鐘流量等等,接下來我們通過畫圖來了解SparkStreaming的窗口函數如何工作的,處理過程圖如下所示:上圖中綠色的小框框是一批一批的數據流,虛線框和實線框分別是前一個窗口和后一個窗口,從圖中可以看出后一個窗口在前一個窗口基礎上移動了兩個批次的數據流,而我們真正通過算子操作的數據其實就是窗口內所有的數據流。在代碼實現前了解下窗口操作常用的函數有:
系統 2019-09-27 17:52:34 1927
#下載一個網頁importrequestsimportreurl='https://www.biquge5200.cc/14_14621/'#模擬瀏覽器發送http請求response=requests.get(url)#編碼方式response.encoding='utf-8',如果下載下來的網頁內容有中文亂碼現象就需要加上這一句話#網頁源碼html=response.text#[0]取列表下第0個元素.#eg:title的輸出結果為:['斗神狂飆無彈窗
系統 2019-09-27 17:52:18 1927
我們首先來看下python的全部代碼,大家可以直接復制后測試:#-*-encoding:utf-8-*-importloggingimportwmiimportosimporttimefromConfigParserimportConfigParserimportsmtplibfromemail.mime.textimportMIMETextimportsocketfromdatetimeimportdatetimeimportreimportsysimp
系統 2019-09-27 17:52:12 1927
Python3快速入門(七)——Python3正則表達式1、re模塊簡介re模塊提供Perl風格的正則表達式模式,使Python語言擁有全部的正則表達式功能。2、正則表達式模式模式字符串使用特殊的語法來表示一個正則表達式:正則表達式模式中的字母和數字匹配同樣的字符串;多數字母和數字前加一個反斜杠時會有不同的含義;標點符號通常有特殊的含義,只有被轉義時才匹配自身;反斜杠本身需要使用反斜杠轉義。^匹配字符串的開頭$匹配字符串的末尾.匹配任意字符,除了換行符,當
系統 2019-09-27 17:51:33 1927
生成器就是自己用python代碼寫的迭代器,生成器的本質就是迭代器。通過以下兩種方式構建一個生成器:1、通過生成器函數2、生成器表達式生成器函數:函數deffunc1(x):x+=1returnxprint(func1(5))生成器函數deffunc1(x):x+=1yieldxg_obj=func1(5)print(g_obj.__next__())一個next對應一個yield。yieldVSreturnreturn結束函數,給函數的執行者返回值yie
系統 2019-09-27 17:50:36 1927