環境:matplotlib3.1.0,numpy1.15.4目錄使用matplotlib作圖的兩大方法一面對函數繪圖(pyplot模塊有大量函數,供用戶調用)1.主要分為四個步驟:2.代碼實例(單圖和多圖)3.圖片展示二面對對象繪圖(主要操作Figure和Axes對象)(推薦)1.主要分為四個步驟:2.代碼實例(單圖和多圖)3.圖片展示使用matplotlib作圖的兩大方法本教程可以作為科研作圖模板,涵蓋了作圖中很多小細節,使用了matplotlib作圖的
系統 2019-09-27 17:51:46 2319
看著自己少得可憐的訪問量,突然有一個想用爬蟲刷訪問量的想法,主要也是抱著嘗試的心態,學習學習。其實市面上有一些軟件可以代刷流量比如流量精靈,使用感確實比我們自己寫的代碼要好一些第一版:網上借鑒了一下以下代碼運行在python3importurllib.requestimporttime#使用build_opener()是為了讓python程序模仿瀏覽器進行訪問opener=urllib.request.build_opener()opener.addhea
系統 2019-09-27 17:50:47 2319
學習python以來的第一爬蟲,參考《Python3網絡爬蟲開發實踐》爬取目標為:貓眼電影Top100榜完全是依葫蘆畫瓢,首先請求網頁內容,然后在通過正則表達式提取自己感興趣的數據,最后轉成json格式存入文本文件。importjsonimporttimeimportrequestsimportredefget_one_page(url):headers={'User-agent':'Mozilla/5.0(Macintosh;IntelMacOSX10_
系統 2019-09-27 17:50:24 2319
練習介紹要求:請使用多協程和隊列,爬取時光網電視劇TOP100的數據(劇名、導演、主演和簡介),并用csv模塊將數據存儲下來。時光網TOP100鏈接:http://www.mtime.com/top/tv/top100/目的:1.練習掌握gevent的用法2.練習掌握queue的用法fromgeventimportmonkey#gevent從庫里導入monkey模塊monkey.patch_all()#能把程序變成協作式運行,就是可以幫助程序實現異步imp
系統 2019-09-27 17:50:08 2319
pandas主要有三個用來刪除的函數,.drop()、.drop_duplicates()、.dropna()。總結如下.drop()刪除行、列.drop_duplicates()刪除重復數據.dropna()刪除空值(所在行、列)為避免篇幅太長,將其分為兩部分,不想看參數介紹的可以直接看實例。本篇介紹.drop_duplicates(),df.dropnadrop_duplicates()的用法df.drop_duplicates()則通常用于數據去重,
系統 2019-09-27 17:49:32 2319
前言因近期進行時間序列分析時遇到了數據預處理中的缺失值處理問題,其中日期缺失和填充在網上沒有找到較好較全資料,耗費了我一晚上工作時間,所以下面我對這次時間序列缺失值處理學習做了以下小結以供之后同行們參考指正。時間序列缺失值處理一、編程前準備收集時間序列數據,相信看這篇博客的各位已經完成了這步。需要安裝pandas模塊,并利用Python的Lib文件夾自帶的datetime庫(當時我因為在Pycharm環境中沒看到datetime模塊又去安裝了DateTim
系統 2019-09-27 17:46:41 2319
相關的依賴庫在我的github網站上首先貼出代碼:importsolarfromgradientimport*fromshadowsimport*importnumpyasnpimportmatplotlib.pyplotasplt#plt用于顯示圖片importmatplotlib.imageasmpimg#mpimg用于讀取圖片#demimportsrtmif__name__=='__main__':'''#另一種從網上直接下載DEM數據geo_ele
系統 2019-09-27 17:46:11 2319
版本號:Python2.7.5,Python3改動較大,各位另尋教程。所謂網頁抓取,就是把URL地址中指定的網絡資源從網絡流中讀取出來,保存到本地。類似于使用程序模擬IE瀏覽器的功能,把URL作為HTTP請求的內容發送到服務器端,然后讀取服務器端的響應資源。在Python中,我們使用urllib2這個組件來抓取網頁。urllib2是Python的一個獲取URLs(UniformResourceLocators)的組件。它以urlopen函數的形式提供了一個
系統 2019-09-27 17:46:01 2319
引言今天學習python連接數據庫,就想安裝一下mysql數據庫,沒想到小小的數據庫也遇到了不少挫折,所以我就把自己的安裝過程以及問題寫出來分享給大家。mysql下載鏈接:https://u20538204.ctfile.com/fs/20538204-384372135步驟1、解壓2、配置環境,加一個MYSQL_HOME變量,以及path里面新增路徑%MYSQL_HOME%\bin;3、建目錄以及新增文件,在mysql安裝路徑下建一個data文件夾,并且
系統 2019-09-27 17:56:36 2318
目錄一、概述二、程序的格式框架2.1代碼高亮2.2縮進2.3注釋2.4縮進、注釋三、命名與保留字3.1變量3.2命名3.3保留字3.4變量、命名、保留字四、數據類型4.1字符串、整數、浮點數、列表4.210,011,101該如何解釋呢?4.3供計算機程序理解的數據形式4.410,011,1014.5字符串4.5.1字符串的序號4.5.2字符串的使用4.6數字類型4.7列表類型五、語句與函數5.1賦值語句5.2分支語句5.3函數5.4賦值語句、分支語句、函數
系統 2019-09-27 17:55:35 2318
前言優化隨機森林算法,正確率提高1%~5%(已經有90%+的正確率,再調高會導致過擬合)論文當然是參考的,畢竟出現早的算法都被人研究爛了,什么優化基本都做過。而人類最高明之處就是懂得利用前人總結的經驗和制造的工具(說了這么多就是為偷懶找借口。hhhh)優化思路1.計算傳統模型準確率2.計算設定樹木顆數時最佳樹深度,以最佳深度重新生成隨機森林3.計算新生成森林中每棵樹的AUC,選取AUC靠前的一定百分比的樹4.通過計算各個樹的數據相似度,排除相似度超過設定值
系統 2019-09-27 17:54:33 2318
前言我們在使用python開發的過程中時常聽到GIL這個詞,并且發現這個詞經常和Python無法高效的實現多線程關聯在一起,關于python多線程的實現在前面的文章已經介紹過,本文我們主要來了解一下GIL到底是什么?為什么會影響python的多線程。一、什么是GILGIL全稱GlobalInterpreterLock,官方給出的解釋如下:InCPython,theglobalinterpreterlock,orGIL,isamutexthatprevent
系統 2019-09-27 17:53:19 2318
Python數據科學入門DmitryZinoviev著熊子源譯第6章使用Series和framePandas模塊的初中時為了給Python添加Series和frame兩個抽象的數據結構,它們其實是Python的競爭對手、最早的數據科學語言——R語言的核心。Pandas的frame本質是一個“智能”電子表格:具有標簽、列(變量)、行(觀測記錄),以及大量內置操作的表。(Series是一個只有一列的frame)表的數據部分(單元格)以numpy數組的方式實現。
系統 2019-09-27 17:51:53 2318
在Python中定義函數,可以用必選參數(位置參數),默認參數,可變參數,關鍵字參數和命名關鍵字參數,這5種參數都可以組合使用。但參數定義的順序必須是:必選參數(位置參數)默認參數可變參數命名關鍵字參數關鍵字參數例如:定義:deff1(x,y=0,*args,z,**kw):print(x,y,args,z,kw)調用:f1(1,2,3,4,5,z=6,p=7,q=8)輸出:12(3,4,5)6,{'p':7,'q':8}定義:deff2(x,y=0,*,
系統 2019-09-27 17:50:10 2318
介紹現在交給你一份2010年美國各州縣人口普查表:censuspopdata.xlsx。共72864條記錄。每一行代表一個縣某統計區的人口數。需要你統計出:各縣統計區數量和人口數。表格內容長這樣:通過本練習你講學習到:python如何讀取excel內容使用字典存儲excel統計內容利用pprint格式化字典結構代碼新建:readCensusExcel.py#!python3#readCensusExcel.py-Tabulatespopulationand
系統 2019-09-27 17:48:33 2318