基于Python的Post請求數據爬取的方法詳解

系統 2019-09-27 17:51:26 2348 0

為什么做這個

和同學聊天，他想爬取一個網站的post請求

觀察

該網站的post請求參數有兩種類型：（1）參數體放在了query中，即url拼接參數（2）body中要加入一個空的json對象，關于為什么要加入空的json對象，猜測原因為反爬蟲。既有query參數又有空對象體的body參數是一件腦洞很大的事情。
一開始先在?apizza網站上了做了相關實驗才發現上面這個規律的，并發現該網站的請求參數要為raw形式，要是直接寫代碼找規律不是一件容易的事情。

源碼

            
import requests
import json
headers = {
    'Accept':'application/json, text/javascript, */*; q=0.01',
    'X-Requested-With':'XMLHttpRequest',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36',
    'Content-Type':'application/json',
    'Accept-Encoding':'gzip, deflate',
    'Accept-Language':'zh-CN,zh;q=0.8',
    'Cache-Control':'no-cache',
  }
#空的對象，body參數
data = {}
data = json.dumps(data)
page = 0
url = '網站地址，后面為參數?param1=1?m1='+str(page)
response = requests.post(url = url,data=data ,headers =headers )
print(response.url)
print(response.text)

總結

現在相關工具中發現現象
請求方式確定：post還是get或者其它
參數類型：form-data還是raw或者其它
參數位置：若是post請求，在query中還是body中，還是二者皆有

ps:python requests 發起http POST 請求

python requests 發起http POST 請求，帶參數，帶請求頭：

            
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
import json
url = 'http://official-account/app/messages/group'
body = {"type": "text", "content": "測試文本", "tag_id": "20717"}
headers = {'content-type': "application/json", 'Authorization': 'APP appid = 4abf1a,token = 9480295ab2e2eddb8'}
#print type(body)
#print type(json.dumps(body))
# 這里有個細節，如果body需要json形式的話，需要做處理
# 可以是data = json.dumps(body)
response = requests.post(url, data = json.dumps(body), headers = headers)
# 也可以直接將data字段換成json字段，2.4.3版本之后支持
# response = requests.post(url, json = body, headers = headers)
# 返回信息
print response.text
# 返回響應頭
print response.status_code

總結

以上所述是小編給大家介紹的基于Python的Post請求數據爬取的方法詳解,希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持！
如果你覺得本文對你有幫助，歡迎轉載，煩請注明出處，謝謝！　　

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

發表我的評論

最新評論總共0條評論