python爬蟲人工智能解析文章

系統 2019-09-27 17:57:24 2302 0

之前在公司做一個項目，項目需求是按照標簽分類，去不同網站上爬取文章的內容，標題等。然后我就一個網站一個網站的去配xpath，可是網站特別多的時候，領導就會對我提出一個需求能不能，寫一種程序然后用來解析所有的網站，也就是智能化解析。這對我一個剛剛做爬蟲不久的新手就是很頭疼了。于是各種網上找資料，于是發現了DIFFBOT這個東西。官網https://www.diffbot.com，注冊后會有15天的免費使用的時間。注冊后會發郵件給你一個token,通過token可以配置API請求然后獲取json數據，代碼示例：

            
              import requests, json

url = 'https://api.diffbot.com/v3/article'
params = {
    'token': 'your token', # 這里填寫自己的token值
    'url': 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9516827704589093644%22%7D&n_type=0&p_from=1',
    'fields': 'meta'
}
response = requests.get(url, params=params)
print(json.dumps(response.json(), indent=2, ensure_ascii=False))

結果會獲得一個json串


響應參數的一些說明：

如果說公司業務有這方面需求，但是自己卻實現不了這種技術的，我覺得可以嘗試使用，如果不需要，就當作一種了解。以后也可往人工智能的方向發展。謝謝瀏覽！有什么問題歡迎留言關注！

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

發表我的評論

最新評論總共0條評論