您的位置:首頁/技術文章
文章詳情頁

網頁爬蟲 - 關于python3.x 編寫爬蟲異常問題請各位大神幫忙!

【字号: 作者:豬豬瀏覽:92日期:2022-09-01 09:42:58

問題描述

這段代碼一直出現異常,但只要把導入的庫稍加更改在python2.x中運行是沒有問題的,請問大神問題出在哪?出現的異常也總變,小弟初學爬蟲,請賜教!

import urllib.errorimport urllib.requestimport urllib.parseurl = ’http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=https://www.baidu.com/link HTTP/1.1’data = {}data[’type’]= ’AUTO’data[’i’] = ’I am fine !’data[’doctype’] = ’json’data[’xmlVersion’] = ’1.8’data[’keyfrom’] = ’fanyi.web’data[’ue’] = ’UTF-8’data[’action’] = ’FY_BY_CLICKBUTTON’data[’typoResult’] = ’true’head = {}head[’User-Agent’]= ’Mozilla/5.0 (Windows NT 6.1; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’ try: data = urllib.parse.urlencode(data).encode(’utf-8’) req = urllib.request.Request(url,data,head) response = urllib.request.urlopen(req) html = response.read().decode(’utf-8’) print(html)except urllib.error.HTTPError as e: print (’Error code : ’,e.code)except urllib.error.URLError as e: print (’The reason: ’,e.reason)

昨天是這樣的:網頁爬蟲 - 關于python3.x 編寫爬蟲異常問題請各位大神幫忙!

今天運行就這樣了:網頁爬蟲 - 關于python3.x 編寫爬蟲異常問題請各位大神幫忙!

問題解答

回答1:

刪掉url后面 HTTP/1.1,url后面加它干嘛。。

網頁爬蟲 - 關于python3.x 編寫爬蟲異常問題請各位大神幫忙!

回答2:

Python3不用解碼和編碼啦,還有些模塊的用法不一樣了,自己看一下Python3的文檔吧

回答3:

網頁爬蟲 - 關于python3.x 編寫爬蟲異常問題請各位大神幫忙!

標簽: Python 編程
相關文章:
国产综合久久一区二区三区