文章詳情頁

Python urllib.request對象案例解析

瀏覽：4日期：2022-07-26 08:37:36

剛剛接觸爬蟲，基礎的東西得時時回顧才行，這么全面的帖子無論如何也得厚著臉皮轉過來?。?/p>

什么是 Urllib 庫？

urllib 庫是 Python 內置的 HTTP 請求庫。urllib 模塊提供的上層接口，使訪問 www 和 ftp 上的數據就像訪問本地文件一樣。

有以下幾種模塊：

1.urllib.request 請求模塊

2. urllib.error 異常處理模塊

3. urllib.parse url 解析模塊

4. urllib.robotparser robots.txt 解析模塊

Urllib 庫下的幾種模塊基本使用如下：

urllib.request

關于 urllib.request： urllib.request 模塊提供了最基本的構造 HTTP （或其他協議如 FTP）請求的方法，利用它可以模擬瀏覽器的一個請求發起過程。利用不同的協議去獲取 URL 信息。它的某些接口能夠處理基礎認證（ Basic Authenticaton）、redirections （HTTP 重定向)、 Cookies (瀏覽器 Cookies）等情況。而這些接口是由 handlers 和 openers 對象提供的。

1.常用的方法有

read()==讀取文件內容 geturl()==獲取請求url getheaders()==獲取http請求頭信息 getcode()==獲取狀態碼 readlines()==獲取一行

2.案例

#coding=utf-8#import urllib.request#=========response方法使用#read()==讀取文件內容#geturl()==獲取請求url#getheaders()==獲取http請求頭信息#getcode()==獲取狀態碼#readlines()==獲取一行#url='http://www.baidu.com';#response = urllib.request.urlopen(url);#=====案例1# str = response.read().decode();#這樣通過decode轉換為utf8# with open('baidu.html','w',encoding='utf8') as fp:# fp.write(str);#=====案例2通過字節流寫=默認通過read讀取的是字節流# with open('bai.html','wb') as fp:# fp.write(response.read()); #==使用字節流讀取存圖片# image_url=’https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg’;# response = urllib.request.urlopen(image_url);# with open('mv.jpg',’wb’) as fp:# fp.write(response.read());#案例3==使用內置函數讀取圖片#image_url=’https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg’;#urllib.request.urlretrieve(image_url,'chun.jpg');

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：python將unicode和str互相轉化的實現下一條：python將dict中的unicode打印成中文實例

相關文章：

1. Python獲取抖音關注列表封號賬號的實現代碼2. ajax請求添加自定義header參數代碼3. Python數據分析之pandas函數詳解4. 解決Python 進程池Pool中一些坑5. php測試程序運行速度和頁面執行速度的代碼6. 無線標記語言(WML)基礎之WMLScript 基礎第1/2頁7. 三個不常見的 HTML5 實用新特性簡介8. 使用.net core 自帶DI框架實現延遲加載功能9. php網絡安全中命令執行漏洞的產生及本質探究10. Warning: require(): open_basedir restriction in effect,目錄配置open_basedir報錯問題分析

排行榜

					
					Python如何讀寫CSV文件
淺談Django QuerySet對象(模型.objects)的常用方法
Python使用jupyter notebook查看ipynb文件過程解析
解決Python 進程池Pool中一些坑
IntelliJ IDEA調整字體大小的方法
docker容器調用yum報錯的解決辦法
php測試程序運行速度和頁面執行速度的代碼
php網絡安全中命令執行漏洞的產生及本質探究
IntelliJ IDEA 2020最新激活碼(親測有效，可激活至 2089 年)
無線標記語言(WML)基礎之WMLScript 基礎第1/2頁
Sun免費推廣Java 明年3月前公開全部源代碼
				

熱門標簽

国产综合久久一区二区三区