文章詳情頁

基于python實現獲取網頁圖片過程解析

瀏覽：6日期：2022-07-26 08:15:53

環境：python3，要安裝bs4這個第三方庫

獲取請求頭的方法

這里使用的是Chrome瀏覽器。

打開你想查詢的網站，按F12，或者鼠標右鍵一下選擇檢查。會彈出如下的審查元素頁面：

基于python實現獲取網頁圖片過程解析

然后點擊上方選項中的Network選項：

基于python實現獲取網頁圖片過程解析

此時在按Ctrl+R:

基于python實現獲取網頁圖片過程解析

選擇下方框中的第一個，單擊：

基于python實現獲取網頁圖片過程解析

選擇Headers選項，其中就會有Request Headers，包括你需要的信息。

介紹：這個程序是用來批量獲取網頁的圖片，用于新手入門

注意：由于是入門的程序在獲取某些網頁的圖片時會出問題?。。。?！

import osimport urllib.requestfrom bs4 import BeautifulSoup# 網址url = 'http://www2017.tyut.edu.cn/'# 建立請求對象request = urllib.request.Request(url)# 加入請求頭（一定要換成自己的！?。。。﹔equest.add_header(’User-Agent’, ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36’)# 獲取請求code = urllib.request.urlopen(request)# 得到html代碼html = code.read().decode(’utf-8’)# 將html的標簽轉成對象（方便后面的操作）bs = BeautifulSoup(html, ’html.parser’)# 提取所有的img標簽imagesUrl = bs.find_all(’img’)sources = []# 建立存放的路徑（路徑一定要存在?。。。。。。ゝilepath = os.getcwd() + ’images’def createFile(path: str, fpath): urllib.request.urlretrieve(path, fpath)# 獲取圖片的路徑(網址+img標簽的src屬性的值)for img in imagesUrl: sources.append(url + str(img.get(’src’)))for src in sources: # 用split是防止請求帶參 baseName = os.path.basename(src).split(’?’) # 圖片名 fileName = filepath + baseName[0] print('url=' + src, 'filename=' + fileName) createFile(src, fileName)print(’這次您一共下載了圖片’ + str(len(sources)) + ’張’)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：python函數中將變量名轉換成字符串實例下一條：python將unicode和str互相轉化的實現

相關文章：

1. React+umi+typeScript創建項目的過程2. ASP調用WebService轉化成JSON數據，附json.min.asp3. php測試程序運行速度和頁面執行速度的代碼4. php網絡安全中命令執行漏洞的產生及本質探究5. ASP.NET Core 5.0中的Host.CreateDefaultBuilder執行過程解析6. 無線標記語言(WML)基礎之WMLScript 基礎第1/2頁7. Warning: require(): open_basedir restriction in effect,目錄配置open_basedir報錯問題分析8. ASP中常用的22個FSO文件操作函數整理9. SharePoint Server 2019新特性介紹10. 三個不常見的 HTML5 實用新特性簡介

排行榜

					
					Python如何讀寫CSV文件
淺談Django QuerySet對象(模型.objects)的常用方法
Python+logging輸出到屏幕將log日志寫入文件
Python使用jupyter notebook查看ipynb文件過程解析
解決Python 進程池Pool中一些坑
IntelliJ IDEA調整字體大小的方法
docker容器調用yum報錯的解決辦法
使用UML編寫Java應用程序 (1)
ASP.NET Core 5.0中的Host.CreateDefaultBuilder執行過程解析
php測試程序運行速度和頁面執行速度的代碼
Python xlwings插入Excel圖片的實現方法
				

熱門標簽

国产综合久久一区二区三区