Python最強入門邁向頂尖高手之路:王者歸來(第二版)全彩版
20201204Python頂尖高手之路第2版讀者資源.zip
(範例程式碼)
第二十三章 網路爬蟲
DM1915_ch23.7z
23-1
23-1-1 webbrowser module: ch23_1.py
23-1-3 輸入地址=> GoogleMap: ch23_2.py
# ch23_2.py print("偽裝瀏覽器擷取網路資料成功")
# ch23_3.py "取得網頁內容成功"
# ch23_5.py len(htmlfile.text)
# ch23_6.py print(htmlfile.text)
# ch23_7.py pattern = input("請輸入欲搜尋的字串 : ")
# ch23_8.py # 不存在的內容
# ch23_9.py # 錯誤的網址
23-2-6 裝成browser# ch23_10_1.py, # ch23_10_2.py, # ch23_10_3.py
23-2-7 save webpage # ch23_11.py
23-3 網頁原始檔
Simple examples of World wild Web page Construction
myhtml.html
23-4 BeautifulSoup
# ch23_14.py # ch23_15.py
# ch23_16.py(find('h1')) # # ch23_17.py (find_all('h1'))
getText() # ch23_18.py
select() # ch23_19.py # ch23_20.py # ch23_21.py # ch23_22.py
se;ect ('img') # ch23_23.py # ch23_24.py #
23-5 爬蟲實戰
# ch23_25.py (http://www.grandtech.info)
思考題
Simple examples of World wild Web page Construction
myhtml.html
(1%) 做出"你的學號.html" 內有你今天的照片+表格(你的姓名+學號+生日+住址)
利用網路爬蟲
https://csie.asia.edu.tw/faculty/professors
(1%) 找出所有亞大資工系教授名字
(1%)下載所有亞大資工系教授{照片}
BeautifulSoup之select find和find_all - IT閱讀 - ITREAD01.COM
The differences between "find" and "select"
# ch23_26.py
台灣彩券
思考題
(1%)
台灣彩券
請用網路爬蟲取出最近一期的
{大樂透 6 組號碼(大小順序) 特別號 }
並寫入一個檔案 "學號_姓名_Lottory_6.txt"
{雙贏彩 12 組號碼(大小順序)}
並寫入一個檔案 "學號_姓名_Lottory_12.txt"
(1%)
各期獎號查詢
請用網路爬蟲取出 各期獎號查詢 {110025469}-最近{如:110025564}}
並寫入一個檔案 "學號_姓名_All_Lottory.txt"
(1%)
各期獎號查詢
請用網路爬蟲取出 各期獎號查詢 {110025469}-最近{如:110025564} 計算每個號碼的出現次數,
並將號碼出現次數統計結果 寫入一個檔案 "學號_姓名_All_Lottory_Statistics.txt"
# ch23_27.py