大家好,小弟最近需要進行網路爬蟲的動作,所使用的系統是Ubuntu 18.04,搭配Python 3.6.9
對Scrapy爬蟲的檔案有一定的認識。
這次我在github下載了一個package,網址如下:
https://github.com/scrapy/quotesbot
然後就直接用github的程式,打開terminal 輸入以下指令執行是成功的:
scrapy crawl toscrape-css -o quotes.json
他們所使用的目標爬蟲網址是以下網址:
http://quotes.toscrape.com/
 
現在,我打算改為使用以下網址進行爬蟲,因此會更改裡面的程式碼:
https://forum.hkgolden.com/channel/CA
 
目前我所遇到的問題是,我把toscrape-css.py 的程式碼進行修改,但不知道為何修改後卻無法抓到任何的資料,打開輸出的json檔發現沒有任何資料在裡面,但是又沒有顯示任何錯誤。
 
Ubuntu 18.04 無法成功爬蟲
我不知道問題到底是在哪裡,希望你們能幫到我,謝謝喔
文章關鍵字
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!