本身不是從事架設網站的專業人員,

找了一些教學文章但是還是看不太懂,

希望有人可以幫幫忙,感謝不盡,

以下是該網站的robots.txt

User-Agent:*
Disallow: /archive/
Disallow: /libs/
Disallow: /html/
Disallow: /themes/
Disallow: /*/themes/
Disallow: /images/
Disallow: /css/
Disallow: /!OLD/
Disallow: /error_page/
Disallow: /mail_templates/

Sitemap: http://OOXXXX.com/sitemap.xml

-------------------------------------------

我查過教學文章,我發現有幾個問題是:

Disallow: /html/ =>這一條為何要禁止搜尋html以下的內容?

Sitemap: http://OOXXXX.com/sitemap.xml

=> 基本上有提交Sitemap為何還要寫在裡面?


我目前找到可能有的問題。有大大可以賜教哪幾條是不必要的?

或者應該是怎樣編寫才是正確的呢?



文章關鍵字
請參考
https://zh.wikipedia.org/wiki/Robots.txt
lingo530 wrote:
我發現有幾個問題是:Disallow: /html/ =>這一條為何要禁止搜尋html以下的內容

這是禁止html目錄下的檔案被爬,雖然目錄名叫html,目錄裡的檔案不一定要放html吧

sitemap因為各大搜尋網站皆有支援,用總比沒用好,至於Robots.txt的Disallow基本上就是此地無銀三百兩 XD

up2u wrote:
請參考https:...(恕刪)


您好,感謝回答問題。我乾脆直接把檔案刪除比較快。其實不太需要用到這個
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!