亚洲日韩国产一区二区三区-亚洲自拍偷拍精品-亚洲色图小说-成人黄色网-射进来av-一级片网站在线观看-国产亚洲精品久久久久久久软件-色综合久久中文综合网-青青草欧美-91精品一二区-国产91美女视频-夜夜嗨av禁果av粉嫩avhd-国产黑丝精品-自拍偷拍18p-老司机午夜免费福利-亚洲一区国产二区-国产日韩欧美另类

東莞網(wǎng)站優(yōu)化
聯(lián)系電話:0769-33896899      13412461466 宋先生

提高全棲運營網(wǎng)站的抓取率的方法有哪些

發(fā)布時間:2018-05-24 17:15    來源:http://m.rongmere.cn/    作者:啟源信息科技    點擊次數(shù):

  對于搜索引擎而言,爬蟲效率的一個重要評價標準就是爬蟲開銷。淺析提高全棲運營網(wǎng)站的抓取率的方法有哪些?

Dasgupta等人將爬蟲開銷定義為:爬蟲開銷=重復(fù)抓取的老頁面數(shù)/發(fā)掘的新頁面數(shù)。那么,爬蟲的抓取頻率以及效率該如何優(yōu)化呢?下面進行具體介紹。

首先,以robots.txt命名的文本文件是個很強的利器,當網(wǎng)站上擁有重復(fù)內(nèi)容、無內(nèi)容且無意義頁面等類似內(nèi)容的時候,就可以果斷地用robots.txt屏蔽掉。這里需要注意:robots.txt文件可以用通配符書寫,書寫是比較自由的。建議把xml格式的sitemap路徑放在robots.txt文件中,供搜索引擎尋找。

其次,當需要合理地、有效率地下載一個網(wǎng)站時,設(shè)置參數(shù)nofollow,可以讓百度搜索引擎不抓取頁面上的所有鏈接。在robots.txt文件中添加rel=“noindex”語句,不能阻止百度爬蟲抓取,因為noindex參數(shù)可以讓搜索引擎不把當前網(wǎng)頁置入索引庫,但是頁面上所有的鏈接,爬蟲都會去分析。若要屏蔽鏈接,要加上nofollow參數(shù)。

總之,提高爬蟲的抓取效率在SEO之中是一件比較重要的事情,尤其對于中大型網(wǎng)站而言,應(yīng)該將大部分精力放在讓爬蟲抓取更多更準的頁面上,而不是讓它抓到無意義的頁面。

 
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 QQ咨詢
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 官方微信
東莞網(wǎng)站優(yōu)化 關(guān)注微信
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 聯(lián)系電話
0769-33896899
東莞網(wǎng)站優(yōu)化 東莞網(wǎng)站優(yōu)化 預(yù)約上門
攀枝花市| 那坡县| 本溪市| 逊克县| 高尔夫| 加查县| 旬邑县| 闵行区| 广宁县| 新巴尔虎左旗| 乌拉特前旗| 安仁县| 苍溪县| 铜山县| 普洱| 凭祥市| 聊城市| 大兴区| 历史| 班玛县| 宁武县| 额敏县| 建昌县| 志丹县| 故城县| 马山县| 武川县| 从化市| 依安县| 宁河县| 镇原县| 瑞丽市| 阜城县| 蒙阴县| 修文县| 灵台县| 澜沧| 琼中| 阿拉善盟| 东台市| 安远县|