北京利美seo

      蜘蛛抓取但是收錄不放出來為什么

      時間:2020-07-24 作者:北京利美seo 來源:互聯網
      1、爬取和收錄的關系: 爬取和收錄并不是包含關系,他們兩個是搜索引擎工作的環節,蜘蛛爬取頁面后放入臨時數據

      1、爬取和收錄的關系:

      爬取和收錄并不是包含關系,他們兩個是
      搜索引擎工作的環節,蜘蛛爬取頁面后放入臨時數據庫,等內容通過審查后背放出就形成了收錄。所以這兩個環節是前后關系,但是沒有必然的聯系。

                                         

      2.蜘蛛抓取頁面的過程:


      第一階段:大小通吃
      搜索引擎蜘蛛過來抓取時,就需要對網站的URL進行一個統一的抓取,也就是站長常說的“大小通吃”的情況。搜索引擎蜘蛛對網頁中出現地鏈接,都會逐一加入到待抓取URL中,機械性的將新抓取的網頁中的URL提取出來。這對于很多的站點來說,是比較好的情況。搜索引擎蜘蛛過來抓取時,站長可以通過網站日志有一個清楚的記錄。站長可以通過網站日志分析網站優化的基本情況,這僅僅是第一階段。

      第二階段:網頁評級
      搜索引擎蜘蛛對網站的頁面進行抓取以后,就需要對網站的頁面進行評級。PageRank是一種著名的鏈接分析算法,可以用來衡量網頁的重要性,很自然的,站長可以用PageRank的思路來對URL進行排序。搜索引擎蜘蛛抓取頁面后,會對網站的頁面進行下載。但PageRank是個全局性算法,也就是當所有網頁有下載完成后,其計算結果才是可靠的。對于中小網站來講,服務器如果質量不好,如果在抓取過程中,只看到部分內容,在抓取階段是無法獲得可靠的PageRank得分。


      3、蜘蛛爬取成功卻不放出來的原因:

      蜘蛛爬取后會將頁面放入到臨時數據庫,搜索引擎再對臨時數據庫中的內容進行審查,將優質的內容放出并建立索引。所以并不是說爬取就會被收錄,還需要內容質量過關才能被放出來并建立索引。不同的蜘蛛抓取的頁面評測也不一樣,有的是低權重的蜘蛛,有的是高權重的蜘蛛和抓取待定的蜘蛛,這個可以百度搜下各種蜘蛛的情況,來做出各種應對情況

      正常情況下網站提交后次日,spider會放出一個網站主頁的快照。再接下來的時間內,會不斷的收錄索引內容頁,并持續的放出。這個過程維護一月、二月、或者是三月,時間不等。如果網站已經有首頁放出,說明百度蜘蛛已經有來抓取過,只是內容還沒有放出來,多等待些時間即可。如果在等待收錄放出的時間階段不要做任何大的發動。比如說 修改title標題、修改url 等。否則會延長放出的時間,周期也會變長。

      其次,如果內容和首頁都沒有放出來,就需要重新向百度提交,通知百度蜘蛛來抓取網站的內容,最好是提交個sitemap地圖,手動提交一下。

      本文標簽:

      主站蜘蛛池模板: 伊人亚洲综合网| gogo高清全球大胆高清| 人人妻人人澡人人爽人人dvd| 国产动作大片中文字幕| 国产精品亚洲w码日韩中文| 天天摸天天舔天天操| 无码人妻H动漫中文字幕| 日韩一级在线观看| 正在播放国产精品放孕妇| 男女爽爽无遮挡午夜视频在线观看| 男女男精品网站| 男女性色大片免费网站| 美女把尿口扒开让男人桶| 色婷婷久久综合中文久久一本`| 男Ji大巴进入女人的视频| 欧美色图亚洲天堂| 欧美人与动交片免费播放| 最近高清日本免费| 日日橹狠狠爱欧美超碰| 成品煮伊在2021一二三久| 把女人的嗷嗷嗷叫视频软件 | 夫妇交换性2国语在线观看| 国产精品久久免费视频| 国产强伦姧在线观看无码| 国产制服丝袜在线| 午夜性福利视频| 加勒比色综合久久久久久久久| 亚洲伊人久久大香线焦| 久久亚洲AV无码精品色午夜麻 | 精品人妻伦一二三区久久| 欧美性xxxx偷拍| 扒开双腿猛进入爽爽免费视频| 国产精品无码一本二本三本色| 国产XXXX99真实实拍| 亚洲欧美天堂综合久久| 中文字幕理伦午夜福利片| 6580岁老太婆| 精品国产不卡一区二区三区| 日韩毛片无码永久免费看| 在线观看免费视频资源| 国产一区二区在线观看视频|