《移動搜索建站優化白皮書》百度發布--百度專屬SEO工具
4??百度專屬SEO工具
4.1??百度搜索資源平臺(原百度站長平臺)介紹
百度搜索資源平臺(原百度站長平臺)是全球最大的面向中文互聯網管理者、移動開發者、創業者的搜索流量管理的官方平臺。提供有助于搜索引擎數據查詢及優化的工具、SEO建議、多端適配服務的能力等。
百度搜索資源平臺域名地址:http://ziyuan.baidu.com/
4.2??查詢工具
4.2.1??索引量工具
網站的索引量指該網站在百度搜索上,可以被用戶搜索到的鏈接總量。百度蜘蛛通過抓取發現網站內容,進行頁面解析,對有價值內容建立索引庫,最終使搜索用戶可以搜索到網站內容。
網站被百度蜘蛛抓取后,經過一系列計算才得以建入索引庫,有了和搜索用戶見面的機會。所以,索引量一直是站長們關注的焦點,但關于索引量工具有一些誤讀,這里給到正確解答:
√?索引量不等于網站流量:索引庫分多個層級,進入上層索引庫才有更多與搜索用戶見面的機會;進入下層庫機會渺茫。所以,索引量總體的增加減少并不能說明流量會有什么變化;
√?索引量變化不直接影響流量變化:當流量發生巨大變化時,索引量數據可以作為排查原因的渠道之一,但不是唯一排查渠道,索引量變化并不直接影響流量變化;
√?索引量浮動情況,索引量上下浮動10%(經驗值),甚至更多,都可能屬于正常。只要流量變化不大就不用緊張。
4.2.2??流量與關鍵詞工具
流量與關鍵詞工具提供站點的熱門關鍵詞在百度搜索結果中的展現及點擊量數據,通過對關鍵詞表現情況的監控,幫助網站更好進行優化,流量與關鍵詞工具可全面幫助站長了解網站在百度搜索引擎中的表現,決定頁面及網站的優化方向,為網站運營決策提供分析依據。
關于流量與關鍵詞工具,還有一點需要強調,如果站長需要在反饋中心中提交關于網站流量異常的情況,請使用此工具的數據、及數據截圖作為證據,便于工作人員分析網站問題。
?
4.2.3??抓取頻次工具
什么是抓取頻次
抓取頻次是搜索引擎在單位時間內(天級)對網站服務器抓取的總次數,如果搜索引擎對站點的抓取頻次過高,很有可能造成服務器不穩定,百度蜘蛛會根據網站內容更新頻率和服務器壓力等因素自動調整抓取頻次。
什么情況下可以進行抓取頻次上限調整:
首先,百度蜘蛛會根據網站服務器壓力自動進行抓取頻次調整;
其次,如果百度蜘蛛的抓取影響了網站穩定性,站長可以通過此工具調節百度蜘蛛每天抓取網站的頻次上限。
強調1:調整抓取頻次上限不等于調高抓取頻次;
強調2:建議站長慎重調節抓取頻次上限值,如果抓取頻次過小則會影響百度蜘蛛對網站的及時抓取,從而影響索引。
4.2.4??抓取診斷工具
什么是抓取診斷
抓取診斷工具,可以讓站長從百度蜘蛛的視角查看抓取內容,自助診斷百度蜘蛛看到的內容,和預期是否一致。每個站點每周可使用200次,抓取結果只展現百度蜘蛛可見的前200KB內容。
抓取診斷工具能做什么
目前抓取診斷工具有如下作用:
√?診斷抓取內容是否符合預期,譬如很多商品詳情頁面,價格信息是通過JavaScript輸出的,對百度蜘蛛不友好,價格信息較難在搜索中應用。問題修正后,可用診斷工具再次抓取檢驗;
√?診斷網頁是否被加了黒鏈、隱藏文本。網站如果被黑,可能被加上隱藏的鏈接,這些鏈可能只在百度抓取時才出現,需要用此抓取工具診斷。
?
4.2.5??抓取異常工具
什么是抓取異常
百度蜘蛛無法正常抓取,就是抓取異常。通常網站出現抓取異常,都是網站自身原因造成,需要網站根據工具提示,盡快自查網站問題并解決。
抓取異常對網站有哪些影響
對于大量內容無法正常抓取的網站,搜索引擎會認為網站存在用戶體驗上的缺陷,并降低對網站的評價,在抓取、索引、搜索評價上都會受到一定程度的負面影響,最終影響到網站從百度獲取的流量。
抓取異常的原因有哪些
●?網站異常
√?DNS異常:當百度蜘蛛無法解析網站的IP時,會出現DNS異常??赡苁蔷W站IP地址錯誤,或者域名服務商把百度蜘蛛封禁。請使用whois或者host查詢自己網站IP地址是否正確且可解析,如果不正確或無法解析,請與域名注冊商聯系,更新網站IP地址;
√?連接超時:抓取請求連接超時,可能原因服務器過載,網絡不穩定;
√?抓取超時:抓取請求連接建立后,下載頁面速度過慢,導致超時,可能原因服務器過載,帶寬不足;
√?連接錯誤:無法連接或者連接建立后對方服務器拒絕。
●?鏈接異常
√?訪問被拒絕:爬蟲發起抓取,httpcode返回碼是403;
√?找不到頁面:爬蟲發起抓取,httpcode返回碼是404;
√?服務器錯誤:爬蟲發起抓取,httpcode返回碼是5XX;
√?其他錯誤:爬蟲發起抓取,httpcode返回碼是4XX,不包括403和404。
?
4.3??提交工具
4.3.1??鏈接提交工具
目前一共有4種提交方式,分別是主動推送、Sitemap、手工提交和自動推送,這四種推送方式的區別,請看下圖:
建議有新聞屬性站點,使用主動推送進行數據提交;新驗證平臺站點,或內容無時效性要求站點,可以使用Sitemap將網站全部內容使用Sitemap提交;技術能力弱,或網站內容較少的站點,可使用手工提交方式進行數據提交;最后,還可以使用插件方式,自動推送方式給百度提交數據。
使用鏈接提交工具,還需要注意的是,部分網站會采用第三方插件推送數據,插件推送方式需要站長仔細檢查推送邏輯,之前發生過站長使用第三方插件推送數據,而第三方插件采用域名+標題進行推送,這樣導致推送給百度的URL中存在中文字符,帶有中文字符的URL會301跳轉到真實的URL上,出現此類情況,是無法享受快速抓取優待的。
鏈接提交工具可以快速幫助站點實現內容抓取,使用第三方插件可以快速幫助站長解決推送的問題,站長只需在選擇插件時,仔細檢查下插件數據邏輯,否則推送錯誤數據,網站數據無法享受快速抓取優待。
4.3.2??死鏈提交工具
為什么要使用死鏈工具
當網站死鏈數據累積過多時,并且被展示到搜索結果頁中,對網站本身的訪問體驗和用戶轉化都起到了負面影響。另一方面,百度檢查死鏈的流程也會為網站帶來額外負擔,影響網站其他正常頁面的抓取和索引。
注意事項:
√?請推送協議死鏈數據,死鏈工具僅支持協議死鏈數據;
√?提交死鏈被刪除后,網站可以刪除已提交的死鏈文件,否則搜索仍會繼續抓取死鏈文件,確認文件中內容。
什么是死鏈規則提交?
死鏈規則是鏈接前綴,且匹配前綴的鏈接全部是死鏈。
目前支持兩種死鏈規則:
√?目錄規則:以“/”結尾的前綴;
√?CGI規則:以“?”結尾的前綴。
什么是死鏈文件提交?
√?站長需要提交已被百度建索引的、且需要刪除的鏈接,如鏈接在百度搜索不到,則可以不提交死鏈;
√?需要刪除的鏈接需要全部設置為404,如發現有鏈接非死鏈,會導致文件校驗失敗,從而無法刪除死鏈;
√?如死鏈文件抓取失敗,可以通過抓取診斷工具判斷死鏈文件是否可以正常抓?。?/p>
√?站長提交死鏈后,請不要在robots中封禁百度蜘蛛,封禁百度蜘蛛會影響鏈接的正常刪除;
√?如果需要刪除的鏈接已經被刪除,請及時的刪除掉死鏈文件;
√?提交死鏈工具,最長需要2-3天生效死鏈。如站長發現鏈接未被刪除,一周后可以重新提交。
規則提交:
√?規則死鏈不支持通配符;
√?規則死鏈必須是以?或者 /結尾的規則。
關于死鏈提交的常見問題
√?網站死鏈數據,除了使用死鏈提交工具,還可以使用robots屏蔽百度抓取,百度將根據robots文件中的規則,不再抓取該內容,如果該內容線上已經展現,將會進行屏蔽;
√?已經提交死鏈的文件,蜘蛛仍會繼續抓取,檢查文件中是否有更新的鏈接;如抓到更新的鏈接,將再次校驗網站;如死鏈提交已生效,且此文件后續將不再更新,可以直接在工具中將文件刪除;
√?搜索資源平臺中的鏈接分析工具,有死鏈分析功能,可以幫助網站發現站內死鏈。
4.3.3??移動適配工具
什么是移動適配,移動適配工具的作用
移動適配工具主要用于,如果網站同時擁有PC站和移動站,且二者能夠在內容上對應,即主體內容完全相同,網站可以通過移動適配工具進行對應關系,便于百度來識別PC和移動站之間的關系。
站長通過移動適配工具提交pattern級別或者URL級別的PC頁與手機頁對應關系,若可以成功通過校驗,將有助于百度移動搜索將移動用戶直接送入對應的手機頁結果。積極參與“移動適配”,將有助于的手機站在百度移動搜索獲得更多流量,同時以更佳的瀏覽效果贏取用戶口碑。
移動適配工具如何使用
當網站同時擁有移動站點和PC站點、且移動頁面和PC頁面的主體內容完全相同,就可以在通過百度搜索資源平臺(原百度站長平臺)提交正確的適配關系,獲取更多移動流量。
第一步:注冊并登錄百度搜索資源平臺(原百度站長平臺);
第二步:提交PC網站并驗證站點與ID的歸屬關系,具體驗證網站歸屬方法可見幫助文檔;
第三步:站點驗證后,進入“網站支持”――“數據引入”――“移動適配工具”,選擇具體需要進行移動適配的PC站,然后“添加適配關系”;
第四步:根據自己提交的適配數據特點,選擇適合網站的提交方式。目前移動適配工具支持規則適配提交URL適配提交,無論使用哪種方式都需要先指定PC與移動站點,此舉可以令平臺更加快速地檢驗提交的數據、給出反饋,順利生效。同時在之后步驟中提交的適配數據中必須包含指定的站點,否則會導致校驗失??;
1)規則適配:當PC地址和移動地址存在規則(pattern)的匹配關系時(如PC頁面www.test.com/picture/12345.html,移動頁面m.test.com/picture/12345.html),可以使用規則適配,添加PC和移動的正則表達式,正則的書寫方式詳見工具頁面《正則格式說明》。強烈建議使用規則適配,一次提交成功生效后,對于新增同規則的URL可持續生效,不必再進行多次提交。同時該方式處理周期相對URL適配更短,且易于維護和問題排查,是百度推薦使用的提交方式。
2)URL適配:當規則適配不能滿足適配關系的表達時,可以通過“URL對文件上傳”功能,將主體內容相同的PC鏈接和移動鏈接提交給百度:文件格式為每行前后兩個URL,分別是PC鏈接和移動鏈接,中間用空格分隔,一個文件最多可以提交5萬對URL,可以提交多個文件。另外網站還可以選擇“URL對批量提交”,在輸入框中直接輸入URL對,格式與文件相同,但此處一次性僅限提交2000對URL。
第五步:提交適配數據后,關注移動適配工具會提供狀態說明,若未適配成功,可根據說明文字和示例進行相應的調整后更新提交適配數據。
4.3.4、robots
什么是robots文件
robots是站點與蜘蛛溝通的重要渠道,站點通過robots文件聲明該網站中不想被搜索引擎抓取的部分或者指定搜索引擎只抓取特定的部分。
請注意,僅當網站包含不希望被搜索引擎抓取的內容時,才需要使用robots.txt文件。如果希望搜索引擎抓取網站上所有內容,請勿建立robots.txt文件。之前發現很多流量下降的網站示例,最后追查都是因為技術人員通過robots對搜索引擎加了封禁。
為了避免站長在設置robots文件時出現錯誤,百度搜索資源平臺(原百度站長平臺)特別推出了robots工具,幫助站長正確設置robots。
robots.txt文件的格式
????robots文件往往放置于根目錄下,包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL, or NL作為結束符),每一條記錄的格式如下所示:
????????"
在該文件中可以使用#進行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow和Allow行,詳細情況如下:
????User-agent:該項的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多條User-agent記錄說明有多個robot會受到"robots.txt"的限制,對該文件來說,至少要有一條User-agent記錄。如果該項的值設為*,則對任何robot均有效,在"robots.txt"文件中,"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。
Disallow:該項的值用于描述不希望被訪問的一組URL,這個值可以是一條完整的路徑,也可以是路徑的非空前綴,以Disallow項的值開頭的URL不會被 robot訪問。例如"Disallow:/help"禁止robot訪問/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"則允許robot訪問/help.html、/helpabc.html,不能訪問/help/index.html。"Disallow:"說明允許robot訪問該網站的所有URL,在"/robots.txt"文件中,至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件,則對于所有的搜索引擎robot,該網站都是開放的。
Allow:該項的值用于描述希望被訪問的一組URL,與Disallow項相似,這個值可以是一條完整的路徑,也可以是路徑的前綴,以Allow項的值開頭的URL 是允許robot訪問的。例如"Allow:/hibaidu"允許robot訪問/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一個網站的所有URL默認是Allow的,所以Allow通常與Disallow搭配使用,實現允許訪問一部分網頁同時禁止訪問其它所有URL的功能。
使用"*"and"$":百度蜘蛛支持使用通配符"*"和"$"來模糊匹配URL。
????"*" 匹配0或多個任意字符。
????"$" 匹配行結束符。
最后需要說明的是:百度會嚴格遵守robots的相關協議,請注意區分網站不想被抓取或抓取的目錄的大小寫,百度會對robots中所寫的文件和網站不想被抓取和抓取的目錄做精確匹配,否則robots協議無法生效。
?
4.4??搜索展現工具
站點logo百度搜索資源平臺推出的免費類工具,可以給到網站品牌曝光、展示。站點logo是百度搜索根據網站評價、用戶需求度、用戶瀏覽軌跡等系統分析產出的效果,因此這個工具并不是所有站點都享有權限。
4.4.1??站點logo
站點申請百度搜索下的logo展示,可以通過搜索資源平臺——站點屬性——站點logo中進行提交,此工具為免費展示類工具。
下圖為站點logo的截圖示例:
4.5?維護類工具
4.5.1?網站改版工具
當一個站點的域名或者目錄發生變化時,如果想讓百度快速收錄變化之后的新鏈接、用以替換之前的舊鏈接,需要使用百度搜索資源平臺的網站改版工具來提交網站的改版關系,加速百度對已收錄鏈接的新舊替換。網站換域名對網站的影響,可以參考5.1章節網站換域名。
使用改版工具提交改版規則的前提:
√?站點的URL發生了變化,不論是域名還是站點的目錄,或者結果頁URL發生變化,改版工具都提供支持,這里單獨說一點,頁面內容發生變化的不在改版工具處理的范圍內;
√?如果站點URL的路徑和參數部分都沒有變化,僅僅是域名改變的,只需要知道每個改版前域名和改版后域名的對應關系,不要有整理遺漏,目前平臺不支持主域級別的改版規則提交,需要每個域名都單獨提交生效;
√?如果站點URL的路徑和參數部分發生變化,但是路徑和參數都是有規律可尋的,可以通過規則表達式來整理改版前和改版后的URL對應關系;
√?如果站點的URL改變沒有任何規律的情況,需要準確整理出改版前URL和改版后URL的對應關系。
站長要準確的找到對應關系,這與改版規則的生效息息相關。有了準確的對應關系后,就可以設置301跳轉了。
4.5.2??閉站保護工具
由網站自身原因(改版、暫停服務等)、客觀原因(服務器故障、政策影響等)造成的網站較長一段時間都無法正常訪問,百度搜索引擎會認為該站屬于關閉狀態。站長可以通過閉站保護工具進行提交申請,申請通過后,百度搜索引擎會暫時保留索引、暫停抓取站點、暫停其在搜索結果中的展現。待網站恢復正常后,站長可通過閉站保護工具申請恢復,申請審核通過后,百度搜索引擎會恢復對站點的抓取和展現,站點的評價得分不會受到影響。
閉站保護工具的重要tip如下:
√?申請閉站需要保證全站鏈接都是死鏈或直接關閉服務器,申請恢復是需要保證網站服務器已經啟動并沒有死鏈。為了盡快進行閉站保護/解除閉站保護,保障自身權益,請確保以上條件沒問題之后再提交申請(校驗很嚴格,抽樣的內容基本需要是100%);
√?閉站保護申請、死鏈提交等工具,提到的設置死鏈,都必須是協議死鏈,即返回碼是404,否則會導致無法通過校驗。
●?內容死鏈,比如單純的在網頁上寫上404,或一張圖片上畫著404,是不行的。
●?判斷自己網頁返回碼是否是404,瀏覽器里可以直接打開控制臺,查看network的doc,刷新頁面。
●?或者可以控制臺使用命令:curl -i 網頁地址 。
●?查返回的信息。
閉站保護只能保證網站的索引量,不能保證網站的排名。之前有站點反饋閉站保護不好用,因為閉站恢復后網站排名沒有了,這里再次強調一下,使用閉站工具只能保留網站的索引量,但不保證網站的排名不變。
關于閉站保護常見的問題:
√?閉站保護的通過時間是從提交申請到生效一天內;
√?閉站保護申請恢復,是站點沒有任何404頁面等情況下,2天內恢復;
√?閉站保護生效之后,首頁不會屏蔽,如有網站首頁屏蔽需求,可以在搜索資源平臺反饋中心提交;
√?閉站保護最長保護時間是180天,過了180天之后的自動放出,如站點有404頁面
√?仍會正常屏蔽處理;
√?主站申請了閉站保護后,對應移動站也是需要申請閉站保護的;即使存在適配關系,也只能屏蔽在適配關系中的移動鏈接,其余不在適配關系中的鏈接,比如直接被抓取的鏈接,仍無法屏蔽。
?
4.5.3??HTTPS認證工具
使用HTTPS認證工具的收益:
網站通過HTTPS認證后,站點在百度搜索的所有快照都會變成HTTPS格式,蜘蛛也會優先抓取HTTPS的鏈接,讓用戶在搜索中獲得更安全的鏈接。
網站使用HTTPS認證工具的注意事項:
√?保證HTTPS站點正常訪問,且頁面內引入資源為HTTPS格式,包括引入的視頻、圖片、CSS、JS等元素;如果網站沒有全站HTTPS,申請百度搜索資源平臺(原站長平臺)HTTPS認知是不會通過的,但是如果系統沒有檢測到這個情況而通過驗證的話,會導致沒改造的這部分頁面產生死鏈,所以認證前一定要檢測好;
√?如果站點存在HTTP和HTTPS兩種協議的頁面,必須將HTTP的URL 301到HTTPS的URL上,僅有HTTPS站點的可以直接認證;
√?必須保證HTTP站點與HTTPS的鏈接一一對應,沒有HTTPS對應的HTTP鏈接可能會被判斷成死鏈接。
關于網站做HTTPS回退的注意事項:
√?站點通過認證后,只需要點擊退場按鈕(在搜索資源平臺驗證的網站擁有者),就可以退回到HTTP站點了;
√?需要強調的是,點擊回退按鈕后,要等到顯示回退成功了再做其他操作,否則有可能導致網站產生死鏈接。
相關內容推薦
最新文章
更多>>0532-88983785 / 0532-68613670
我要優化網站