百度站長(zhǎng)中有關(guān)于sitemap常見(jiàn)問(wèn)題,這里我們轉(zhuǎn)述如下,建議網(wǎng)站管理員都要重視這個(gè)問(wèn)題。
一、什么是Sitemap?
Sitemap(即站點(diǎn)地圖)就是您網(wǎng)站上網(wǎng)頁(yè)網(wǎng)址的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁(yè)。
您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度抓取程序參考。
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及索引所有網(wǎng)址。但是,我們會(huì)使用Sitemap中的數(shù)據(jù)來(lái)了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進(jìn)抓取策略,并在日后能更好地對(duì)網(wǎng)站進(jìn)行抓取。
注間:Sitemap 與搜索排名沒(méi)有關(guān)系,但有利于搜索引擎更好的理解網(wǎng)站結(jié)構(gòu)。
二、百度Sitemap協(xié)議都支持哪些格式?
百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來(lái)選擇任意一種格式組織sitemap。
具體格式說(shuō)明及示例如下:
1.第一種格式樣例:txt文本格式
在一個(gè)txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過(guò)站長(zhǎng)平臺(tái)進(jìn)行提交
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南:
文本文件每行都必須有一個(gè)網(wǎng)址。網(wǎng)址中不能有換行。不應(yīng)包含網(wǎng)址列表以外的任何信息。
您必須書(shū)寫(xiě)完整的網(wǎng)址,包括 http。
每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過(guò) 50,000 個(gè),則可將列表分割成多個(gè)文本文件,然后分別添加每個(gè)文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式,sitemap.xml的編碼方式可以是UTF-8(推薦)或者GBK
如圖示:
有多個(gè)sitemap,按上述格式重復(fù)之間的片斷,列明所有sitemap地址,向站長(zhǎng)平臺(tái)進(jìn)行提交。
三、創(chuàng)建sitemap時(shí)有哪些注意事項(xiàng)?
一個(gè)sitemap文件包含的網(wǎng)址不得超過(guò) 5 萬(wàn)個(gè),且文件大小不得超過(guò) 10 MB。如果您的sitemap超過(guò)了這些限值,請(qǐng)將其拆分為幾個(gè)小的sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因提供大文件而超載。
一次性最多提交50個(gè)地址,提交地址的文件類型和更新周期必須一致。
如果驗(yàn)證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。
如果驗(yàn)證的www.example.com,你只能提交該驗(yàn)證網(wǎng)站的網(wǎng)址,不能出現(xiàn)其他網(wǎng)站的網(wǎng)址。
四、如何提交sitemap?
第一步,將需提交的網(wǎng)頁(yè)列表制作成一個(gè)sitemap文件,文件格式請(qǐng)閱讀百度sitemap協(xié)議都支持哪些格式。
第二步,將sitemap文件放置在網(wǎng)站目錄下。
比如您的網(wǎng)站為example.com,您已制作了一個(gè)sitemap_example.xml的sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
第三步,登錄百度站長(zhǎng)平臺(tái),確保提交sitemap數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。
第四步,進(jìn)入sitemap工具,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫(xiě)抓取周期和sitemap文件地址(如:www.example.com/sitemap_example.xml),進(jìn)行提交。
以上兩步是向百度站長(zhǎng)平臺(tái)的的提交步驟。
提交完之后,可在sitemap列表里看到提交的sitemap文件,如果sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點(diǎn)擊更新所選,即對(duì)更新的網(wǎng)站鏈接進(jìn)行了提交。
整體流程如下圖:
五、我提交時(shí)填寫(xiě)的周期是什么含義?
百度spider會(huì)參考設(shè)置周期抓取sitemap文件,因此請(qǐng)根據(jù)sitemap文件內(nèi)容的更新(比如增加新url)來(lái)設(shè)置。
請(qǐng)注意若url不變而僅是url對(duì)應(yīng)的頁(yè)面內(nèi)容更新(比如論壇帖子頁(yè)有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。sitemap工具不能解決頁(yè)面更新問(wèn)題。
六、sitemap提交后,多久能被百度處理?
sitemap數(shù)據(jù)提交后,一般在1小時(shí)內(nèi)百度會(huì)開(kāi)始處理。處理完成的時(shí)間視文件大小和您設(shè)置的抓取周期而定。
七、提交的sitemap都會(huì)被百度抓取并收錄嗎?
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址。是否收錄與頁(yè)面質(zhì)量相關(guān)。
<八、我可以壓縮我的 sitemap 嗎?它們是否需要用 gzip 壓縮?< p="">
可以。請(qǐng)使用 gzip 壓縮 Sitemap。無(wú)論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759字節(jié))。
<p九、xml格式的 sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁(yè)在搜索結(jié)果中的排名嗎?< p="">
不會(huì)。Sitemap 中的“priority”提示只是說(shuō)明該網(wǎng)址相對(duì)于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會(huì)影響網(wǎng)頁(yè)在搜索結(jié)果中的排名。
十、網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用?
不會(huì)。網(wǎng)址在 Sitemap 中的位置并不會(huì)影響百度對(duì)它的識(shí)別或使用方式。
十一、Sitemap中提交的url能否包含中文?
因?yàn)檗D(zhuǎn)碼問(wèn)題建議最好不要包含中文。
生成工具
思途旅游CMS系統(tǒng)可以直接生成,并或者url地址。
贊
1
有一點(diǎn)幫助
0
沒(méi)有幫助
參與評(píng)論