發表于:2009-05-28 00:00:00來(lái)源:網絡人(rén)氣:3873
什麽是網址規範化? 我們可(kě)以反過來(lái)想,簡單點說(shuō)就(jiù)是内容相(xiàng)同但(dàn)URL不一樣的網址爲不規範化網址。
不規範化網址代來(lái)的問(wèn)題是:
1.多個URL存在分(fēn)散了頁面權重,不利于排名。
2.對搜索引擎來(lái)說(shuō)是浪費資源,浪費帶寬。
3.搜索引擎發現多個網址内容相(xiàng)同時,雖然不會懲罰,但(dàn)是它根據自(zì)己的算法找出自(zì)己認爲是規範化的網址,但(dàn)這通常和我們希望的網址不同。
4.如(rú)果網站(zhàn)上網址規範化問(wèn)題非常嚴重,那是會影(yǐng)響收錄,甚至也有被懲罰的可(kě)能。
下面有一些常規的處理(lǐ)辦法:
1.用301轉向,把不規範化URL全部轉向到規範化URL
2.在提交給搜索引擎的網站(zhàn)地圖中全部指定規範化網址
3.在Google管理(lǐ)員(yuán)工(gōng)具中設置帶wwW和不帶wwW的,哪一個是規範化版本
4.确保使用系統隻産生(shēng)規範化網址
5.确保網站(zhàn)上所有内部鏈接都(dōu)指向規範化網址
但(dàn)這些方法都(dōu)有一些這樣或那樣的問(wèn)題,要不就(jiù)是隻适合google,或由于權限問(wèn)題比如(rú)像301轉向這些根本無法設置,程序設置大(dà)部分(fēn)站(zhàn)長估計(jì)也都(dōu)頭痛的說(shuō),不過現在有個好消息是,Google,雅虎,微軟共同發布了一個新的标簽canonical tag,專門(mén)用于解決網址規範化問(wèn)題:
其實就(jiù)是在HTML文件(jiàn)的頭部加上這樣一段代碼:
<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />
意思就(jiù)是這個網頁的規範化網址應該是:
http://www.example.com/product.php?item=swedish-fish
下面這些URL都(dōu)可(kě)以加上這段代碼:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
這些URL的真正規範化網址就(jiù)都(dōu)成爲:
http://www.example.com/product.php?item=swedish-fish
這個标簽相(xiàng)當是一個頁面内的301轉向,隻是用戶并不被轉向,還(hái)是停留在不變網址上,而搜索引擎會把它當作(zuò)是301轉向處理(lǐ),也就(jiù)是說(shuō)把頁面鏈接的權重都(dōu)集中到代碼中指明的規範化網址上了,是不是很爽啊,呵呵。
不過,有幾個細節還(hái)是需要注意一下:
1.這個标簽隻是一種建議(yì)或暗示,所以搜索引擎會并不是百分(fēn)之百的按這個代碼來(lái)做
,還(hái)是會考慮其他(tā)情況來(lái)判斷規範化網址。
2.這段代碼既可(kě)以使用絕對地址,也可(kě)以使用相(xiàng)對地址。
3.指定的規範化網址上的内容,與其他(tā)使用這段代碼的非規範化網址内容可(kě)以有一些不同,不一定完全一樣。
4.指定的規範化網址可(kě)以是不存在頁面,返回404,也可(kě)以是還(hái)沒有被收錄的頁面。
5.這個标簽适用于同一個域名内,包括二級域名。
6.這個标簽不是救命草,重要的還(hái)是得(de)把網站(zhàn)結構做好,避免出現URL規範化問(wèn)題。
這個标準被3大(dà)搜索引擎Google,雅虎,微軟同時支持,至于百度呢(ne)?還(hái)得(de)在等等吧(ba),希望可(kě)以快(kuài)點也支持了。