2012-12-03
現(xiàn)在還是有很多網(wǎng)站采用flash的形式來建站,尤其是一些知名大品牌的官方企業(yè)站點(diǎn),這樣的網(wǎng)站雖然好看但不利于蛛蛛爬行和抓起,這些技術(shù)也被稱為蛛蛛陷阱。
這類網(wǎng)站的整個首頁都是一個大的flash文件,搜素引擎在抓取html代碼時只有一個指向flash文件的鏈接,沒有其他文字內(nèi)容,蛛蛛故而無法讀取flash文件中的文字內(nèi)容和鏈接的,也無法判斷其相關(guān)性。
解決方法如下:
在html頁面中加上一個通往html版本鏈接,這個鏈接應(yīng)該是在flash文件之外的html代碼中,蛛蛛可以跟蹤這個鏈接抓取后面的html版本頁面。html網(wǎng)站地圖,對于一些必須要有js腳本;flash圖片的網(wǎng)站來說,網(wǎng)站地圖是搜索引擎找到網(wǎng)站所有頁面的重要途徑之一。對稍具規(guī)模的網(wǎng)站來說,一個網(wǎng)站地圖不可能羅列所有的頁面鏈接,可以采取只列出主要部分的鏈接,如一級分類;二級分類等等。還可以將網(wǎng)站地圖分成多個,然后由一個頁面鏈接起來。