
日期:2012-05-21 12:06 /人氣:516 /來源:互聯網
站在搜索引擎蜘蛛抓取網站內容的角度去看待一個網站,蜘蛛到底會青睞怎樣的網站設計呢,網站針對搜索引擎的抓取,索引和排名等關鍵因素如何做出最適當的網站設計,有的放矢,理論上來說網站設計解決了這幾個關鍵的問題,一定程度上就可以增加搜索引擎的友好度。
首先,蜘蛛必須先找到你的網頁才能進一步抓取你網站的內容。要讓搜索引擎發現網站首頁,就必須有外部鏈接鏈到首頁。找到首頁后蜘蛛沿著內部鏈接找到更深的內容頁,所以從這個角度來說就要求網站要有良好的結構,符號邏輯,并且所有頁面可以通過可以爬行的普通HTML鏈接到達。JavaScript鏈接,Flash中的鏈接等搜索引擎蜘蛛一般不能爬行,就會造成收錄問題。網站所有頁面離首頁都不能設置得太遠,最好在五次點擊之內。要被收錄,頁面要有最基本的權重,良好的網站鏈接結構可以適當傳遞權重,使盡量多的頁面達到收錄門檻。
其次的問題就是蜘蛛找到了你的頁面之后能不能順利抓取。被找到的URL必須是可以被抓取的,由數據庫動態生成。帶有太多數據庫調用的ID,整個頁面 Flash過多,可疑的轉向以及大量復制內容等都可能使搜索引擎敬而遠之。某些文件站長可能不希望被收錄,除了不鏈接到這些文件,更保險的方法是使用 robots文件或meta robots標簽禁止收錄。
最后,必須考慮蜘蛛在抓取頁面之后怎樣提取有用信息,我們知道讓整個頁面的關鍵信息點被抓取到才是重點,這也是我們網站設計要求的,關鍵詞在頁面重要位置合理分布,重要標簽的撰寫,HTML代碼的精簡,一定程度上都可以幫助搜索引擎理解頁面內容,提取有用信息。這些設計可以幫助搜索引擎能順利找到所有頁面,抓取這些頁面并提取其中真正有相關性的內容,這樣才能讓搜索引擎友好對待網站。
關注夢蕾設計
作者: