網站管理員指南
作者:tank 日期:2006-08-12
網站管理員指南
遵循以下指南將有助於 Google 查找、檢索您的網站並對其進行排名,這是確保在 Google 搜索結果中列出您的網址的最佳途徑。
即使您選擇不採納這些建議,我們也強烈建議您密切關注"質量指南",該指南對可導致網站從 Google 索引中徹底刪除的一些違禁行為做了簡要說明。一旦網站刪除之後,Google.com 或 Google 所有合作夥伴網站的搜索結果中都不會再顯示該網站。
網站設計與內容指南:
網站應具有清晰的層次結構和文本連結。每個網頁應至少可以通過一個靜態文本連結打開。
為用戶提供一個網站地圖,並列出指向網站重要位置的連結。如果網站地圖上的連結超過大約 100 個,則最好將網站地圖拆成多個網頁。
網站應具有實用性且訊息豐富,網頁文字應清晰、準確地表述要傳達的內容。
要考慮到用戶會使用哪些關鍵詞來查找您的網頁,確保網站上包含了這些文字。
盡量使用文字而不是圖像來顯示重要的名稱、內容或連結。因為 Google Crawler 無法識別圖像中所包含的文字。
確保 TITLE 和 ALT 標記文字簡單明瞭並與網頁內容相關。
檢查連結是否損壞,HTML 格式是否正確。
如果採用動態網頁(即網址中包含"?"字元),請注意並非每一個搜索引擎 Spider 收錄動態網頁都能像收錄靜態網頁一樣容易。
縮短參數的長度並減少參數數目將有助於收錄動態網頁。
將每一網頁上的連結數量限制在合理的範圍內(少於 100)。
技術指南:
由於大部分搜索引擎 Spider 查看網站的方式與文本瀏覽器一樣,所以可使用諸如 Lynx 的文本瀏覽器來檢查您的網站。
如果因採用了 Javascript、Cookie、Session ID's、frames (框架)、DHTML 或 Flash 等複雜技術,
而導致在文本瀏覽器中無法看到網站的所有網頁,則搜索引擎 Spider 在收錄您的網站時可能會遇到麻煩。
允許搜索漫遊器 (search bots) 收錄您的網站,同時不採用 Session ID 或其它參數來追蹤它的瀏覽路徑。
這些跟蹤技術對瞭解個別用戶的行為很有用,但由於漫遊器的訪問模式完全不同,採用這些技術則可能會導致對網站的檢索不完整,
因為漫遊器可能無法排除那些看上去不同但實際卻指向同一個網頁的網址。
確保您的網路伺服器支持 If-Modified-Since HTTP 標題。
通過該功能 Google 可以知道自上次收錄以來您的網站內容是否有變化,這樣可以節省您的帶寬和開銷。
使用網路伺服器上的 robots.txt 文件。該文件會告訴 Crawler 可以收取哪些目錄。
請確保該文件內容的更新,以免 Googlebot Crawler 的收錄意外中斷。
有關來訪漫遊器和如何控制它們的常見問題解答,請訪問 www.robotstxt.org/wc/faq.html。
如果貴公司購買了內容管理系統,請確保該系統能導出您的內容,以便搜索引擎 Spider 可以收錄您的網站。
當您的網站一切準備就緒時:
一旦您的網站在線後,請將其提交給 Google,具體網址為:www.google.com/addurl.html。
確保應瞭解您網頁的所有網站都知道您的網站已處於在線狀態。
將您的網站提交給相關的目錄,例如,Open Directory Project 和 Yahoo!。
有關詳細訊息,請定期查閱 Google 的網站管理員部分。