如何提高網站在Google中的排名

穩萊
如何提高網站在Google中的排名

作者: 車東 2003年01月07日 ZDNet

--------------------------------------------------------------------------------
誰不想自己的網站在Google的搜索結果重排名靠前呢,但你的網站設計是Search Engine Ready的嗎?本文介紹了網站設計中面向搜索引擎的優化注意事項。

什麼是PageRank
Google等新一帶搜索引擎的優勢之一在於不僅索引量很大,而且還將最好的結果排在搜索結果的最前面,具體的原理可以參考Google ?秘密 - PageRank 徹底解?一文,PageRank簡單的說類似於科技論文中的引用機制:誰的論文被引用次數多,誰就是權威。在互聯網上PageRank就是基於網頁中相互鏈結關係的分析得出的,由此引出第一個要點:

鏈結就是一切
在互聯網的海洋中,最重要的就是互聯互通,不被其他網站引用的網站就是“資訊孤島”。“酒好也怕巷子深”,也許這話說起來有點像垃圾郵件廣告,但事實就是這樣。所以如果做網站的目的不是孤芳自賞,就需要積極的推廣自己的網站。

Blogger(Weblog簡稱Blog)們也許最深刻的理解了這句話的含義,Blogger之間有大量相互鏈結,因此最經常被引用的頁面在搜索引擎中的排名往往比一些大型商業網站的頁面還要高。

在推廣自己網站之前也許首先需要自己網站在一些搜索引擎中的知名度,有一個小工具:link popularity check。原理可以參考:如何評價網站的人氣一文。

例子1:不一定加入大型網站的分類目錄才是網站推廣,來自其他網站的任何反相鏈結都是有用的。
網站推廣比較經典的方式就是加入比較大型網站的分類目錄,比如:Yahoo!,dmoz.org等。其實這裏有一個誤區:不一定非要從大型網站的分類目錄才是網站推廣,因為現在搜索引擎已經不再只是網站目錄的索引,而是更全面的網頁索引,所以無論來自大網站任何地方的反相鏈結都是非常有價值的,只要是出現在新聞報導,論壇,郵件列表歸檔,關鍵是要多,而且是權重高的高層頁面,我的網站沒有加入任何分類目錄,而是將一些文章投稿在了ZDNet中國上,相應網頁和網站整體的PageRank過了一段時間後就有了很大的提升。

例子2:被PageRank高的網站引用能更快地提高PageRank。
被什麼樣的網站引用有時候比引用次數多更重要,我的文章被ZDNet中國引用以後,相應網頁的權重升高非常快。這裏我要特別感謝的是,ZDNet中國是唯一遵循了我的版權聲明的要求表明了文章出處,並且有反相鏈結的網站。

例子3:投搜索引擎所“好”
Lucene簡介這篇文章被Jakarta.apache.org的lucene項目引用以後,這篇文章就成為了所有頁面中PageRank最高的頁面(在Google工具欄上顯示是6/10),而Google深厚的學院氣氛讓我一直懷疑他們對.org .edu等非功利站點有特別加分 :-)。

   網站推廣只是手段,如何突出內容,讓需要相關資訊的用戶能夠儘快的找到你的網站才是目的,第二個要點:

標題和關鍵字的重要性
不要空著標題:空著<title></title>;
傳統的頁面中,會有類似以下的資訊:用於說明網頁的主題
<header>
<meta name="keyword" content="mp3 download music...">
</header>
後來由於這種人工添加關鍵字的方式被濫用,大量網頁中為了提高被搜索引擎命中的概率,經常添加一些和實際網頁內容無關的熱門關鍵比如:“music mp3 download”等,所以新的搜索引擎已經不再關心頁面頭檔中的meta keyword聲明,而頁面標題在搜索引擎的關鍵字的命中命中過程中有著更高的比重,如果一個關鍵字在標題中命中會比在頁面中命中有更高的得分,從而在相應的搜索結果排名中更靠前。
標題長度:不要過長,一般在40個字元以內;如果更長的標題搜索引擎一般會忽略掉,所以要盡可能將主要關鍵字放在標題靠前的位置。
標題內容:儘量用一些別人可以通過關鍵字找到的字眼;"Website search engine optimization" 會比"面向搜索引擎的網站設計優化"有效的多。
如果網頁很多的話,儘量使用不同的網頁標題,爭取讓自己網站的內容更多的進入搜索引擎索引範圍;
我的猜測:搜索引擎會根據頁面內容的相似度把一些內容當成重複頁面排除出索引範圍;
http://www.chedong.com/phpMan.php是我的網站上的一個小應用:一個web介面的unix命令手冊(man page),在以前的設計中所有動態頁面使用的都是同樣的標題:"phpMan: man page /perldoc /info page web interface" ,Google索引了大約3000多個頁面,後來我將頁面標題改成了"phpMan: [命令名]"這樣的格式,比如:"phpMan: ls",這樣大部分動態頁面的標題就都不一樣了,一個月後Google從這個頁面入口索引了大約6000個頁面。因此,如果網站中很多網頁都使用相同的標題,比如:“新聞”,“論壇”,這些頁面中很大一部分就會被排重機制忽略掉。
除了<title></title>外,還可以用<h1></h1>標題行突出內容主題,加強標題的效果;
在我的網站設計中:我會把用<h1>[標題]</h1>這樣的範本把標題突出顯示,而不是通過改變字體的方式突出標題。
其他網站設計提示
表現和內容的分離:
網頁中的javascript和css盡可能和網頁分離,一方面提高代碼重用度(也方便頁面緩存),另外一方面,由於有效內容占網頁長度的百分比高,也能提高相關關鍵字在頁面中的比重,應該鼓勵使用更規範的XHTML和XML作為顯示格式便於內容更長時間的保存。
站點地圖:讓所有的頁面都有能夠快速入口,方便網頁爬蟲(spider)快速遍曆網站所有需要發佈的內容。提高網站自身的健康狀態:經常利用壞鏈檢查工具(比如:XENU)生成網站地圖統計,並檢查網站中是否有死鏈。
盡可能保持網頁的持久性,保證引用你的網頁能夠被比較持久的穩定引用,如果網頁中有鏈結更新時,最好能保留舊的頁面並做好鏈結轉向,保持內容的連續性。


知己知彼——站點訪問統計/日誌分析挖掘的重要性

網站設計不僅僅只是被動的迎合搜索引擎的索引,更重要是充分利用搜索引擎帶來的流量進行更深層次的用戶行為分析。目前,搜索引擎關鍵字統計幾乎是各種日誌分析工具的標準功能,日誌統計這個功能如此重要,以至於新的RedHat 8中已經將日誌分析工具webalizer作為標準的伺服器配置應用之一。相信商業日誌統計工具在這方面應該會有更強化的實現。

以Apache/webalizer為例,具體的做法如下:

記錄訪問來源:
在Apache配置檔中設置日誌格式為combined格式,這樣的日誌中會包含擴展資訊:其中有一個欄位就是相應訪問的轉向來源:HTTP_REFERER,如果用戶是從某個搜索引擎的搜索結果中找到了你的網頁並點擊過來,日誌中記錄的HTTP_REFERERL就是用戶在搜索引擎結果頁面的URL,這個URL中包含了用戶查詢的關鍵字。
在webalizer中缺省配置針對搜索引擎的統計:如何提取HTTP_REFERER中的關鍵字
webalizer中缺省有針對yahoo, google等國際流行搜索引擎的查詢格式:
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google.com q=
通過這樣設置webalizer統計時就會將HTTP_REFERER中來自搜索引擎的URL中的keyword提取出來,比如:所有來自google.com鏈結中,參數q的值都將被作為關鍵字統計下來,從匯總統計結果中,就可以發現用戶是根據什麼關鍵字找到你的次數,以及找到你的用戶最感興趣的是那些關鍵字等,進步的,在webalizer中有設置還可以將統計結果倒出成CSV格式的日誌,便於以後導入資料庫進行歷史統計,做更深層次的資料挖掘等。

以前通過日誌的用戶分析主要是簡單的基於日誌中的訪問時間/IP位址來源等,很明顯,基於搜索引擎關鍵字的統計能得到的分析結果更豐富、更直觀。因此,搜索引擎服務的潛在商業價值幾乎是不言而喻的,也許這也是Yahoo! Altavista等傳統搜索引擎網站在門戶模式後重新開始重視搜索引擎市場的原因,相信以後會有更多的利用互聯網媒體做深層次資料挖掘的服務模式出現。



 
如何提高網站在Google的排名(2)
作者: 車東 02/20/2003 16:21:26
--------------------------------------------------------------------------------

關鍵字:
Google PageRank internet advertizing Link Farm 互聯網 廣告 搜索引擎 Paid Inclusion Service

內容摘要:
如果說新一代搜索引擎Google所依賴的PageRank技術更真實的突出了超鏈結(hyperlink)在互聯網中互聯互通的本質,大型門戶網站是否也應該反思一下“注意力經濟”時代的廣告投放/統計模式,也許順應這個潮流讓廣告回歸到最原始的靜態鏈結形式,間接提升廣告客戶自身網站在大型搜索引擎中的排名也許更能突出大型門戶網站自身的優勢。

你也完全不必耐心的看完後面所有的內容,因為結論無非以下一句話:

互聯網上鏈結就是一切:來自其他網站直接靜態鏈結是唯一對提升自身站點PageRank有長期作用的廣告形式

互聯網廣告業的發展歷程回顧
DoubleClick對NetGravity的收購標誌著傳統門戶網站面向“注意力經濟”的廣告模式已經發展的相當成熟了。當時的互聯網廣告的優勢在於很強目標性投放和來自第3方的客觀統計,但由於來自用戶流覽器資訊的局限性,廣告投放要達到很高的目標性而且不影響投放效率的話,其投放成本也是非常高的,可以想像一下一個針對流覽者所在的地區(北京,上海)進行的廣告投放的難度:投放系統需要在幾十毫秒內針對流覽器的IP資訊映射出用戶所在的地區,並從幾百個正在運行的廣告中找到相應的內容進行投放。

同樣的,由於來自用戶流覽器的資訊的貧乏,統計結果對於大多數客戶來說除了投放總量控制外幾乎沒有更多的意義。而廣告客戶自身往往缺乏對其進行深度加工的知識和工具從而忽略了對投放統計的深度分析。之後的發展趨勢大家也能感受的到:廣告幅面越來越大,位置越來越扎眼,下載速度越來越慢……,可以說傳統互聯網廣告模式已經陷入了廣告形式越來越“霸道”,但廣告點擊率越來越低的惡性循環。畢竟廣告幅面的增加和廣告位的增加都是有盡頭的。

點擊率的不斷下降也促使廣告客戶在考慮:與其為10萬個根本不關心我產品的用戶花錢,不如為100個真正有需求的用戶花錢。搜索引擎的關鍵字無疑比用戶的流覽器更直接的表達了用戶的需求。以至於隨後出現的以Oventure為代表的搜索引擎結果排名模式,以其更高的針對性投放機制和簡潔的形式立刻成為整個互聯網廣告行業中的亮點。

而最近Yahoo!對Inktomi的收購,Overture對AltaVista的收購都說明傳統門戶日益感受到來自Google等新一代搜索引擎門戶的威脅。而且從近2年Google的在用戶使用的搜索引擎排名中的上升速度來看,2003年Google的用戶將超過Yahoo!幾乎是必然的。

因為如果最終用戶越來越多的通過搜速引擎來主動尋找資訊的話,那麼對於大量急需推廣自身的中小網站來說除了自身的UI設計要用戶友好(User Friendly)外,對搜索引擎友好度(Spider friendly)也是一個必須考慮的問題。隨著越來越多的廣告客戶重視自身站點在大型搜索引擎中的排名,只要看一下各個門戶網站的新聞頁面的源代碼就可以知道:大部分門戶網站的廣告其實是通過DoubleClick的廣告投放系統進行的,其內容是一小段在流覽器用戶端運行的javascript腳本,而其中的javascript腳本及其運行後所顯示出來的文字等是不可能被搜索引擎的Spider識別並收錄到索引中的。而且大部分廣告的鏈結都是要先經過統計系統然後才轉向到客戶頁面,因此這種通過動態發佈/統計的廣告其實對廣告客戶自身站點在所有搜索引擎中的排名提升沒有任何意義,如果搜索引擎的內容提取做的好的話,甚至頁頭頁尾部分內容都根本不會進入到索引裏,真正能夠進入搜索引擎索引的只是新聞內容本身的部分。

反過來說:作為大型門戶網站本身也應該意識到自己網站內容本身對Google的排名演算法的極大影響力,如果對這種影響力加以充分的利用也許有可能成為一種很重要的廣告資源。對於中小網站來說短時間內能大大提高自身站點在搜索引擎中排名的無疑是來自高PageRank的門戶站點並且能被搜索引擎識別的直接鏈結。而門戶站點目前所擁有的正是這些高PageRank,然而同時又大量浪費著廣告投放資源而且廣告投放率低下的內容頁面(包括舊有的)。

如果中小廣告客戶認可:到被大型門戶站點高PageRank的頁面“直接鏈結”本身帶來的搜索引擎排名提升的價值遠比短期的用戶點擊統計有價值的多。那麼基於靜態鏈結的Link Farm式廣告就可以徹底放棄以前的廣告模式中需要大量資源進行的面向用戶流覽的動態發佈和面向點擊統計的動態轉向統計。

以下提出的基於鏈結工廠(Link Farm)的廣告模式也許才是一個能夠充分利用門戶網站的資源優勢的模式:
回歸最原始的靜態鏈結形式廣告,門戶站點利用自身擁有的大量高PageRank的頁面成為製造鏈結的工廠(Link Farm),間接幫助廣告客戶自身網站迅速提高在所有搜索引擎中的排名。而搜索引擎網站反過來向門戶網站要求

大型門戶網站和中小網站在“面向用戶的注意力”方面有的只是量的優勢,但在“面向搜索引擎的注意力”方面則同時擁有質和量的優勢:

在搜索引擎中大型門戶網站的頁面PageRank非常高:可能隨便一篇文章頁面的PageRank就高達3,這個值已經超過多很多中小型網站首頁的PageRank值。
擁有更高的索引更新頻率:如果Google對一般站點的索引更新週期是3個星期左右,那麼對門戶站點就是是每5天,甚至對門戶首頁甚至是每天更新。
內容管理優勢:目前大部分搜索引擎對動態網頁是不索引或者少量索引的。和中小網站內容大部分使用動態網頁發佈不同,大部分大型門戶網站的頁面都是通過發佈系統生成的靜態頁面,並有長期的存儲,非常適合搜索引擎抓取,
成本降低:充分利用原先廣告投放率及其低的內容頁面:考慮到目前大部分門戶網站在底層內容頁面上的廣告投放率遠遠低於5%,卻佔用了帶寬和管理成本的60%以上。而且鏈結工廠模式不是面向統計的:可以脫離目前成本極高的第3方動態廣告投放量體系,大大降低了門戶網站的廣告運營成本。
從廣告客戶角度:無論從那個角度來說,DoubleClick的統計都是雞肋

大投放量的首頁客戶:比如汽車,手機等是否真的很看重可憐的千分之5的點擊率,而門戶網站為了這千分之5的點擊率,犧牲的是99.5%用戶的下載速度。
中小投放量的廣告客戶是否認可在搜索引擎中長期的排名提升比短期的廣告統計更有價值,客戶是否願意犧牲在門戶站點的低點擊率統計,換取在搜索引擎中結果中長期的排名提升。即中小廣告客戶是否真的相信“Google就是上帝”。

從最終用戶角度最直接的感受:
早在2001的統就就顯示:“比起富媒體(RichMedia),消費者更鍾情顯示速度快的網站”。如果門戶網站不想浪費帶寬資源,圖片廣告應該減少,同時由於靜態文字鏈結廣告可以作為內容的一部分直接包含在頁面中,也減少了對伺服器的請求次數,純文本鏈結的形式會增加將大大提高用戶的下載速度。

從搜索引擎服務商角度:
畢竟以上所有的依據都是搜索引擎的排名演算法策略,門戶會更加依賴於搜索引擎的權威性,而且搜索引擎服務商甚至可以據此要求門戶網站為自己的索引服務“競價”:比如增加索引更新頻率,增大站點的索引範圍等,以間接增加網頁在結果中的出現幾率和範圍,在國外稱之為付費索引服務:Paid Inclusion Service。

此外,門戶網站和搜索引擎服務商對用戶搜索關鍵字的日誌也是一種非常有潛力的資源。比如對汽車經銷商來說,也許能從搜索引擎的關鍵字歷史統計中得到最近一段時間各種品牌車型的用戶查詢數,如果得到完整的WEB日誌,甚至可以利用資料倉庫工具對日誌進行多維的分析挖掘,從而提前數月知道某種車型的銷售潛力等。進一步的甚至可以通過日誌中的IP位址得到消費者的地域分佈等。這種分析對於面向最終消費的商業用戶將非常有吸引力。(原文)

 
 給當前日誌評分:
Loading Vote
正在讀取評分資料...


文章來自: Tank部落格
引用通告: 查看所有引用 | 我要引用此文章
Tags:
相關日誌:

評論: 0 | 引用: 0 | 查看次數: -
發表評論
暱 稱:
密 碼: 遊客發言不需要密碼.
內 容:
驗證碼: 驗證碼
選 項:
雖然發表評論不用註冊,但是為了保護您的發言權,建議您註冊帳號.