ALEXA中国网站排名真相调查[内幕调查:出卖Alexa]
??? 在Google上搜索“Alexa”,簡體中文的結果有7萬多條。現在,“Alexa排名”已經是國內網站的站長們嘴邊最常掛的單詞。那么,這個Alexa是干嘛的?它?憑什么令國內網站側目?Alexa有哪些鮮為人知的秘密?本報記者通過深入調查和采訪,努力為讀者還原一個真實的Alexa,其中很多信息是首次在媒體上披露。
????出賣Alexa
??? 寫下這個題目,記者還怕有欠妥之處,仔細回想連日來的調查采訪,給記者設置迷障的網站,向記者提供幫助的朋友,還有記者自己,都對Alexa投入了極大熱情,從某種意義上說,我們也是在共同“出賣Alexa”。
??? 前些天,北京某周刊剛發布了“中國商業網站100強”排行榜,當然,這個排行榜本身就少不了“商業”的味道,但其中對某些網站做介紹時,該媒體竟然又引用了另一個排名數據來說明這些網站的價值,這個被“中國商業網站100強”排行榜引用的排名就是“世界著名的第三方測評機構——美國Alexa”的全球網站排名。當然,該媒體對這個Alexa排名的引用,無非是為了說明其“中國商業網站100強”排名的權威性。而以另一個“權威”來樹立自己的“權威”,恰恰說明了該媒體對另一個“權威”——Alexa排名的認可。
????Alexa是誰?
??? 1996年4月,Alexa在美國創立,那時它只是一個小網站,主要做分類導航。在那時候,很多網站都是雅虎的Fans,Alexa只是眾多跟風者中的一員罷了。但Alexa自己也有一些技術,就是對訪問某個Web站點的流量進行統計和分析。后來,Alexa還向網民提供自己開發的搜索引擎服務。
??? 1997年7月,Alexa發布了一款軟件,就是現在著名的Alexa Toolbar(Alexa工具條),這是一個嵌入到微軟IE瀏覽器中的工具,它在用戶訪問每個Web頁面時都向Alexa發回一串代碼,將該次瀏覽的相關信息告訴Alexa。而用戶會在該工具條上看到其瀏覽的網站在全球所有網站中的排名信息,當然,這只是Alexa給出的網站排名。
??? 1999年,Alexa被美國電子商務旗艦企業“亞馬遜”收購,成為后者的全資子公司。
??? 2002年春,Alexa放棄了自己的搜索引擎,轉而與Google合作。Google遍及全球的Web爬行程序構造了一個巨大的頁面信息數據庫,這極大地豐富了Alexa自身的URL網址數據庫。同時,Alexa也偷偷地放出了自己的爬行程序,在互聯網上搜尋未知的網址。經過多年積累,Alexa的URL網址庫已存儲了400億網址信息,超過了Google等搜索引擎,成為互聯網上最全的網址信息數據庫。Alexa數據庫的每日平均增量高達1TB,每兩個月就能對數據庫進行一次全面更新。
??? 現在,Alexa工具條在全球的“裝機量”早已上千萬,而Alexa主要的工作就是基于遍及全球電腦用戶桌面的工具條返回的信息,對全球網民的瀏覽習慣進行監測,并開發和銷售各種相關產品。其中,有最長達10萬個網址的全球網站排行榜,有針對某些特定行業網站的排行分析,有針對個別網站定制的網站流量監測報告。Alexa還提供了很多免費的基本信息,比如“全球網站500強”,還有“簡體中文網站100強”,網民們可以在Alexa上單獨查看關于某個網站的排名歷史變化圖,甚至還能同時對最多5個網站的流量及排名等數據進行直觀的橫向對比。
??? 盡管Alexa在其網站上提供了非常多有價值的信息,但其真正賴以成名的還是那個被四處引用并被媒體多次炒作過且引發了巨大爭議的全球網站排名。按照Alexa網站上的“官方聲明”,Alexa公開的那份全球網站總排名是通過收集所有Alexa工具條返回的信息,經過計算得出的綜合排名。從這份“官方聲明”中,我們不難看出,影響Alexa排名的因素是兩個,一是Alexa采集的信息,二是Alexa對這些信息進行深加工的計算方法。
??? 在Alexa網站上,人們可以針對某個特定網址去查詢其所屬的網站的訪問人數,Alexa提供了一個叫做Reach per million users(每百萬用戶訪問人次,簡稱Reach)的數據來表示訪問人數,這個數據指的是每一百萬個Alexa工具條用戶中每天訪問某一網站的平均人數。比如,2004年11月3日,google.com的Reach值為178,500,就是說,這一天里,每一百萬個Alexa工具條用戶中就有近18萬人訪問過google.com。
??? 僅有訪問人數,還不足以反映一個網站被網民瀏覽的情況,Alexa還提供了另一個數據來反映到訪的網民對特定網站的使用率,這就是PageViews per user(每用戶瀏覽頁面數,簡稱PV)。某網站的PV值是每天所有訪問該網站的Alexa工具條用戶在該網站上瀏覽的總頁面數的平均值,而同一人對相同頁面的重復瀏覽在每天只計作一次。還以2004年11月3日google.com的訪問數據為例,這一天,google.com的PV值是4.0,也就是說,來訪的網民們平均在google.com網站上瀏覽了4個頁面。
??? 有了Reach和PV這兩個數據,Alexa就可以給全球網站按綜合流量進行排名了,它把網站的這個排名稱作Traffic Rank(流量排名,簡稱Rank),據Alexa在其網站上的解釋,決定這個Rank的就是Reach和PV的幾何平均數,也就是兩者乘積的平方根。顯然,一個網站的Reach和PV值越高,其Rank也越高。仍以google.com為例,其4.0的PV值在一般的網站來說并不算高,但是,由于Google搜索引擎的用戶非常多,其Reach值遠高于一般的網站,就使得google.com的Rank達到3,也就是說,google.com當天的全球排名是第三位。而全球排名最高的網站是yahoo.com,其Reach和PV值在全球網站中都是相對很高的。
????利用與懷疑
??? 每時每刻,全球每個安裝了Alexa工具條的計算機終端都會向Alexa匯報該終端在互聯網上的訪問情況。根據這些信息,Alexa每天都會對全球網站的排名做重新計算,也就是說,Alexa排名是每日更新的。因為幾乎全球所有的網站都在Alexa的監測范圍內,而這個每日更新的排行榜又顯得過于直觀,加之又是公開的隨時可查的數據,就使得Alexa排名在很多場合都顯得很敏感。
??? 自2003年以來,國內互聯網行業開始全面升溫,曾經被資本們無情甩掉的網站CEO們又找回了昔日的感覺,但風險投資家們確實比上一次.COM泡沫時期精明了許多,網站要吸引投資,必須首先打消資本的顧慮,就算是已經上了市的網站,也需要給股東們一些明確的數據來表明自身的價值。就在這時,Alexa排名被介紹到了國內,雖然這個網站以前從未引起大家的注意,但是它提供的這個排行榜卻很快顯示出巨大的商業價值。
??? 一些網站在向投資人遞交商業計劃書的同時,開始有意無意地提一下自己的Alexa排名,按照某種大家默認的邏輯,排在全球300名的網站總是比排在全球1000名以外的網站更有價值。終于,在“圈內人”的口口相傳中,Alexa排名在中國互聯網上名聲大噪,而此時,遠在大洋彼岸的Alexa卻對它的中國Fans們一無所知。
??? 當Alexa排名開始得到業界的普遍認可時,終于有人開始利用Alexa排名來創造“價值”了。大批個人網站的站長們開始研究Alexa的排名規則,網上開始流傳各種針對Alexa的作弊工具,很多網站上開始刊登介紹Alexa作弊方法的文章,各種論壇里開始出現對Alexa排名的討論。一時間,中國互聯網業界刮起了“Alexa旋風”。
??? 在2003年底,針對這股Alexa熱,一些業內人士又開始質疑Alexa排名的可信度,并揭發出很多網站作弊的“內幕”。事實上,有相當多網民都對Alexa的排名表示過懷疑,因為在2003年的大部分時間里,Alexa排名上的全球第三和第四的網站是兩個韓國網站,Alexa對此的解釋是,韓國的互聯網用戶中安裝Alexa工具條的比例較高,因此Alexa在韓國網民中得到的采樣數據比較高,這就導致韓國的兩家門戶網站進入了全球前五名。
??? 不過,Alexa的解釋似乎越描越黑,因為Alexa工具條始終只有英文版,既沒有中文版,更沒有韓文版,如果要說工具條的普及率高,歐美國家應該首當其沖。有網友據此認為,韓國網站是靠作弊提升了網站排名,更有人認為,既然Alexa根本沒有向亞洲國家推出本地化版本的工具條,亞洲國家就應該堅決抵制Alexa排名。
??? 無論如何,從追捧到棒殺,業界對Alexa的關注一點兒都沒減。進入2004年以來,照樣有很多網站的站長們在絞盡腦汁地想把自己網站的Alexa排名“做上去”,而以前揭露過Alexa的炮手們也同樣繼續懷揣各種目的炮轟著Alexa。
??? 今年十一長假過后,國內網站在Alexa上的排名突然經歷了一次大規模集體滑坡,各種謠言開始在網民中流傳,一種比較流行的說法是,Alexa終于開始調整算法來反擊越來越多的中國作弊網站,人們把這看做是Alexa的“正當防衛”,畢竟,一個以排行榜為最大賣點的網站賴以生存的就是它的排名的公正性。
??? 各種傳言都無法解決看客們對Alexa可信度的疑惑,因為國內主流媒體從未針對Alexa的技術進行過深入的分析和報道,而在下面的介紹中,讀者可以看到,或許韓國網站排名過高另有原因,而所謂的Alexa作弊手段也不只是此前一些媒體報道的多次刷新那么簡單,而且,Alexa也有自己非常高明的防作弊手段。不過,本文中所提及的作弊手段與網上隨處可見的“作弊寶典”有本質的不同,所以,Alexa在多大程度上能抵御這種不常見的作弊方式也就很難說了。
????Alexa工具條的DNA
??? 要想徹底搞清楚Alexa排名是否可信,必須從技術上對Alexa的全球網站流量監測進行全面的解剖,當然,Alexa從來沒有公布自己的技術細節,記者決定“以彼之道,還施彼身”,既然Alexa聲稱其數據來源就是那個工具條,記者決定首先從破解工具條入手。
??? 受記者委托,圈內著名的Web技術專家小林,用了近一個晚上的時間,對Alexa工具條及其向Alexa返回的數據進行了細致的分析,得出了很多寶貴的第一手資料。多年前對Alexa就做過研究的小林認為,最近的這次分析揭示了一些Alexa更隱秘的技術細節。
??? 小林告訴記者,現在最新版本的Alexa工具條的運作機理與以往沒有太大的改變,每當用戶以裝有Alexa工具條的IE瀏覽器打開新頁面時,Alexa的一臺服務器(data.alexa.com)都會收到加密的數據包,這個數據包中的核心信息就是十幾個參數,這些參數包括當前網頁地址、頁面打開時間、用戶端顯示分辨率、Alexa工具條版本號、該用戶是否為“亞馬遜”的用戶等,其中有一個重要的隱含參數,經小林分析,認為是Alexa為每個已安裝的工具條自動生成的ID號碼,這個號碼應該是全球惟一的。Alexa可以通過這個ID對每個反饋數據包的發出者進行惟一標識,這是解決PV重復計算問題和防止同一用戶多次刷新作弊的一個重要手段。
??? 小林告訴記者,從目前研究的結果來看,任何一個匯編高手都可以很容易地掌握Alexa工具條返回的數據包中的秘密,如果這個人同時也是一個網絡編程高手,那么要針對Alexa作弊就比較容易了。從記者后來對一位上海的Alexa作弊高手的采訪來看,小林的分析完全正確。該作弊者正是一位資深的Web開發工程師,其采用的手段與小林的分析也基本吻合——編寫一個Alexa工具條返回碼生成器,批量產生Alexa能夠辨識的代碼串,然后用虛擬多用戶的方式發回data.alexa.com,這樣就可以欺騙Alexa的服務器,讓它誤以為這些數據是不同用戶發來的(征得該作弊者本人同意,本專題在最后公開了記者與該作弊者的網上聊天實錄)。
??? 小林認為,這種以編程方式模擬多用戶訪問的作弊方式的實現,最重要的環節就在于對那個Alexa用來惟一標識用戶身份的ID號的生成算法的破解,這需要對足夠多的Alexa工具條進行嗅探,抓取其數據包進行定量的算法分析。但小林同時也指出,這些工作對于一個編程高手來說,確實不算什么,只是最終作弊的實現仍需要模擬一個足夠快的ID號生成程序,這可能會比較困難,不過據小林估計,國內能做這些事情的人不在少數,只是互聯網這個圈子里的高手們很少去做罷了。
??? 從以上的技術分析來看,Alexa的服務器每天所做的工作就是不斷接收全球用戶傳回的數據包,提取其中的那十幾個參數并寫入專門的數據庫,然后在某個特定時間對當天收集到的這些數據進行分析計算,并以新的計算結果去更新當日的網站排名。據記者觀察,這個數據庫的分析結果至少會保存三年之久,因為在Alexa網站上對每個網站的Rank排名變化趨勢圖最多能提供三年來的數據變化。
??? 在破解了工具條的DNA之后,記者還與一些朋友探討了Alexa工具條在全球的分布情況。按照Alexa的說法,工具條是它惟一的信息獲取來源,那么工具條在全球用戶中的分布也就成了另一個可以影響Alexa排名的重要因素。如果工具條真的是Alexa數據的惟一來源,可以想象,當中國網民都沒有安裝Alexa工具條的時候,新浪搜狐這樣的門戶網站恐怕在Alexa排名中都見不到影子,可是今年下半年以來,新浪和搜狐就已經緊隨Google排在全球第四和第五的位置了,這似乎說明了Alexa工具條已經在中國具備了較高的普及率,否則,新浪、搜狐以及緊隨其后的占領了Alexa全球500強中近1/3份額的中國網站就都有作弊的嫌疑。
??? 幸好記者的一位朋友曹政提供了令人欣慰的數據。作為網站流量分析專家,曹政在www.tong123.com上為多達2000家國內各類網站提供長期的流量監測與統計分析服務。曹政的流量分析與Alexa的不同,Alexa不在被監測的網站上做任何事,而tong123.com對網站進行頁面內嵌方式的第三方流量統計。受記者委托,曹政臨時在其數據采樣分析器里加入了對Alexa工具條的監測。經過一周的數據統計,曹政得出的結論是:訪問www.tong123.com系統監測的2000家網站的所有用戶中,Alexa工具條的安裝率在1.5%左右。
??? 就在發稿前,曹政還給記者發來了對這一結果的補充說明,他認為,由于tong123的系統采用累計平均值的計算方法,Alexa工具條的實際安裝比例應該比現在得到的數據更高,因為這個監測項剛加進去不久。
??? 由于tong123.com的監測范圍是2000家各類網站,基本上排除了由于監測對象較少可能造成的用戶選擇傾向性,其可信度比較高。即使以1.5%這個被低估的安裝率來衡量Alexa在國內用戶中的影響,也已經十分驚人了,若國內互聯網用戶以總數9000萬計算,則其中安裝了Alexa工具條的用戶可能已超過130萬。按照Alexa聲稱的1000萬左右的工具條全球下載總量來看,中國網民對Alexa的熱衷似乎顯得更為突出,這或許也可以作為國內網站今年在Alexa排行榜中整體排名提高的一個解釋。
??? 既然工具條的分布會從很大程度上影響Alexa的監測結果,那么Alexa的排行榜就可能出現很大的地域相關性,如果確實如此,Alexa的權威性就真值得懷疑了。事情遠沒有這么簡單,在Alexa網站上,記者看到全球網站前10萬名排行榜的報價是499美元,顯然,在大洋彼岸,還是有人認可Alexa的排名數據,甚至會花錢去買那個排行數據。
????莫須有的技術隱私
??? 在Alexa各種公開的資料或是網友對它的討論中,都沒有人明確提出過Alexa除工具條以外是否還有其他能夠獲取公網流量的監測手段,而長期為多個著名網站提供技術支持的小林,通過對這些網站的日志分析,認為Alexa還有很多技術隱私。由于無法得到Alexa的官方回應,我們只好說這些可能被采用的技術手段是“莫須有”的。
??? 為了進一步探尋Alexa的隱私,我們還要先看看Web瀏覽的過程。當用戶打開IE瀏覽器,在地址欄中輸入一串網址并回車后,一些包含了http請求的數據包就被發送出去,與其他流量一樣,這些數據包也要經過用戶所在內網的網關,被路由到公網,經過一個個電信機房,最終傳送到某個提供DNS解析的服務器上,在獲得目的網址的IP地址后再被放到一個可以最終路由到目的IP的路徑上傳送過去。從http請求的發送過程來看,如果Alexa對全球所有的DNS解析服務器進行嗅探,將有可能得到一份非常接近事實的全球http請求數據,由此就可以非常清晰地勾勒出哪些網站被哪些用戶所關注。
??? 不過,要嗅探全球的http請求,對Alexa來說幾乎是天方夜譚。退一萬步,即使Alexa能抓取到這些數據,它也不可能有以這些數據為基礎進行計算的能力。但是,Alexa排名所顯示出的一些“抖動”跡象似乎在告訴人們,除工具條之外,Alexa確實有使用其他技術手段的嫌疑。
??? 2004年夏天,小林發現中國香港的網站排名出現異常的提升,像“太陽報”這樣的小網站,居然能超過很多內地大網站的排名。由于電信網關和簡繁體系統的原因,內地與香港網民一般是不做“跨地區互訪的”,而香港網民安裝Alexa工具條的絕對數也不會比內地用戶高。從前文的分析和計算來看,內地網民中Alexa工具條的安裝量恐怕比全香港網民的數量都不低,這樣的情況下,香港網站在Alexa排名的普遍大幅度提升就顯得毫無道理。
??? 經過兩個月的高排名期后,香港網站的排名開始逐漸回落,但至今仍有部分網站的排名高出其實際應處的名次。小林認為,這個現象與韓國網站在2003年出現的情況有很大相似性,而韓國的很多網站目前仍有偏高的排名。這種現象如果用Alexa工具條的普及率來解釋是不合情理的,但如果用Alexa增加了其他采樣機的說法來解釋,就很容易說得通。
??? 據小林推斷,Alexa可能在全球不同地方設置了一些采樣機,通過與一些電信機構進行或明或暗的合作,甚至在臨近電信網關的節點進行網絡嗅探,得到一些“彌補性”的采樣數據。而尋求這些采樣數據的目的恰恰是為了照顧Alexa所認為的“工具條低安裝率”地區的抽樣效果。打個比方,如果Alexa認為韓國互聯網已經非常普及,而韓國用戶卻一直沒有安裝Alexa工具條的習慣,它就可能會設法在韓國安插一些采樣機,以彌補在韓國用工具條采樣的不足。同樣的情況,也可能導致香港在剛剛設置采樣機時網站排名的猛增。而經過一段時間的考察,Alexa就會逐步調整在每個地區的采樣數量,以得到它所認為的最合理的結果。
??? 甚至小林還認為,今年內地網站排名的大規模提升也有采樣機在作怪,而國慶后內地網站排名的普遍下降也許就是因為Alexa在經過一年的考察后,重新調整了在中國內地采樣比重的結果。
??? 當然,Alexa要維護其排名的權威性和公正性,不僅要完善流量數據的采樣過程,更要在防止作弊方面做出巨大努力,那些防作弊的技術也都是Alexa的不宣之秘。那么Alexa到底是用什么辦法來防止作弊呢?事實上,對于前文中記者提到的以編程模擬Alexa工具條返回數據包的作弊方式,Alexa幾乎沒什么好辦法去防范,甚至要探測到這樣的作弊手段都比較難。
??? 其實,對于現在網上常見的作弊手段,Alexa都已經有了足夠的免疫力。一般來說,由于現在多數搜索引擎都無法處理JS腳本,所以針對搜索引擎的作弊往往都是用JS腳本編寫惡意代碼來實現,而Alexa和Google采用的爬行程序則是目前僅有的可識別JS腳本的此類程序。
??? 小林在對幾個大型網站的流量監測中發現,Alexa啟用了一個叫做IA_Archiver的機器人程序,這個機器人程序類似Google等搜索引擎使用的蜘蛛程序,專門在互聯網上爬行,刺探每個Web頁面的流量信息。尤其是當某個網站的流量超過Alexa設定的閾值時,IA_Archiver就會馬上爬到該網站的服務器上,分析此網站的流量是否正常,有沒有作弊行為。據小林對IA_Archiver的監測,該機器人程序已經可以識別大部分基于網站服務器端的流量作弊行為。但現在業內對IA_Archiver的認知普遍不足,記者也只是在Alexa網站的一個幫助頁面上看到有關IA_Archiver機器人程序的簡單介紹,而國內知道這個機器人程序的人不多,更缺乏相關的技術研究。
????信任Alexa?
??? 針對Alexa排名的可信度,不同的人有不同的看法,從事Web技術研究與應用的業內人士多傾向于這樣一個說法:Alexa排名不一定是絕對準確的,但卻是相對可信的。下面記者舉出的一些例子,將從不同方面對Alexa排名的可信度進行對比。
??? 必須承認,盡管Alexa用很多技術手段提高了網站流量監測數據的有效性,但由于其固有的一些技術上的瑕疵,難免使少數網站的排名結果出現一些問題,盡管這些問題在很大程度上要歸咎于網站域名結構的不合理性。
??? 比如,Alexa排名是針對URL地址的,并沒有考慮IP地址的因素,這在很大程度上降低了Alexa排名計算的難度,但是也不可避免地產生了偏差。一般而言,Alexa只對二級域名感興趣,而針對三級域名的流量都被納入了上一級域名的統計,對于比較規范的大型網站而言,這是完全正確的策略,但是對于一個向不同用戶分發了三級域名的網站來說,它的流量統計是否應該將所有的子用戶的流量加起來呢?這顯然要因情況而異,一個很明顯的此類不合理統計的例子就是cninfo.net,相信國內老網民都還記得這個域名后綴,這是全國各省市公眾信息港通用的二級域名,比如,sh.cninfo.net和gd.cninfo.net分別是上海和廣東的兩個網站,而Alexa則將其統一算做www.cninfo.net的子域。于是,www.cninfo.net就成了簡體中文網站排名第40多位的網站,盡管它其實根本就不是一個可以訪問的網站。
??? 對于Alexa排名可信度的另一種質疑來自不同類型網站的流量特征的巨大差異性。比如,門戶網站與專業網站或專業論壇的流量就幾乎沒有可比性,因為不同類型的用戶在不同時間不同場合訪問不同類型的網站時,其瀏覽習慣會有極大的差異。
??? 即使兩個網站按照Alexa算法得出的綜合流量評估值完全相同,那也不能把兩個網站的影響力劃等號。比如,一個Reach值為1000,PV值為1的網站與一個Reach值為100,PV值為10的網站的Rank應該是相同的,但大部分情況下,后者的內容會比前者更有價值。因為瀏覽前一個網站的用戶都是只看了一個頁面就走掉了,說明該網站可能沒什么吸引力;而后一個網站的用戶平均要看十個頁面才會離開,這些用戶都很認可該網站的內容。當然,更極端的情況也會出現,比如前者只有一個頁面,但該頁面內容非常豐富,而后者的每個頁面內容都很少,或是給用戶設置了很多不必要的跳轉,甚至后者也可能就是一個小說連載站。
??? 這些復雜情況的存在讓人很難相信Alexa可以只用Reach和PV這兩個值就把所有互聯網上的站點劃分出三六九等。不過,如果我們換一個角度來看Alexa,就會發現它的存在也是有理由的,甚至也可能是確實值得網民信賴的。
??? 如果我們只把Alexa當做一個流量分析服務工具,它的價值就凸現出來了。Alexa網站上提供了非常直觀的流量變化趨勢統計圖功能,這在其他很多情況下是要付費才能獲得的服務,而Alexa只是將其作為免費的公眾服務。
圖1
??? 圖1是Alexa上提供的計世網(ccw.com.cn)一年來的流量排名(Rank)走勢圖,從圖上可以清晰地看出,該網站2003年11月3日~2004年11月3日的排名從7500名左右上升到2000名以內,而其中三次非常突然的下降曲線所對應的日期分別是春節、五一、十一這三次長假。眾所周知,計世網的用戶主要集中在IT行業中,這三次長假導致的下降曲線非常忠實地記錄下當時的網民瀏覽情況——因為放假,大多數用戶去旅游或在家休息,上網用戶大大減少,所以流量降低,網站的排名也隨之降低。而長假過后,IT人回到單位,頭一天上班總會想到網上去看看業界的最新資訊。所以長假之后,ccw.com.cn的流量反而都比放假前有不同程度的提升,反映在Rank曲線上,就是三個大的波谷之后曲線高度的恢復與持續攀升。
圖2
圖3
??? 事實上,如果能夠詳細分析網站流量變化的趨勢,人們也可以分辨出那些作弊的網站,因為作弊網站流量的變化往往是非正常的,其與正常網站的流量變化曲線肯定有不同之處。圖2和圖3分別是265.com和dsdiy.com的半年來的流量排名趨勢變化圖,265.com是國內著名的網址導航站,最近半年的全球排名一直穩定在70~120名以內。反觀dsdiy.com的Rank變化曲線就頗值得懷疑,9月的第一周,該網站的排名就從全球10萬名之外一躍至200名左右,其后的一個月內,該網站的排名一直在100~400名之間徘徊,而就在國慶長假的第一天,該網站的排名竟然躥升至30名左右,到了10月的第二周,該網站的排名又迅速回落至10萬名開外,在Rank曲線圖上再也看不到了,擁有類似排名曲線的網站還有sinapet.com和haohz.com等等。
??? 作為Web訪問情況的監測工具,Alexa在記錄了網站的真實訪問量的同時,也同樣記錄了那些作弊網站的流量變化情況。從這個意義上說,Alexa顯然也是可信的,關鍵是我們選擇的視角必須能恰到好處地發揮Alexa的作用。
??? 無論出于什么樣的目的,人們出賣Alexa總是希望能從中得到利益,對Alexa的研究越深入,對Alexa的價值理解得越深刻,就越能從中獲益。
附文:
????點對點采訪:Alexa排名高手
??? 通過MSN Messager,《計算機世界》記者王翌(cciewang@msn.com)在線采訪了國內一位頂尖的Alexa網站排名高手(alexa_improve@hotmail.com),經對方同意,特刊出雙方在網上的對話實錄(A=alexa_improve@hotmail.com):
??? 作弊業務收入高 百強排名值萬金
??? 王翌:聽說你能做Alexa排名?可以做到100名左右?
??? A:當然,更高也可以,100名左右的話,每月要兩萬塊甚至更多。
??? 王翌:你知道的像你這樣的同行,國內有多少家?
??? A:我知道的就只有兩家,都是重慶人做的。
??? 王翌:你搞Alexa排名是專職還是副業?
??? A:當然是副業。但現在做這個業務賺得比我工資高多了。
??? 王翌:你們現在是幾個人做?
??? A:核心是我一個,還有幾個朋友幫忙,我們從2002年就會這個了。
??? 王翌:你有沒有試過,能做到的最好成績是怎么樣的?
??? A:現在我可以把一個沒流量的網站維持在大概50名左右,這是極限。不過一般我們不會亂來。而且也沒有人出那么高的價來雇我們做那么高,我們是根據排名高低來收費的。
??? 王翌:維護這些網站的排名是不是會越來越容易?因為把他們做上去以后,流量真的能增加?
??? A:客戶一般都是廣告和我們一起做。
??? 王翌:你的意思是他們在拉高排名的同時,也做網站推廣?還是說他們自己拿排名去拉廣告?
??? A:是前者,做網站的人都知道,光有一個假的排名沒意思??蛻舻男膽B其實很簡單,他們做了廣告,真實人氣會上去,但不一定排名會上去。
??? 王翌:所以,Alexa只是提升品牌的另一種方式?
??? A:他們大筆錢花在廣告上,少筆錢花在我們身上,這樣兩頭并進,等流量真的上來一些,排名也做上去了,他們再去接廣告就容易了。廣告商一看,排名不錯,就投上來試試,這樣他們自己的流量又確實不會太難看,廣告商更容易認可。
??? 編程破解工具條 排名多少全可控
??? 王翌:Alexa工具條的工作機理你應該很清楚了吧?我昨天在一個朋友那里看了破解的代碼,它是每次在用戶瀏覽時都返回一串代碼,這些代碼中大概有9~10個參數,包括網址、瀏覽方式什么的,甚至網速都能監測到了。你了解的情況是這樣嗎?
??? A:差不多就是這樣,但那個不是網速,是加載頁面的時間。比如同樣一個頁面,你在本地訪問,就是very fast,你在國外訪問,就是slow,所以我覺得Alexa給出的Speed這一項是不公平的。
??? 王翌:能具體談談你們采用的方法么?據我所知,Alexa排名的兩個基本參數,也就是Reach和PV,針對它們都是可以作弊的,但實現的方式不同,另外Alexa也有一些防作弊的手段,你們是怎么搞定的?
??? A:寫程序。
??? 王翌:破解Alexa工具條?
??? A:對,我們的機器上都不裝Alexa工具條,這玩意兒又慢又內存泄漏,煩死了。我們是在FreeBSD下用C語言寫的模擬器,可以同時影響Reach和PV兩個值。
??? 王翌:這個模擬器是不是就在一臺機器上模擬多人同時在線去訪問網站?
??? A:可以這么說。破解了它的算法,就可以模擬成很多人了。
??? 王翌:你們做的一臺機器能模擬成多少人訪問?如果要把一個網站從無到有的做到100名,需要動用多少資源?多少時間?
??? A:恕不奉告,反正就是模擬多人訪問。
??? 王翌:你有沒有拿網站做一些試驗?
??? A:肯定要做試驗啊,比如dsdiy.com就是我做過的一個,你可以看看Alexa上這個網站的Rank圖。那個站長同意我拿它來給客戶做演示的,否則我也不會告訴你,我們這行也要講信譽的,不能隨便透露客戶信息,我也只能告訴你這一個。
??? 王翌:這種虛擬多用戶訪問的方式是不是很占內存啊?
??? A:還好,主要是耗費CPU的資源,不過FreeBSD夠強勁,要是在Windows下可就累了。
??? 王翌:是不是主要靠CPU計算出大量的偽裝Alexa返回代碼,然后只要有足夠帶寬給送回去就可以了?
??? A:對,但帶寬不是問題,至少在我這兒還沒成為過問題,說白了最重要的還是模擬器的算法實現。
??? 王翌:我從朋友那里看到的好像每個代碼串也就百十來個字節吧?
??? A:對啊,所以說帶寬不是問題。CPU其實一般的也就行了,別太差,以線程方式跑。有兩三家客戶直接找我談過買下技術的事情,不過價格太低我沒同意,他們也太小看這技術和它的含金量了。
??? 王翌:你既然跟蹤了Alexa兩年,工具條返回的這串代碼的算法規則,Alexa有過變動么?
??? A:只有過很小的變動。
??? 王翌:今年10月份是不是有過一次變動?好像國內網站普遍受到波及了。
??? A:它修改了兩個參數的權重,增加了PageView的權重。所以那些純粹靠打廣告來拉流量,但本身又留不住用戶的網站就吃虧了,這樣的網站雖然流量可能有提高,但是PageView不高,被廣告吸引過來的用戶看一眼感覺沒意思,可能馬上就跳轉到別的網站了。
??? 王翌:那么你知道Alexa排名的完整的算法公式么?
??? A:具體怎么算,只有Alexa知道,但是它肯定希望這個算法是合理的,所以它也會根據一些常見的作弊手段來調整它的算法,但是我們用的這種辦法是直接破解工具條,除非它放棄現在的工具條技術,否則還是拿我們沒辦法。
??? 王翌:除了工具條,Alexa排名還有沒有其他的依據?
??? A:現在人們知道的就是工具條,Alexa好像也沒說過還有別的辦法,所以只能是抽樣數據。經常有人說,我們的網站獨立IP上升了那么多,為什么排名反而下跌啊?我就告訴他們,有兩個原因:1、獨立IP多并不代表裝了Alexa工具條的訪問用戶增多了;2、就算你的多了,別人的說不定更多了,排名是互相比較出來的。
??? 作弊也有原則性 吃水不能忘掘井
??? 王翌:你們現在接了多少客戶?
??? A:我們一般不會亂做的,現在還在做的也不超過5個,很謹慎的,但是找我們的人始終非常多。
??? 王翌:都是要求做到100名左右?
??? A:也不是,也有只要求到2000多名的,這樣的客戶很理智。
??? 王翌:選擇這些客戶的原則是什么?是有錢就行么?
??? A:不是,有些小網站,一來就要我們給它做到100名,這種我們不接。
??? 王翌:要求太高的你們不接?
??? A:不是要求太高,我要想做也可以做到,但說句實話,我們是Alexa的寄生蟲,也不愿意一下把自己的“宿主”給搞死了。
??? 王翌:也要講策略?
??? A:是的,上次有個客戶就被我氣壞了。呵呵,一個MM,我當時一下說得太直了,說垃圾網站要那么高排名干嘛,她就生氣了。
??? 王翌:是不是可以這樣說,網上現在有5個網站的Alexa排名是你們在維護著,并且都在100名以下?
??? A:是,出得起100名價格的網站很少,基本上我做的就是300~1000名左右。
??? 王翌:300名的價格是多少?
??? A:視網站而定,一般都要上萬。如果說標的是300名,那其實就是300~400名浮動。
??? 王翌:這個價格對于一些小網站也就不低了。
??? A:小網站憑什么到全球300名?
??? 王翌:找你的全都是大網站?
??? A:至少是有資格的吧。有些小網站只要求到1萬名左右,這種業務我們又懶得接,不值得做。
??? 王翌:你對他們的要求是什么呢?
??? A:就是至少這網站還像個樣子,而且出得起這錢。也有個客戶只做了一個月,因為服務器被黑客攻擊了一陣,排名跌得很慘,就找我來幫他們做一個月,把損失挽救回來。
??? 王翌:但是你們一個月后不做了,它豈不是又掉回去很多?
??? A:不,那個網站因為還是有很好的用戶基礎,流量也一直在慢慢回升。他們只是需要我把他們損失的季度平均排名挽救回來。所以我每天都需要給他們改力度,用漸變的方式,這樣別人也不容易看出來是有人在幫他們作弊。
??? 王翌:你們的方式可以想怎么上去就怎么上去,甚至能控制節奏,是么?
??? A:是的,以前不能,后來改進了,因為客戶的要求也在不斷提高嘛。
??? 王翌:是不是這樣,那個月的開始你起的作用比較大,以后逐漸減少你的作用,而那個網站自身恢復的流量開始逐漸起作用,到了月底,即使你不做,他們網站自身的流量也基本恢復得差不多了?
??? A:對,這樣的話,那個網站在Alexa上的Rank曲線在這個月就比較平緩,不知情的人根本看不出來,只能看出他們被攻擊的那幾天排名驟降,然后就馬上恢復了,其實那個恢復的過程長達一個月。我的作用就是讓那個網站的季度總平均排名不受影響。這種有實力的網站,我就是不做,一個月后還是能恢復過來的,只是由于這一個月的排名都比較低,會導致連續三個月的季度總平均排名不好看。
??? 王翌:這種有實力的網站也很在乎Alexa排名么?
??? A:非常在乎啊。
??? 王翌:為什么?
??? A:我舉個例子,你辦個網站,跟廣告商說,我的網站花好稻好,人家去Alexa上一查,原來你的網站排名那么低,誰還信你啊?
??? 王翌:不過Alexa的工具條在國內用戶里裝的確實不多啊,這樣對國內網站似乎很不利吧。
??? A:現在已經多起來了,信不信由你。我在2002年就掌握這技術了,但也是今年才開始開展這種業務的,因為Alexa是近期才開始在國內受到重視。
??? 王翌:你所知道的國內網站作弊的多么?
??? A:找我的人很多,國內很多網站都在干這種事,但作弊的手法都不高,懂這個的人從Alexa的歷史曲線圖中都能分析出來。
????怎樣出賣Alexa?
??? 王翌
??? 親愛的網站CEO們,大家好!今天這節課,我要講的是,我們該如何出賣Alexa。
??? 出賣Alexa的辦法有很多,像我這樣花一周時間研究它,然后再用一個周末的時間寫一份萬言書,待報紙出版后等著看轉載率,最后只賺點兒精神安慰獎的老土,顯然還達不到出賣Alexa的目的。
??? 但比我高明的人有的是!尤其在互聯網上,你無法知道同桌的這位網站CEO以前是不是一條狗,還好,自從有了Alexa,你們的很多同行都名利雙收了。
??? 言歸正傳,下面要發布的是王老師跋山涉水翻山越嶺研究了無數作弊網站之后才總結出的一點點寶貴經驗,也不知能否賣點兒版權費。不過為了我們這個學校的點擊量,也只好先忍著了!等咱的網站進了Alexa全球TOP10,騙到投資人的美元,再慢慢收拾這群盜版的家伙吧!
??? 長達兩年的觀察與分析之后,我認為,要出賣Alexa,只要按順序完成以下三個步驟就可以了。
??? 第一步,你要先成為Alexa的朋友?;蛘哒f,你必須讓Alexa成為你的朋友,同時在表面上你自己也得表現得像是Alexa的朋友。然后,已經成為朋友的你和Alexa必須建立相互間的信任。當然,讓自己信任Alexa要遠比讓Alexa信任你要容易得多,偶爾做一下心理暗示就行,下面請大家跟我一起在心里默念:“Alexa!Alexa!Alexa……”
??? 讓Alexa對你產生信任確實有點麻煩,但是我經過詳細的研究,還是找到了一條可信而可行的辦法。當你希望另一個人信任你,而你又根本無法引起對方注意的時候,只有一個辦法,就是建立一個信任傳遞的渠道。說白了,就是找到一個第三方,這個第三方是信任你的人,也是Alexa信任的人。用這種方式,就可以間接取得Alexa的信任了。
??? 對這一點的運用,網站聯盟們都是高手,本來誰也不認識你,突然有一天,你被引入一個圈子,里面的人互相都認識,你只要認識其中一個人就夠了,在你加入這個圈子之后,很快就可以取得里面所有人的信任。這聽起來有點兒像黑幫,不過當你網站的流量因為加入這樣的聯盟而開始百米沖刺時,你就不會在乎這個圈子有多黑了。
??? 第二步,當你和Alexa取得互相的信任之后,就可以準備出賣Alexa了。注意!這只是準備階段,但這一步將直接決定你最終出賣Alexa所能獲得的利益!
??? 在這一步結束的時候,你需要看到的效果是,Alexa身價非常高,而它對你和你的朋友們的評價也要足夠高。說得直觀一點兒,就是你和你的朋友們應該成為Alexa的Fans兼代理人。如果你是有實力的網站,應該考慮使用速成手段,比如,在媒體上放風,四處吹捧Alexa,然后在恰當的時機暗示給媒體另一個信息:我的網站排名早就在TOP500了!檢驗這一步執行效果的最佳方式就是在Google的新聞搜索中同時查找Alexa和你網站的名字,這個結果越多,這一步完成得就越好。誰先完成這一步的部署,就有把握將Alexa給打包賣出去。
??? 好了,現在我們說說最后的關鍵一步,到底以什么方式出賣Alexa,這一步將充分考驗你作為網站CEO的執行能力,如果執行得好,你就能成為下一個丁磊,如果執行得差,你也只能成為互聯網上的一條狗,弄不好還是落水狗!
??? 為了更好地用理論聯系實際,下面我要采用案例教學法。先看看最成功的例子——“逃走網”,這家網站以前的價值大家心知肚明,但現在Alexa就認為它是國內C2C的老大。它的出賣手段比較高明,先找到一個總代理,這個總代理下面又有一群小網站代理,每個小代理的流量雖然都不高,但是總代卻曉得利用人海戰術,再加上中國搞計劃生育晚了10年,這個總代就很輕松地成了全球最大的流量代理商,價碼好高呢!幸虧逃走網背后還有個阿里爸爸,換了別人,還真掏不起那么多銀子!
??? 與逃走網相比,蛔蟲網就有點兒郁悶了,這家網站的COO好不容易想了個辦法,發動旗下幾千條蛔蟲同時出賣Alexa。可惜,這么多蛔蟲,難免就有對老板不滿的,結果Alexa沒賣出去,蛔蟲網的老板先被自己的員工給賣了!這樁懸案還有另一個說法,因為媒體公布的那封蛔蟲網COO的信里有阿里爸爸的名字,有人就猜測,這是阿里家族對蛔蟲家族的迫害。可惜,沒有證據!就像逃走網那樣,誰都以為它作弊了,可是誰也拿不出證據來!誰能想到那個排名在逃走網下面的網站聯盟居然是逃走網的總代理,而一群排名從1千到10萬不等的小網站都是它下面的渠道?
??? 好,今天就到這里,希望各位CEO同學課下好好想想,發揮你們的聰明才智,研究出更徹底的出賣Alexa的辦法。最后再免費送你們一條箴言:該出賣時就出賣,別管流量有多壞,前進一名是一名,千萬別怕留罵名!
總結
以上是生活随笔為你收集整理的ALEXA中国网站排名真相调查[内幕调查:出卖Alexa]的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: elementui中 el-table表
- 下一篇: 新的打卡地诞生!三星家电出没网红咖啡厅