IP 库的 8020 法则与那些高大上的名词~
作為一個(gè)在這個(gè)很窄的領(lǐng)域里踏踏實(shí)實(shí)做了七年(為了嚴(yán)謹(jǐn),還差一天)的公司,我們從來不給客戶講一些看著高大上的名詞,顯得自己有多牛逼,是怎么回事就是什么回事,實(shí)事求是,也不會(huì)因?yàn)橛行┛蛻粝矚g高覆蓋率就把不應(yīng)該標(biāo)注的數(shù)據(jù)標(biāo)注掉而顯得自己覆蓋率高,這個(gè)問題請(qǐng)參見之前寫過的《談如何正確理解 IP 數(shù)據(jù)的覆蓋率,兼談?wù)_率~》。
我也始終認(rèn)為產(chǎn)品質(zhì)量會(huì)說話,也總會(huì)有人理解你的產(chǎn)品所代表的態(tài)度、質(zhì)量和價(jià)值。你現(xiàn)在不需要沒關(guān)系,買不起沒關(guān)系,但是起碼你對(duì)這個(gè)數(shù)據(jù)的認(rèn)識(shí)是正確的,而不是被我們的同行(以下的同行均指國內(nèi)同行)所誤導(dǎo)。畢竟你是不是業(yè)界中的蘋果、華為不是你自己重復(fù)說一千遍就是了的。終究要靠數(shù)據(jù)質(zhì)量、客戶口碑才行。
最近有人在問我這么一個(gè)問題,說你們的同行出去演講時(shí)說了一大堆技術(shù)名詞,諸如實(shí)時(shí)處理 BGP 數(shù)據(jù)、UNDNS 解析、主被動(dòng)網(wǎng)絡(luò)測(cè)量技術(shù)等等,來標(biāo)榜他們的數(shù)據(jù)如何的好,那你們?nèi)绾蝸碜C明你們的數(shù)據(jù)質(zhì)量比同行好呢?
我覺得單獨(dú)解釋,不如寫個(gè)文章出來明確說明一下比較好。
其實(shí) IP 地理位置數(shù)據(jù)庫自 90 年代起就有公司在做,如果你去專利數(shù)據(jù)庫里搜索相關(guān)專利,很多的專利都是那個(gè)時(shí)代申請(qǐng)的,20 年的有效期,很多已經(jīng)或者就快過期了。你要說這幾年有什么新東西嗎?我認(rèn)為基本上沒有,從大方向上看都是冷飯。最終拼的是誰能夠把這些基礎(chǔ)事情的工程化做到位,做到 99% 甚至 99.99% 的極致才是王道。
客戶們拿到的地理位置數(shù)據(jù)庫的質(zhì)量實(shí)際上是看這些事情在背后的工程化是否到位,當(dāng)然也要包括完整的工作方法論。你的數(shù)據(jù)來源是否覆蓋足夠,是否分析到位,任務(wù)如何分解合理,需要多少人手來研究分析、標(biāo)注,工作量是否能夠滿足甚至超越這個(gè)網(wǎng)絡(luò)一直快速變更的情況。整個(gè)數(shù)據(jù)系統(tǒng)和工作方法論也要隨著維護(hù)范圍的不斷擴(kuò)大和質(zhì)量要求的提高,能夠持續(xù)迭代支持,發(fā)現(xiàn)要快、判斷要快、更改要改、更新要快。這些都是需要耐心去一點(diǎn)點(diǎn)的琢磨,都是水磨工夫。
我們應(yīng)該把事情做好做到位超出客戶預(yù)期,而不是堆砌高大上的名詞,搞一個(gè)看著玄乎乎的 ppt 公開忽悠,畢竟客戶需要的不是那些技術(shù)本身或者你所謂申請(qǐng)了多少個(gè)專利,最終需求就是你輸出的 IP 對(duì)應(yīng)地理位置和相關(guān)數(shù)據(jù)是否足夠準(zhǔn)確而已。
我們的觀點(diǎn)是,你的數(shù)據(jù)實(shí)際標(biāo)注和解釋能力(注意,這些是抄襲不來的)跟實(shí)際網(wǎng)絡(luò)情況相比之下有 80 分相像的,才算是將將及格,90 分才可能算是還不錯(cuò),95 分才能算是高分。而做到 99 分是我們目前在努力的目標(biāo)。
從流行的 8020 法則來看,數(shù)據(jù)庫能做到實(shí)際網(wǎng)絡(luò)情況的 80 分,也就算是 8020 法則里說的 80%,其余的那 20 分才是剩下的20%,而這最后的 20% 里每提高 1%,可能所對(duì)應(yīng)需要消耗的人力、精力、投入都是非線性增長的了。
可惜目前的客戶評(píng)估手段還是比較單一,基本上還是看覆蓋率,而不看正確率,這么評(píng)估有什么意義呢?如果這么干,我推薦你買我前面文章里提到的公司的那個(gè)庫,因?yàn)樗珟斓某鞘屑?jí)覆蓋率 99.99% 了。這覆蓋率多好。:)
這些文字好像也很抽象,那么自我證明一下吧。
我們?cè)谧畛踔谱鲾?shù)據(jù)庫的時(shí)候,就制作了一個(gè)軟件,名字叫做 BestTrace,支持各個(gè)平臺(tái),而這個(gè)工具想做好就需要前面那幾個(gè)高大上的名詞了。本來是給內(nèi)部使用的,給一些早期客戶演示的時(shí)候都覺得不錯(cuò),所以就開放出來了。
簡單來說,這個(gè)軟件其實(shí)就是把原始的 Traceroute 命令行工具可視化,可以更方便的查看網(wǎng)絡(luò)路徑情況,比如經(jīng)過哪些國家以及城市,包括運(yùn)營商情況。類似的軟件我所最早知道的一個(gè)軟件叫 VisualRoute,但是早就不再更新。類似的軟件或者網(wǎng)頁版可以說多如牛毛,但是對(duì)比下來,只有我們自己這個(gè)是質(zhì)量達(dá)到要求的。
有圖有真相:
如果你作為一個(gè)相對(duì)熟悉互聯(lián)網(wǎng)絡(luò)的人,就應(yīng)該可以理解,我們的輸出至少看著是非常符合邏輯的,當(dāng)然我們也認(rèn)為完全符合實(shí)際情況。畢竟用這個(gè)軟件的客戶群體,有很大一部分是大大小小運(yùn)營商里的技術(shù)人員,要么是做相關(guān)網(wǎng)絡(luò)維護(hù)的,還有很多網(wǎng)絡(luò)愛好者,我相信他們有足夠的判斷力,口碑嘛,我不自夸了,自行搜索吧。如果你是我們這個(gè)軟件的用戶,歡迎評(píng)論。
既然是可視化,我們也配套了地圖路徑:
總覽
北美部分
歐洲部分
而我們的同行是什么樣呢?無論軟件版本還是網(wǎng)頁版本,實(shí)際上要么根本沒提供,要么就是簡單粗暴沒有任何處理的,我希望我會(huì)被同行打臉,非常歡迎同行來評(píng)論里給個(gè)地址讓我去品鑒一下。
從 IP 庫的角度看,這個(gè)軟件的最大價(jià)值是可以自證 IP 數(shù)據(jù)庫本身的質(zhì)量。數(shù)據(jù)路徑應(yīng)該要環(huán)環(huán)相扣,這是基本功底。如果網(wǎng)絡(luò)路徑數(shù)據(jù)問題都很大,或者路徑只是顯示到了國家,你又如何相信末端結(jié)果顯示的那個(gè)城市是對(duì)的呢?
比如下圖,先不說目標(biāo) IP 的位置正確與否,問題是你上面路由器是英國,你憑什么說下面是英格蘭呢?或者反過來說,目標(biāo) IP 應(yīng)該是英格蘭的準(zhǔn)確率會(huì)是多少呢?
而想做好這個(gè)軟件,既需要一個(gè)非常高質(zhì)量的 IP 庫,也需要 BGP/ASN 數(shù)據(jù),還需要所謂的 UNDNS 解析數(shù)據(jù),試問同行的技術(shù)如此高大上,用于落地的數(shù)據(jù)在哪里?哪里可以用?還是以商業(yè)秘密的名義,實(shí)則根本沒有人搞呢?當(dāng)然了,所謂的主動(dòng)網(wǎng)絡(luò)測(cè)量技術(shù)大概率指的不是 Ping 就是 Traceroute,要么就是端口掃描。這讓我想起來了一個(gè)在過度包裝之后往往會(huì)被人想起的一個(gè)詞,請(qǐng)說人話。
如果你不想裝客戶端嘗試,我們也有類似的網(wǎng)頁版提供,請(qǐng)去 IPIP 官網(wǎng)首頁導(dǎo)航欄右側(cè)的工具項(xiàng)目里找,第一個(gè)就是。
你也不用覺得我就是找了一個(gè)數(shù)據(jù)好看的給大家秀肌肉,都是公開的,你自己可以試,如果里面有錯(cuò)誤,歡迎反饋,用的好了,也希望推薦給周圍的人用。軟件下載地址也在官網(wǎng)首頁下方。
再者,我們不但提供了 BestTrace 這個(gè)客戶端軟件,我們網(wǎng)頁版 Traceroute 工具也提供了分布在全球至少 600 個(gè)左右(總數(shù)在網(wǎng)頁上有顯示)的監(jiān)測(cè)點(diǎn)供大家免費(fèi)使用,作為一個(gè)從制作 IP 庫角度很基礎(chǔ)但是有非常非常非常之必要,而且數(shù)量越多越好的基礎(chǔ)設(shè)施,試問我們的同行們,你們有多少個(gè)?10 個(gè)?20 個(gè)?30 個(gè)?還是會(huì)拿運(yùn)營商的 Looking Glass 來湊數(shù)呢?
而且還要說一下,我們?yōu)榱瞬蛔尶蛻粲X得我們是忽悠人,專門制作了網(wǎng)頁(參見閱讀原文)給大家看我們每天在 IP 數(shù)據(jù)庫上的工作量,那些說自己工作量很大的,也來曬曬如何?我們有 2015 年底到現(xiàn)在的所有數(shù)據(jù)更改歷史,不怕任何一個(gè)客戶提出審計(jì)的要求。而實(shí)際上客戶只要做了每日數(shù)據(jù)存檔,自行對(duì)比也是可以的。
最后,還是希望和同行們能在一個(gè)以數(shù)據(jù)質(zhì)量為核心的事情上互相攀比,而不是要么偷偷照著我們的數(shù)據(jù)抄,要么十個(gè)員工八個(gè)銷售,又或者跑到 QQ 群里臥底想撬我們的客戶,你們跟我們的員工屢次推銷你們產(chǎn)品的事情,我都是在旁邊看著的。下一次就不是發(fā)律師函了。
綜上,我認(rèn)為同行們需要先做到以下幾項(xiàng):
1、為了證明自己的數(shù)據(jù)標(biāo)注邏輯,請(qǐng)同行基于自己的能力,公開提供真實(shí)可依賴的 Traceroute 地理路徑可視化能力,無論軟件還是網(wǎng)頁版本;
2、為了證明有制作全球數(shù)據(jù)的能力,請(qǐng)同行公開提供覆蓋全球主流大城市的監(jiān)測(cè)點(diǎn),用于 Ping 或者 Traceroute 可視化用途,數(shù)量 200 個(gè)以上?
3、為了證明每天都有足夠的工作量在跟進(jìn)互聯(lián)網(wǎng)絡(luò)變化,持續(xù)為客戶服務(wù),請(qǐng)同行不但要做到給客戶的數(shù)據(jù)實(shí)現(xiàn)每日更新,而且要公開提供數(shù)據(jù)的每日變更情況,比如 BGP 和 IP 數(shù)據(jù)庫的。
這些能做到了, 再去跟客戶說可以對(duì)標(biāo)我們的數(shù)據(jù)庫質(zhì)量的事情吧。也希望已經(jīng)購買或者想購買我們同行數(shù)據(jù)庫的客戶們督促他們?nèi)?shí)現(xiàn)。畢竟它們也都漲價(jià)了。
來而不往非禮也,在這里也歡迎各位同行們?cè)跀?shù)據(jù)質(zhì)量角度提出更多的挑戰(zhàn),我們一定奉陪到底。
最后問一個(gè)問題,假設(shè)現(xiàn)在有燈神可以許愿,而我許愿那些現(xiàn)在還在或者曾經(jīng)抄襲我們數(shù)據(jù)的同行們都灰飛煙滅,你覺得還會(huì)剩幾個(gè)?
總結(jié)
以上是生活随笔為你收集整理的IP 库的 8020 法则与那些高大上的名词~的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python学习笔记--迭代器
- 下一篇: 学习 MySQL 高性能优化原理,这一篇