百度VS谷歌?搜索质量评判也要讲基本法
PMCAFF(pmcaff.com)是在中國非常流行的產(chǎn)品經(jīng)理社區(qū)。匯集160000+會員,8000+業(yè)界大咖,致力于為產(chǎn)品人提供專業(yè)的產(chǎn)品沙龍、課程培訓(xùn)、求職招聘等服務(wù)。
本文由PMCAFF會員凱撒撰寫,未經(jīng)許可,禁止轉(zhuǎn)載。
●?●?●
▍PMCAFF產(chǎn)品經(jīng)理社區(qū)的咖友提問:怎么做才能做出一款類似Google這樣全球性的搜索產(chǎn)品?
你眼里的360搜索和百度搜索體驗效果是怎樣的?
1.單純做獨立搜索引擎產(chǎn)品來說,如果360搜索沒有其他360子產(chǎn)品的引流,能否比現(xiàn)在更好?
2.百度搜索是否就真的沒有優(yōu)點可提?
3.綜合以上,在符合國內(nèi)網(wǎng)絡(luò)環(huán)境下,如果給你足夠的技術(shù)、資金、政策支持,怎么做才能做出一款類似google這樣全球性的搜索產(chǎn)品?【不是在國內(nèi)一家獨大】
▍?凱撒? 知名第三方支付公司 營銷
第三個問題有意思,想要做出和Google一樣的搜索產(chǎn)品,先想清楚Google比百度好在哪兒?
1、Google有可開關(guān)的“安全搜索”
什么意思?這是讓用戶根據(jù)自己喜好和可接受度來打開或關(guān)閉的。而百度,什么都不說,先主動幫你和諧了一些內(nèi)容,遇到某些敏感詞的時候,再和諧一些內(nèi)容,然后這樣告訴你:根據(jù)相關(guān)法律法規(guī)和政策,部分搜索結(jié)果未予顯示。但從來不會告訴你是哪個法律和政策。而Google 移除有版權(quán)問題的搜索結(jié)果的時候,會告訴你所以的法律,移除了多少結(jié)果,申訴渠道。?
2、兩者所抓取的網(wǎng)頁數(shù)量差距比較大
Google是可以搜到幾乎整個互聯(lián)網(wǎng)的網(wǎng)站,而百度大多是局限于國內(nèi)(至于為啥,你們都懂的)。其他的搜索,諸如繁體內(nèi)容、外文內(nèi)容、視頻、圖片、學(xué)術(shù)等,兩個差距相差也比較大。
比如,可以試試Google的以圖搜圖比百度要精準(zhǔn)得多,返回的結(jié)果也更多。這個比的就是抓取的網(wǎng)頁數(shù)量的能力問題了。
由于抓取的內(nèi)容具有多樣性,所以Google這點上真的是用心,加上也有能力,去針對不同文化不同內(nèi)容做出更細(xì)致的篩選。例如,Google可篩選不同地區(qū)不同文字的網(wǎng)頁,百度這點弱了。
還有,Google也可以對圖片設(shè)置安全搜索、使用權(quán)限搜索,選項更多(如:視頻按不同畫質(zhì)搜索等)。?
3、Google夠?qū)W?/strong>
除了 YouTube,哥不去做別的內(nèi)容。而百度有百度百科、百度知道、百度文庫、百度貼吧等生產(chǎn)或搬運的服務(wù)。這些網(wǎng)站在百度搜索中權(quán)重很高,百度既在做裁判,又在做運動員,是原創(chuàng)內(nèi)容的惡夢,同時這也是百度搜索質(zhì)量差的原因。
4、強(qiáng)行推廣哪家強(qiáng)
百度給我的感覺是,它總想讓人停留在百度所提供的內(nèi)容上面,不想跳轉(zhuǎn)到第三方網(wǎng)站,即使內(nèi)容是搬運第三方的。
舉個例子,我們在百度搜索APP,顯示的是百度應(yīng)用的內(nèi)容,首頁經(jīng)常沒有Google play和蘋果商店,而谷歌的搜索頁面有Google play和蘋果商店(并有打分),也有豌豆莢等第三方商店頁面。
這告訴我們什么?似乎百度是有這一套“停留在百度所提供的內(nèi)容上面,不跳轉(zhuǎn)到第三方網(wǎng)站”的潛規(guī)則,以方便用戶之名,其實都是在硬推自己的東西。例如,搜文字內(nèi)容,經(jīng)常是百度百科而不是維基百科,互動百科等其他來源。
不要一說到百度的時候就開始嘴炮!其實搜索引擎的搜索質(zhì)量是有量化標(biāo)準(zhǔn)的!
我還在搞SEO的時候,有簡單學(xué)過一個叫Cranfield評論體系的東西,這里簡單的聊一下
Cranfield評價體系有3個環(huán)節(jié)組成:
抽取代表性的查詢詞,組成一個集合
針對查詢樣例的集合,從檢索系統(tǒng)的語料庫中尋找對應(yīng)的結(jié)果,進(jìn)行標(biāo)注(這塊依舊是人工來完成的,也難怪養(yǎng)活了不少做SEO的人- -)
把查詢詞和帶有標(biāo)注信息的語料庫輸入檢索系統(tǒng),對系統(tǒng)反饋的檢索結(jié)果,使用預(yù)定義好的評價計算公式,用數(shù)值化的方法來評價:檢索系統(tǒng)結(jié)果和標(biāo)注的理想結(jié)果的接近程度有多少?
Cranfield評價系統(tǒng)在各大搜索引擎公司內(nèi)有廣泛的應(yīng)用。
首先需要解決的問題是如何建一個查詢詞集合。我了解過,查詢詞可分為3類:尋址類查詢(Navigational)、信息類查詢(Informational)、事務(wù)類查詢(Transactional)。
而這三塊查詢內(nèi)容好像是有比例的,這個具體是多少,好像各大搜索都不一樣對應(yīng)的比例分別為
?Navigational : ≈12%
?Informational: ≈60%
?Transactional : ≈28%?
通常,這是從線上用戶的Query Log文件中自動抽取的。除了上述查詢類型外,還可以考慮Query的頻次,對熱門query(高頻查詢)、長尾query(中低頻)分別占特定的比例。搜索在抽取Query時,往往Query的長短也是一個待考慮的因素。
因為短query(單term的查詢)和長Query(多Term的查詢)排序算法往往會有一些不同。構(gòu)成查詢集合后,使用這些查詢詞,在不同系統(tǒng)(例如對比百度和Google)或不同技術(shù)間(新舊兩套Ranking算法的環(huán)境)進(jìn)行搜索,并對結(jié)果進(jìn)行評分,以決定優(yōu)劣。當(dāng)然還有MAP, DCG法, P@N方法, 等等等。
說了這么多,其實做搜索的在網(wǎng)頁檢索結(jié)果進(jìn)行評估,主要是圍繞精確率和召回率來做的,涉及的是這么幾點:
相關(guān)性:query與結(jié)果說的是否一致?
需求強(qiáng)度:關(guān)鍵詞匹配
豐富度:是否詳細(xì)
時效性
便捷性:時間成本
權(quán)威度?
這6個方面在不同特征的query下,關(guān)注的重點有不一樣,不同維度適用的query范圍有所不同。
本文來自PMCAFF產(chǎn)品經(jīng)理社區(qū)(www.pmcaff.com),不代表PMCAFF觀點和立場,未經(jīng)許可,禁止轉(zhuǎn)載。
●?●?●
最酷的產(chǎn)品經(jīng)理都在讀
20個頂尖產(chǎn)品經(jīng)理都在用的APP
微信充值頁面為啥長這樣?(多圖)
知乎真的一天不如一天了嗎?
總結(jié)
以上是生活随笔為你收集整理的百度VS谷歌?搜索质量评判也要讲基本法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 8个直播底层支撑的创业机会,你都抓住了吗
- 下一篇: 特别企划 | 或许是史上最萌的产品经理改