快手于冰:跟最优秀的人一起追求极致
晚上八點多,采訪結束。和于老師寒暄了幾句,他說下周要去WWDC,還要去訪問圣地亞哥實驗室。我們相互道別后,他轉身回去工作了。我大快朵頤著快手的免費晚餐——壽司和賽百味面包。來到樓下,看到幾幢四面透明的玻璃大樓,燈火通明,負責公共關系的員工告訴我,這里有食堂、星巴克、超市、健身房、理發(fā)室、郵局……都是快手自有的,像是一個獨立的小鎮(zhèn)。
過去的一個多小時,與于老師交流了他個人的成長與理想,一起探討了他是如何堅持初心,并一步步實現(xiàn)理想的。
文 / 于冰(快手音視頻技術負責人)
策劃 / LiveVideoStack
創(chuàng)業(yè)相關
LiveVideoStack:今天我們是在快手北京的總部,邀請到快手音視頻技術負責人于冰,于老師同時還是8月份LiveVideoStackCon2019北京的聯(lián)席主席。我一般在采訪前先研究一個人的背景,所以我花了大概一個多小時研究您在Linkedin的資料。我很好奇,您曾經有兩段創(chuàng)業(yè)經歷,能聊聊這兩段創(chuàng)業(yè)的故事嗎?
于冰:創(chuàng)業(yè)有快樂也有痛苦。首先分享快樂的事情吧,最快樂的事當然是把自己的創(chuàng)新技術應用到產品里面去,為用戶創(chuàng)造價值。我參與創(chuàng)辦過兩家To B的創(chuàng)業(yè)公司,都是為電視臺提供互聯(lián)網視頻解決方案的。在這個過程中,我了解了專業(yè)媒體機構是如何使用視頻技術的,利用我們所掌握的全新技術,幫助傳統(tǒng)電視臺將媒體平臺拓展到互聯(lián)網上,是一段很跨界的經歷。
端到端的視頻技術突破是產品的核心競爭力,從視頻采集編解碼、傳輸分發(fā),再到播放都是自主研發(fā)的。我們在2008年首創(chuàng)了H264+HTTPFLV技術,在瀏覽器內實現(xiàn)了實時+7天內任意時移回看,從清晰度流暢度,交互體驗創(chuàng)新上,在當時在行業(yè)內是最領先的。
創(chuàng)業(yè)公司人手不夠,我?guī)缀跏裁炊甲约簞邮肿鲞^,從前端到后端,從編解碼設備,流媒體服務器到播放器,從運維到售前到產品經理。一開始我們給不同客戶做定制化開發(fā),后來逐步把解決方案產品化。很多一線電視臺、互聯(lián)網公司都采用過我們的產品,也承接過超大規(guī)模的直播活動如優(yōu)酷Nokia演唱會、2008年奧運直播等。通過技術改變世界,還是很有成就感的。
創(chuàng)業(yè)最大的痛苦在于,To B市場做起來比較辛苦。因為客戶的需求都是個性化的,定制化的東西非常多,每個項目做下來都投入非常大,但可復制性不高,每個客戶都要撥出人力去做支持,公司很難實現(xiàn)規(guī)模盈利,團隊也就很難成長得快。我中間在外企FreeWheel修煉了幾年,優(yōu)秀的老板和同事們帶我在技術上和管理上更進了一步,后來看到新的技術機遇,還是沒忍住又出來創(chuàng)業(yè)。第二次創(chuàng)業(yè)和第一次面向的市場客戶還是類似的,區(qū)別在于技術上更成熟了,而且會使用一些更新的技術,比如用Flash P2P來解決規(guī)模和成本問題,用硬件編碼器來提升編碼集群密度等。
LiveVideoStack:我相信這兩段經歷你讓收獲了很多經驗,有了對市場認知。最大收獲是什么?
于冰:我覺得最大的收獲是轉變技術主導的思維,多思考技術以外的東西。首先,作為技術合伙人,在公司內外,還需要跟非技術人員做大量溝通,過程中也認識了很多朋友,得到了很多有益的幫助。公司內的產品、設計、銷售、售前售后支持,合伙人、投資人,公司外的各種客戶,電視臺的領導、技術人員、編導等,合作伙伴如集成商、友商、CDN廠商等,各行各業(yè)各種類型的人都接觸過。三人行,必有我?guī)?#xff0c;這個經歷,沒創(chuàng)業(yè)是很難獲得的。另外,在公司內,我在研發(fā)團隊內的管理方面也得到了比較多的鍛煉。比如在資源受限條件下,如何招聘到比較好的工程師?如何跟產品業(yè)務部門PK溝通需求,排定路線圖?應該如何處理突發(fā)事故?怎樣去激勵團隊,怎樣苦中作樂?在創(chuàng)業(yè)過程中必然會歷經很多磨難,但吃一塹長一智,都是個人成長的源泉。
LiveVideoStack:當初決定去創(chuàng)業(yè)時候,相信會有自己的目標或夢想,目標和夢想是什么?
于冰:團隊的初心很明確,就是希望能夠自己從頭到尾構建一個最強大的視頻系統(tǒng),解決一些別人解決不了的問題——那個時候Google對技術人員的影響是比較大的,大家都希望能夠通過技術來改變世界。
我們最開始是在清華的教師宿舍里創(chuàng)業(yè),團隊都是清北的背景,應該是在當時做To B視頻技術公司中比較出眾的。我們希望用技術來改變視頻分發(fā)和傳輸架構,在視頻編碼密度、質量、系統(tǒng)吞吐率和最終用戶體驗上都要做到極致。能夠跟優(yōu)秀的算法專家、工程師一起合作,一起解決難題,這個過程非常爽。
LiveVideoStack:跟這樣一幫人在一起就是讓你覺得技術可以真正的改變世界了。?
于冰:是的,在產品體驗獲得客戶認可的時候,是很有改變世界的成就感的。只是當時底層技術雖然做的還行,但產品化做的不夠好,復制成本高。受限于行業(yè)規(guī)模,公司成長空間也受限,還是希望能夠做影響力更大的事情。當時做的很多直播相關的技術,現(xiàn)在整個行業(yè)也還在應用,說明大方向是對的,只是時機未到,平臺也不夠大。
LiveVideoStack:但是夢想和目標始終都沒有變?
于冰:沒有變。我個人是一個技術控、產品控,同時愛才如命。一方面要在技術指標上追求極致,一方面要把用戶體驗做到最優(yōu),因此必須跟最好的人來合作,達成這個目標。
LiveVideoStack:回到今天,回到您加入快手,跟當初創(chuàng)業(yè)有非常緊密的關系?
于冰:現(xiàn)在的想法和當初創(chuàng)業(yè)時是一樣的,做技術的人都希望跟強者一起合作,這樣會效率更高。我一直在找能夠打造一流團隊的平臺,希望有更大的成長空間,更好的品牌來吸引優(yōu)秀的人。這樣的話,團隊和平臺雙贏,創(chuàng)造更大的價值。
其實在快手的幾年,更像是和公司一起創(chuàng)業(yè),快手的音視頻團隊從初期六個成員成長到如今一百余人的規(guī)模,這個成長速度是創(chuàng)業(yè)團隊才有的,大家的狀態(tài)也一直都是創(chuàng)業(yè)團隊的狀態(tài)。
快手的使命是“用科技提升每一個人獨特的幸福感”。在快手,每個人都能夠看到更廣闊的世界,也能夠被更廣闊的世界看到,這就要求平臺堅持普惠、去頭部化,不然普通用戶是永遠沒機會被看到的。平等普惠,真實向善的價值觀,用戶導向,技術驅動的方法論,吸引了一批最優(yōu)秀的人才一起去努力,一起追求極致,將用戶體驗打磨的更好。
LiveVideoStack:所以,Google只招全世界最聰明的人,至于這個人做什么不重要。
于冰:人很重要,做什么也是很重要的。因為做事情需要專注,需要你對這件事熱愛,兩者是相輔相成的。
LiveVideoStack:你一直在尋找吸引行業(yè)中最頂尖人才,等待機會一起來做足夠大的事情。
于冰:做一件大家都熱愛的事情,這個想法一直沒有變。
在快手,兩年的時間,我們已經逐步構建了端到端的音視頻技術體系,打通了整個短視頻+直播的技術棧,建立了完善的數(shù)據(jù)驅動的音視頻體驗優(yōu)化體系。
?
圖:快手的音視頻技術體系(摘自于冰在LiveVideoStackCon2018北京的主題演講PPT)
LiveVideoStack:您有些事業(yè)上的追求,尋找最優(yōu)秀的人在一起,接下來就是兩個選項,一是大公司,二是創(chuàng)業(yè)。如果都能滿足要求,你會選什么?
于冰:對于視頻行業(yè)來說,創(chuàng)業(yè)比較難。因為大平臺擁有流量的優(yōu)勢、資本的優(yōu)勢,在創(chuàng)業(yè)公司則很難擁有這樣的資源去發(fā)揮你的價值。
現(xiàn)在快手平臺日活已超過2億,原創(chuàng)視頻總量超過100億條,每日視頻播放量超過150億次,每天上傳視頻超過1500萬,這個平臺規(guī)模是創(chuàng)業(yè)公司所不能比擬的。我們團隊每天并行的AB實驗就有幾十個,規(guī)模小的系統(tǒng)可能數(shù)據(jù)置信度都保證不了。在快手平臺,每做一個音視頻相關的優(yōu)化,可能會影響上億人的使用體驗,如果產生的收益,也會是一個天文數(shù)字。我們通過大量線上實驗證明了,技術優(yōu)化對于核心用戶體驗(QoE)影響十分顯著,對業(yè)務指標有直接的貢獻,也直接對應巨大的用戶價值。在創(chuàng)業(yè)公司很難產生這么大的價值,因此投入規(guī)模也會比較受限。
LiveVideoStack:這個行業(yè)里技術創(chuàng)業(yè),難度非常大?
于冰:我并不是持一個完全消極態(tài)度,只是覺得只靠技術來創(chuàng)業(yè)很難,除非是特別強的人,才能做起來。一方面技術上需要有別人真的做不出來的東西,或者至少是短期內做不出來的東西,要有足夠前瞻性的技術布局和儲備;另一方面還要有剛需的用戶場景,解決的是真需求而不是偽需求;最后一個建議是,不妨結合一些非技術的要素,比如資源、數(shù)據(jù)、版權等,建立自己的核心價值和壁壘。
LiveVideoStack:對于那些還是想去試一把的技術人,有什么建議?
于冰:影響創(chuàng)業(yè)成功的因素很多,再說一下人的因素吧,公司肯定不止要做技術,早晚需要做業(yè)務來讓公司持續(xù)賺到錢,走向正向循環(huán)。技術人要么自己放棄技術,快速進化成為合格的業(yè)務負責人,同時找到合格的技術合伙人來幫你搞定技術問題;如果自己不放棄技術,就需要找到能力強,可依賴的業(yè)務合伙人,否則創(chuàng)業(yè)很難成功。好的技術人,做業(yè)務的潛力也是很大的,因為你有更加結構化、系統(tǒng)性、客觀的思維方式;但在感性思維和溝通方面,需要多鍛煉加強。
LiveVideoStack:您一直在從事這個行業(yè),但是我們回顧互聯(lián)網發(fā)展有機會,有社交、游戲、區(qū)塊鏈還有AI,對技術人來講,機會很多,那我的問題是,為什么還會一直專注在視頻這個領域?
于冰:視頻是一個比較垂直的大行業(yè),以視頻作為牽引,可以集成很多技術,未來是有很大的空間和機會的。但我覺得AI、區(qū)塊鏈都是解決問題的手段,不是問題本身。視頻行業(yè)問題本身是視頻體驗——怎樣更清晰更流暢,這么多年這個行業(yè)一直在解決這個問題,我們現(xiàn)在在用AI來解決傳輸、圖像處理、視頻壓縮、音頻處理的問題,問題還是不變的,只是手段變多變高級了。
LiveVideoStack:問題的本質是?
于冰:提供更好的用戶體驗。
LiveVideoStack:只要能夠更好的解決問題,就有足夠的價值?
于冰:是的,如果能夠把用戶的視頻體驗做到最好就有足夠的價值。在快手,我們比較崇尚用戶導向、技術驅動的做事方式,首先理解用戶場景,之后根據(jù)用戶痛點設計優(yōu)化方案,設定優(yōu)先級,最終用數(shù)據(jù)來驗證優(yōu)化的QoE收益。
當然用戶導向也會給技術同學帶來很大挑戰(zhàn)。大家通常喜歡從技術角度出發(fā)想問題,但是現(xiàn)在要換位思考,從用戶角度、用戶需求去考慮,要有反向思維的能力,要培養(yǎng)同理心,這是非常難的事,很多工程師需要經歷一段時間的思路轉變才能做到。
要說改變起來其實也簡單,就是研發(fā)人員要成為產品的深度用戶,自己從用戶角度來推敲和優(yōu)化,跟產品經理一起深入探討如何改進得更好。同時要做很多的技術儲備,這樣當用戶需求來了,隨時可以拿出來用。如果自己的技術儲備不夠,又十分著急的話,要考慮采用成熟的第三方技術,而不是從頭開始造輪子,讓業(yè)務方干等著。最終技術好不好要用實際數(shù)據(jù)來說話,看用戶是否接受它,而不是盲目上線技術上看起來很厲害卻曲高和寡的東西。
LiveVideoStack:這個事情值得你去用十幾年二十年去投入?
于冰:值得,會一直關注,一直做下去。720P做完了做1080P,1080P做完了做4K,4K做完了還有8K,還有HDR、高幀率、全景聲、VR等更好的體驗等著我們,挑戰(zhàn)也越來越大:舉個例子,8K@120fps HDR的視頻如何做實時壓縮,想一想就覺得很興奮,非常有挑戰(zhàn)。
LiveVideoStack:從這個角度來看,多媒體技術人職業(yè)的發(fā)展應該是非常寬闊的,應該是充滿了機會。
于冰:是的,解決核心問題有各種各樣層出不窮的手段,這個領域有很多細分方向,只要沿著主航道去深入發(fā)展就充滿了機會。
LiveVideoStack:這又引出另外的問題來,許多專家吐槽,這個行業(yè)里的人才太少了,供給出現(xiàn)了問題。從學校這個最大的人才的輸出機構來看,選擇多媒體、編解碼、網絡這些底層的技術的學生越來越少。想招一個合適的學生非常難,學生更愿意去搞AI或者金融。
于冰:首先,在我的觀察看來,現(xiàn)在有很多學生研究AI、做深度學習,實際上很多人都是拿現(xiàn)成的框架去解決一些自己拍腦袋想出來的問題,而且大多把時間花在了標注數(shù)據(jù)和調參上。我建議同學們多思考一下哪些問題是真實場景中的真問題,避免解決偽問題。在找到真問題之后,不妨嘗試用傳統(tǒng)方法搭建框架解一遍,把問題白盒化,有深入理解之后,再嘗試用深度學習去解決其中的難點。否則一開始就嘗試用深度學習去解端到端的問題,對于領域知識問題本質都缺乏了解,對于深度學習這個黑盒有沒有足夠的能力掌控,必然會碰壁。
說回行業(yè)的問題,其實建議在學校的同學可以放開視野。多媒體領域有很多問題待解決,例如一些老問題可以解的更好:比如如何通過算法做主觀質量評價,如何更精確地預測帶寬變化,如何進一步對視頻圖片進行壓縮,如何通過算法優(yōu)化圖像質量等等。而且總是有新的問題、亦或新的方法涌現(xiàn)出來,尤其是在即將到來的5G+AI時代,問題和對應的方法會越來越多。想搞AI的同學不妨來視頻行業(yè)看一下,這里有很多實實在在、時時刻刻都在發(fā)生的問題,我們有大量的數(shù)據(jù)集,包括用戶行為日志數(shù)據(jù)、內容樣本、傳輸日志等等,還可以在大規(guī)模真實用戶中做實驗,這些條件在實驗室是完全接觸不到的。 在學校關起門做科研的問題在于,學生直接發(fā)paper,卻不了解問題本質,不了解真實的用戶需求,有可能paper涉及的問題是一個根本不存在的問題,或者是個偽問題。而在工業(yè)界每天遇到的問題都是實實在在存在的,你用什么方法去解都可以,也可以用非常高深的算法去解決。只是如果用非常復雜方法解,最終很可能是上不了線的,原因可能是算法復雜度太高,或者有一些bad case特別難fix,但發(fā)paper大概率是可以的。
要解決高校多媒體專業(yè)的人才供給問題,一個思路就是希望高校能夠以開放思路來建設實驗室,多跟工業(yè)界的大平臺合作,這樣可以為學生提供真實的問題、真實的數(shù)據(jù),通過實戰(zhàn)的項目,能夠進一步開闊眼界,鍛煉動手能力。與真實場景問題結合,發(fā)paper也更容易中。有了產學研結合雙贏的機制,相信會有很多優(yōu)秀的學生選擇多媒體相關的專業(yè)。快手去年就跟清華大學聯(lián)合成立了“清華大學-快手未來媒體數(shù)據(jù)聯(lián)合研究院”,一起去培養(yǎng)學生,鼓勵大家多用AI嘗試解決產品上的問題,有了不少喜人的落地成果。
最后說到行業(yè)人才問題,其實國內外多媒體人才并不少,尤其是國內每年優(yōu)秀的畢業(yè)生很多。但與其他行業(yè)一樣,最好的人才都是比較搶手的。快手在音視頻工程算法方向的收益明確,投入堅決。我們在算法方向招聘要求是出了名的高的,主要面向海內外高校TOP實驗室招聘最優(yōu)秀的研究型人才;工程方面覆蓋面很廣,移動端雙端開發(fā)和SDK、服務端C++/Java、大數(shù)據(jù)系統(tǒng)和分析、音視頻質量實驗室都有開放職位,目前在北京、杭州、深圳、硅谷、西雅圖、圣地亞哥都建立了研發(fā)中心和算法實驗室,也在考慮開設更多的辦公地點,吸引一流人才入駐。
LiveVideoStack:剛剛提到了大平臺的流量和資源的優(yōu)勢,可以滿足你達成技術人夢想。如果讓你用幾個關鍵字來形容一下快手這家公司會用哪些詞?
于冰:去年我在LiveVideoStackCon2018大會上講過,前邊也提到了:“用戶導向,技術驅動”,這是我非常認同的方法論。快手是一家特別重視用戶體驗的公司,可以說整個公司的人都在優(yōu)化體驗,投入巨大,今年公司對大家的要求也是 “追求極致”,這已經成為了公司的基因不會改變:“追求極致”就需要在關鍵領域上有足夠大的壓強,這樣才能夠突破。我們給了最優(yōu)秀的技術人員一個很好的機會——把特別細的細節(jié)做好,不像有的產品只做到80分就夠了。這就可能要求在一些別人看起來非常小的領域中投入非常大,當然我們做得還不夠,積累的時間還不夠長,某些技術也正在逐步趕上。另外,前邊還提到過,公司的價值觀也是吸引眾多優(yōu)秀技術人才的因素:平等普惠,真實向善,是貫穿在公司內外的行為準則。
LiveVideoStack:畢竟人力是有限的,當你在做一個決策的時候,到底是自己來做,還是先用供應商的產品。你也說到,業(yè)界有團隊會做得非常出色。
于冰:我們一直都抱有開放的心態(tài),積極調研外界的新產品新技術,跟自研系統(tǒng)來PK,很多友商的產品做得相當不錯,不過很多公司并不對外提供技術,有的則價格很貴,而且要采用第三方的產品上線還必須考慮各種各樣的非技術因素。當然在這個行業(yè)里面,評測下來我們自己做的還可以。
我們很歡迎大家多利用LiveVideoStackCon大會這個平臺來探討,怎樣把技術做得更好。希望大家能夠保持長期的合作,一起做對比測試,我們有非常專業(yè)的質量測試實驗室,會幫忙建議哪里需要加強,我們也可以知道自己哪里做的不好:三人行,必有我?guī)煛_@樣的話,技術才能不斷改進,而不是盲目驕傲自滿。
LiveVideoStack:快手和外界的供應商與技術團隊是一個比較良好的互動切磋?
于冰:我希望建立一個開放的系統(tǒng),而不是封閉的閉門造車,我自己創(chuàng)過業(yè),相信創(chuàng)業(yè)團隊在某些點上很可能會做的比我們深入。只是團隊有時候比較忙(沒有時間一一反饋),也有些時候是因為提測的技術沒成熟到一定程度,評估需要花比較多人力去測試,因此我們會盡可能多做評測,同時也會謹慎選擇。?
LiveVideoStack:很多公司有一套自己的數(shù)據(jù)集和系統(tǒng)來評估Codec,快手是否有這樣的系統(tǒng)?
于冰:我們有一套比較完善的codec評估體系,主客觀都會做評估。我們的移動端短視頻和直播的通用測試集,可以提供給相關合作伙伴采用自己的算法做壓縮,結果出來后,我們會對比質量是否達標,客觀指標主要看PSNR和SSIM BDRate,主觀指標有專業(yè)的評估團隊來看。十分期待LiveVideoStack組織一個中立的比賽,讓大家用同樣的測試集PK,用標準的評估手段去考驗大家對Codec實現(xiàn)和調優(yōu)的能力,提升整個行業(yè)的水平。
LiveVideoStack:快手、大疆,包括華為、阿里、騰訊等越來越多的國內企業(yè)在標準組織貢獻專利,參與標準的制定。怎么來解讀這個現(xiàn)象?我們能看到一個原因是規(guī)避一些專利風險。
于冰:我認為多數(shù)公司是從專利這個角度出發(fā)來思考的。除此之外,我們有更深入的考量。首先,面向廣播電影電視內容制訂的壓縮標準,實際上對移動端視頻并不是特別的適合,所以我們會針對移動端做許多創(chuàng)新的算法研究。第二,在研究算法的同時,我們也希望把算法實現(xiàn)到產品里去,看如何做的更有效率,這方面標準算法研究團隊的專家們可以很大的忙。
LiveVideoStack:倒數(shù)第二個問題。5G帶來產品機會,哪些技術會因此會受益,快速普及或難點突破?
于冰:目前暫時還不明朗。3G到4G經歷了互聯(lián)網移動化大潮,這個過程中有新的終端產生:智能手機,它的用戶體驗遠遠超越了傳統(tǒng)的終端,但是在5G時代還沒有出現(xiàn)這樣的終端。實際上如果沒有智能手機的普及,4G是沒有應用場景的。 2007年初喬布斯開iPhone發(fā)布會之前,所有的運營商、電信設備商都很焦慮,他們看不出4G做出來有什么用?發(fā)圖片、發(fā)短信3G就夠了。但在5G時代,這幾年內如果沒有一個能創(chuàng)造類似量級的體驗革命的終端出來,很可能會遭遇4G發(fā)展初期類似的困境。
LiveVideoStack:哪些技術會有機會?
于冰:革命性的終端出現(xiàn)前,技術都是漸進式的變化,不會特別明朗。
LiveVideoStack:最后一個問題,今年有什么計劃?2019年馬上過去五個月了。
于冰:今年要做的事挺多的,跟公司大方向一致,那就是“追求極致”。我們在移動端視頻拍攝編輯、傳輸算法、壓縮算法等方向都在進一步突破。
另外,今年我們會將音視頻中臺的建設作為重點工作,音視頻中臺是快手技術中臺的核心支柱之一,我們希望利用領先的音視頻工程算法能力來支持快手APP以外的其他業(yè)務,如AcFun、快手海外版Kwai和視頻編輯工具快影等。通過中臺的建設,我們的技術落地場景將會更多,包括短視頻、直播、長視頻等,將覆蓋更大范圍的用戶,也將會迎來更大的技術挑戰(zhàn)。
這里也預告下,快手的短視頻架構負責人陳彬、直播架構負責人郭亮在LiveVideoStackCon 2019北京站大會上,會分別分享“快手高性能移動端多媒體引擎架構”以及“快手直播的升級之路”,歡迎大家來聽聽我們在做的事情。
LiveVideoStack? 招募
LiveVideoStack正在招募編輯/記者/運營,與全球頂尖多媒及技術專家和LiveVideoStack年輕的伙伴一起,推動多媒體技術生態(tài)發(fā)展。了解崗位信息請在BOSS直聘上搜索“LiveVideoStack”,或通過微信“Tony_Bao_”與主編包研交流。
點擊【閱讀原文】或掃描圖中二維碼,了解更多大會講師及分享內容信息!
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的快手于冰:跟最优秀的人一起追求极致的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hulu兰华峰:专注平衡用户体验和成本
- 下一篇: Apple 低延迟HLS分析