【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...
00
?導(dǎo)讀
每一個(gè)項(xiàng)目的第一步就是立項(xiàng),立項(xiàng)需要進(jìn)行充分的調(diào)研才能確定是否值得啟動(dòng)一個(gè)項(xiàng)目。調(diào)研主要要做好兩個(gè)方向:1,算法調(diào)研,它主要是確定可行的技術(shù)路線。更具體的說(shuō),需要清楚想做的事情是否已經(jīng)到達(dá)落地的水準(zhǔn),也就是可行性的驗(yàn)證。2,市場(chǎng)調(diào)研,它主要確定的是,所選中的方案是否有市場(chǎng)需求,是否已經(jīng)有成熟的競(jìng)爭(zhēng)對(duì)手和市場(chǎng)。
下面分別從這兩個(gè)方向進(jìn)行講述,我們以圖像風(fēng)格化為例,所謂圖像風(fēng)格化,學(xué)術(shù)名詞是image style transfer,研究起源于這一篇論文A neural algorithm of artistic style[1],3年前我的公眾號(hào)《與有三學(xué)AI》也做過(guò)報(bào)導(dǎo),大家有興趣可以去看,
它是采用神經(jīng)網(wǎng)絡(luò)的方法,分別學(xué)習(xí)到一幅圖像的紋理和風(fēng)格,從而實(shí)現(xiàn)從一幅圖像風(fēng)格到另一幅圖像的遷移,如下,將圖2的風(fēng)格,應(yīng)用到圖1上。
當(dāng)然,現(xiàn)在已經(jīng)有了很多新的應(yīng)用,尤其是基于人臉的非常多,詳細(xì)的介紹和技術(shù)原理,大家可以去參考我以前開(kāi)設(shè)的AI攝影基礎(chǔ)課程。其中詳細(xì)地講述了攝影中各方面的圖像知識(shí)。
下面言歸正傳,回到風(fēng)格化研究的調(diào)研。
01
從哪些地方開(kāi)始調(diào)研?
1.1 市場(chǎng)調(diào)研
在做算法調(diào)研之前,先要做市場(chǎng)調(diào)研。市場(chǎng)調(diào)研需要涵蓋主流的產(chǎn)品形態(tài),包括 app,普通的網(wǎng)頁(yè)應(yīng)用以及小程序;所面對(duì)的目標(biāo)用戶(年齡層次,地域分布),現(xiàn)有的市場(chǎng)份額,以及潛在的競(jìng)爭(zhēng)對(duì)手等也需要了解。
這一塊沒(méi)有多少可說(shuō)的,平時(shí)多關(guān)注關(guān)注新聞,相關(guān)朋友圈的分享,相關(guān)公眾號(hào)即可,比如當(dāng)年非常火的prisma,作為從業(yè)人員想忽視也不容易的。
?然后到ios平臺(tái)和安卓平臺(tái)去搜搜關(guān)鍵詞,看看各大公司是否已經(jīng)跟上推出類似產(chǎn)品。
我們一調(diào)研就知道,國(guó)內(nèi)幾大圖像算法公司,騰訊的天天P圖,美圖科技的美圖秀秀,Camera360的MIX濾鏡都有相關(guān)產(chǎn)品,其他小產(chǎn)品也不少。
我們分別拿一張人臉和風(fēng)景圖做測(cè)試。
試試美圖黑科技中繪畫(huà)機(jī)器人
天天P圖中的各類風(fēng)格。
MIX中藝術(shù)濾鏡。
當(dāng)然,現(xiàn)在已經(jīng)存在非常多類似的app了,初步的調(diào)研結(jié)果顯示,基于圖片的風(fēng)格化技術(shù)已經(jīng)成熟,而且產(chǎn)品面世也已經(jīng)不止兩年了,我們偶爾會(huì)在朋友圈里看到類似的分享,當(dāng)然具體的用戶比例,可能需要我們自己去做一些調(diào)研問(wèn)卷,投票之類的。
不過(guò),還沒(méi)有看到比較好的基于視頻的調(diào)研結(jié)果,所以這可能是一個(gè)突破點(diǎn)。
最后我們要總結(jié)一下調(diào)研的結(jié)果:
建議從以下幾個(gè)方向:
技術(shù)成熟度
受眾
產(chǎn)品使用頻率
競(jìng)爭(zhēng)對(duì)手
1.2 算法調(diào)研
1.2.1 國(guó)內(nèi)外前沿學(xué)術(shù)研究
可以找一些好的博士碩士論文,相關(guān)綜述,看看總結(jié)和方向。再找學(xué)術(shù)界和工業(yè)界的相關(guān)比賽,以及數(shù)據(jù)集。
1.2.1.1 中文調(diào)研
(1) 首先調(diào)研綜述類文章,查看cnki相關(guān)關(guān)鍵詞的博士碩士論文,以及優(yōu)秀中文期刊的綜述。
還是以圖像風(fēng)格化為例,到中國(guó)知網(wǎng)平臺(tái),http://www.cnki.net/
搜索結(jié)果如下:
根據(jù)下載量與被引用因子,可以初步判斷文章的質(zhì)量,同時(shí)發(fā)表時(shí)間也需要作為參考。
(2) 百度學(xué)術(shù)調(diào)研
雖然百度學(xué)術(shù)與Google學(xué)術(shù)相差甚遠(yuǎn),但是也可以作為輔助。
這其中可以調(diào)研到發(fā)表時(shí)間,來(lái)源期刊,同時(shí)可以獲取到引用格式,這在寫(xiě)作學(xué)術(shù)論文和調(diào)研報(bào)告中也會(huì)非常有用。
1.2.1.2 英文調(diào)研
中文調(diào)研應(yīng)該作為一個(gè)入門(mén)的了解,而英文文獻(xiàn)的調(diào)研,才是了解最前沿技術(shù)的正確方法,必須使用好Google學(xué)術(shù)以及Google通用搜索引擎。同時(shí),由于現(xiàn)在很多的論文在接收和正式發(fā)表之前,都已經(jīng)發(fā)在了arprint平臺(tái)上,所以為了獲取最新的研究結(jié)果,這個(gè)也是必須的。
(1) Google與Google學(xué)術(shù)。
Google學(xué)術(shù)擅長(zhǎng)于尋找正式發(fā)表的學(xué)術(shù)論文,而Google通用搜索引擎則可以廣泛瀏覽相關(guān)內(nèi)容,都需要去仔細(xì)篩選。
另外,Google和百度都提供了一個(gè)api調(diào)研關(guān)鍵詞的熱度趨勢(shì)
https://trends.google.com/trends/
? ? ? https://zhishu.baidu.com/#/
(2) Arxiv
https://arxiv.org/
學(xué)術(shù)界最新的研究成果往往是先發(fā)表在這里,甚至可能領(lǐng)先正式出版機(jī)構(gòu)一年以上,所以這也是需要去認(rèn)真調(diào)研的。機(jī)器學(xué)習(xí)相關(guān)的在computer science欄目下。
在調(diào)研學(xué)術(shù)論文的時(shí)候,優(yōu)先看綜述,然后重點(diǎn)關(guān)注知名的研究機(jī)構(gòu),引用量大的論文。
比如這個(gè)方向,就能找到一篇綜述文章Neural Style Transfer: A Review【2】,若干經(jīng)典文章,比如開(kāi)啟這個(gè)方向的【1】,首次將其實(shí)時(shí)化的李飛飛組的研究【3】等。
通過(guò)閱讀綜述文章和一系列經(jīng)典文章和前沿文章之后,就能對(duì)該方向的技術(shù)路線等有了很明確的認(rèn)知。
當(dāng)然如果有機(jī)會(huì)參與一些比較牛逼的團(tuán)隊(duì)或者身邊有相關(guān)人脈,則更有可能獲得最新的研究成果,那也是極好的。
1.3 行業(yè)媒體調(diào)研
在機(jī)器學(xué)習(xí)領(lǐng)域,現(xiàn)在有很多的優(yōu)秀自媒體,他們也會(huì)經(jīng)常總結(jié)一些前沿的研究,所以這也是一個(gè)很好的調(diào)研渠道。
筆者下面做一些推薦。
機(jī)器之心,新智元,AI科技評(píng)論,AI科技大本營(yíng),都是人工智能媒體與產(chǎn)業(yè)服務(wù)平臺(tái),注重總結(jié)學(xué)術(shù)界的最新研究與工業(yè)界的最新動(dòng)向,干貨很多。
深度學(xué)習(xí)大講堂,Paperweekly,國(guó)內(nèi)CV界的前沿研究推送,學(xué)術(shù)為主,解讀前沿論文。
大數(shù)據(jù)文摘,內(nèi)容不限于AI與機(jī)器學(xué)習(xí),所有與大數(shù)據(jù)相關(guān)東西,所以也會(huì)顯得更加全而雜亂。
36氪,虎嘯網(wǎng)等,注重商業(yè)報(bào)告,尤其強(qiáng)調(diào)行業(yè)趨勢(shì),創(chuàng)業(yè)的朋友肯定是需要經(jīng)常關(guān)注。
知乎微博,雖然現(xiàn)在知乎內(nèi)容越來(lái)越多整體質(zhì)量下滑嚴(yán)重,但是仍然是國(guó)內(nèi)尤其是技術(shù)精英喜歡逛的地方。雖然微博娛樂(lè)泛濫,但是也不能完全否定它上面也有一些還不錯(cuò)的自媒體,像每天堅(jiān)持截取論文研究結(jié)果的“愛(ài)可可愛(ài)生活”,以及各大新聞媒體,新浪科技,大佬的微博動(dòng)向,比如雷軍每次都會(huì)介紹自家小米的產(chǎn)品。
當(dāng)然厚臉皮推薦一下自己在鼓搗的技術(shù)公眾號(hào)《與有三學(xué)AI》以及知乎專欄《深度學(xué)習(xí)模型訓(xùn)練經(jīng)驗(yàn)與代碼剖析》,水平有限未形成規(guī)模,歡迎大家加入。
1.4 github
Github的重要性就不用多說(shuō)了吧,鑒于它已經(jīng)成為了國(guó)內(nèi)最大的技術(shù)人員交友平臺(tái),所以在這里調(diào)研技術(shù)再適合不夠。
以image style transfer為例,一找就找到一個(gè)高質(zhì)量的資源。
https://github.com/ycjing/Neural-Style-Transfer-Papers
帶有相當(dāng)完整的論文list與開(kāi)源代碼,再精讀這些資源之后,想不了解都難了。
而且,等正式開(kāi)始干活之后,這些資源很有可能就會(huì)成為起點(diǎn)。
02
怎樣寫(xiě)好調(diào)研報(bào)告
上面既然已經(jīng)完成了調(diào)研,那么要交出去給別人看的時(shí)候,就一定要寫(xiě)好調(diào)研報(bào)告。下面我們就要作出一些總結(jié),主要從以下幾個(gè)方向入手,還是以圖像風(fēng)格化為例。
2.1 用戶調(diào)研總結(jié)
潛在用戶
AI技術(shù)愛(ài)好者,這一類人喜歡嘗試新鮮技術(shù)。
攝影愛(ài)好者,喜歡研究各類濾鏡。
女性,對(duì)于美顏和人臉風(fēng)格化有需求的廣大女性。
使用地點(diǎn),時(shí)間點(diǎn)和頻次
朋友圈等社交平臺(tái)。屬于日常低頻需求,朋友圈偶見(jiàn)轉(zhuǎn)發(fā),可能集中在特定節(jié)日。比如5-4青年節(jié)天天P圖推出的民國(guó)風(fēng)格。
用戶需求
求新與切合時(shí)間點(diǎn),喜歡不斷嘗試新的濾鏡,喜歡在特定時(shí)間段集中爆發(fā)嘗試與轉(zhuǎn)發(fā)。
使用平臺(tái)
移動(dòng)端app和網(wǎng)頁(yè)應(yīng)用。
總結(jié):圖像風(fēng)格化實(shí)際上是一個(gè)低頻非剛需,它與美顏有著本質(zhì)的區(qū)別,因?yàn)楹笳咧皇菍?duì)圖像的微調(diào),而前者則是一個(gè)新的創(chuàng)作。因此,如果做這一類產(chǎn)品,結(jié)合特定時(shí)間點(diǎn)做趣味性強(qiáng)的短期爆款制造營(yíng)銷事件比特意開(kāi)發(fā)一個(gè)app會(huì)更加符合一個(gè)新的產(chǎn)品定位。
2.2 競(jìng)爭(zhēng)對(duì)手調(diào)研總結(jié)
美圖秀秀與天天P圖等國(guó)內(nèi)app
對(duì)手特點(diǎn),技術(shù)一流,產(chǎn)品全面且受眾廣,總是能在特殊時(shí)間點(diǎn)制造營(yíng)銷爆點(diǎn),正面PK技術(shù)實(shí)力和產(chǎn)品設(shè)計(jì)都面臨很大的考驗(yàn),失敗風(fēng)險(xiǎn)大。
小蟻AI藝術(shù)等小程序
產(chǎn)品簡(jiǎn)單,效果相比主流app較差,有視頻風(fēng)格化。
總結(jié):針對(duì)大公司技術(shù)實(shí)力強(qiáng)但是不敢輕易嘗試非成熟技術(shù),而小公司技術(shù)實(shí)力弱但是產(chǎn)品可以快速迭代的特點(diǎn),我們可以以短小精美的前端界面+最新技術(shù)探索的方式,甚至嘗試非主流擦邊球的形態(tài)來(lái)突然推出爆款。
2.3 技術(shù)調(diào)研總結(jié)
靜態(tài)圖片風(fēng)格化
技術(shù)路線已經(jīng)比較成熟且風(fēng)格化效果較好,相關(guān)app已經(jīng)大量出現(xiàn),門(mén)檻較低,有經(jīng)驗(yàn)的工程師一個(gè)月內(nèi)實(shí)現(xiàn)一個(gè)demo上線沒(méi)問(wèn)題。
視頻風(fēng)格化
計(jì)算代價(jià)較高相關(guān)競(jìng)品很少,需要具備一流研發(fā)能力的團(tuán)隊(duì)。
最終總結(jié):磨刀不誤砍柴工,在正式想好做一個(gè)項(xiàng)目之前,最好先做好上面的3步調(diào)研,免得閉門(mén)造車。
【1】Gatys L A, Ecker A S, Bethge M. A neural algorithm of artistic style[J]. arXiv preprint arXiv:1508.06576, 2015.
【2】Jing Y, Yang Y, Feng Z, et al. Neural style transfer: A review[J]. arXiv preprint arXiv:1705.04058, 2017.
【3】Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European Conference on Computer Vision. Springer, Cham, 2016: 694-711.
如果想加入我們,后臺(tái)留言吧
微信
Longlongtogo
公眾號(hào)內(nèi)容
1 圖像基礎(chǔ)|2 深度學(xué)習(xí)|3 行業(yè)信息
往期精彩
?
【技術(shù)綜述】如何Finetune一個(gè)小網(wǎng)絡(luò)到移動(dòng)端(時(shí)空性能分析篇)
?
【技術(shù)綜述】一文道盡softmax loss及其變種
與50位技術(shù)專家面對(duì)面20年技術(shù)見(jiàn)證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【从caffe到Tensorflow 1
- 下一篇: 【学员分享】深度学习计算机视觉,两个星期