计算机视觉python入门_计算机视觉应该怎样入门?
自學了一段時間計算機視覺(Computer Vision),下文簡稱:CV。內容以基本概念為主,形式以看書為主,跟著敲代碼為輔。起因:因工作中會涉及到交通物流風險管理、出險理賠材料審查等內容,會涉及到大量人工介入審閱照片、視頻的環節。而隨著素材量的增加將來需要大量的人力來處理,導致成本高,效率低、易出錯。
思考:能否通過某種技術進行照片、視頻內容的審查,從而消化一定的工作量,同時提升效率?帶著這樣的問題,我們鎖定了CV技術。
這里非常簡單地談談自己近一年的學習體會,算是入門者說吧。
1、首先明確CV都會在哪些領域里使用,即用途是什么?以下是筆者在今年1月中旬于硅谷參加AI世界前沿大會時拍攝的OpenCV作者Bradski大神的演講ppt照片(能看得清內容)。
從上圖可以看出,CV或者說OpenCV用途十分廣泛。那么問題來了,你確認你要學的東西在未來的學習或者工作中可以派上用處嗎?如果答案是Yes。就繼續往下看。
2、CV是啥?如果用一句話來解釋CV,那么可能是研究讓機器像人一樣具有能夠“看”的能力,并在必要的時候給予合適的反饋(輸出:比如看圖說話,看視頻說話)。
3、學什么?從哪里開始學?
從斯坦福大學李飛飛教授的CS231n課程中可以看到,需要有一些基礎,以便更好的學習CV。截屏如下:
上圖可以看到,需要我們具備一些知識:1)編程基礎:Python和C++。個人理解,用Python快速實現算法;用C++實戰,實時性能強。
2)數學基礎:高數,線性代數、基礎概率與統計
3)機器學習基礎
3-1)如果你對以上內容都有一定的基礎,那么恭喜你,對于入門CV,你有了好的開始。
3-2)推薦幾本比較好的書籍:
1、《計算機視覺:模型、學習和推理》入門基礎書籍,講得很清楚。我在看,非常好的與機器學習結合的CV入門書籍。英文好的同學,建議看Prince的原本彩圖書籍。官網《英文原版彩圖PDF版本》下載鏈接
2、《Learning OpenCV》實戰經典。推薦理由:OpenCV作者Bradski大神的書。學習CV的人是無法繞開OpenCV的。
3、《Python計算機視覺編程》如果你有一定的Python基礎,筆者強烈推薦看這本書,把CV的基本概念和算法結合代碼實戰,講得比較清楚。入門佳作。它不是一上來就用OpenCV庫,使得入門者容易忽視很多基礎的概念算法。
4、《計算機視覺:算法與應用》不建議入門者看。寶典型,大而全。典型的工具書。作者是Richard Szeliski,CV界大牛,圖像拼接奠基人。
5、《 Multiple View Geometryin Computer Vision 》,中文版名《CV中的多視圖幾何》據說是玩3D必看的一本書,包括AR/VR。很多CV專家都推薦。
3-3)視頻學習,當然是斯坦福大學李飛飛教授的CS231N課程(需要扶梯),這是一門結合深度學習的CV教學視頻。經典!
3-4)目前結合深度學習的CV是發展方向之一,有空可以看看花書。
4、OpenCV、TensorFlow、Caffe這些個,咱們現在一個都繞不開。
多上手,多練吧。
5、國際頂尖的CV會議,掃掃論文的摘要、看看報告視頻。(如果確定深度研究,就仔細看。否則,個人覺得了解下就好。)
于2017年12月3日凌晨 0:45
總結
以上是生活随笔為你收集整理的计算机视觉python入门_计算机视觉应该怎样入门?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: numberformat_解决Numbe
- 下一篇: 程序人生:什么是“对用户友好”