有三AI 1000问回归,备战秋招,更多,更快,更好,等你来战!
文/編輯 | 言有三
最近遇到了很多朋友來詢問《有三AI 1000問》在哪里?本來我做這個專欄的初衷只是想提醒大家要多主動思考,多注意細節,沒想到擊中了很多同學的痛點,不過之前已經停更了。今天就是要告訴大家,有三AI 1000問回歸了,在《有三AI知識星球》中作為一個子板塊進行日更。
什么是有三AI 1000問
我們有各種各樣的技術專欄,不過都是用長文講述“大”問題,而1000問的內容講述的是小問題,從內容和形式來說有幾個特點。
(1) 內容
講述足夠通用與聚焦,容易被忽視,習以為常但確實很關鍵的問題,從而激發大家進行更多的思考。
不會入選的內容如:“目標檢測的最新進展”,"怎么設計更高效的模型”等主題。會入選的內容如:“為什么圖像分類輸入大小多是224*224”,“OpenCV中彩色圖像的順序為什么是BGR而不是RGB”。
(2)?創作風格
這一個專欄以引導思考,填補知識空洞為主,用知識卡片(見下文)的形式進行更新。希望大家在比較輕松的進行閱讀思考的同時能夠獲得知識,在即將到來的秋招面試中也能助大家一臂之力。
如何更新內容
接下來這個板塊將會在有三AI知識星球中進行連載更新,涉及的內容非常多,暫定以下幾個方向,根據安排可能會進行調整。
下面就來先感受幾個案例吧:
有三AI1000問-模型篇
為什么深度學習圖像分類模型輸入大小多是224*224呢?
做過圖像分類項目的小伙伴們應該都知道,在論文中進行各類方法的比較時,要求使用同樣的數據集。而為了公平的比較,網絡的輸入大小通常都是224*224的大小,那為什么呢?有同學思考過這個問題嗎?
作者/編輯 言有三
我們都知道,一個圖像分類模型通常是如下的流程。
輸入image->卷積網絡層->最后特征圖->全連接特征->分類器輸出。
最后一個卷積特征圖常見的大小可以是3*3,5*5,7*7等等。
特征圖如果尺寸太小,那么信息就丟失太嚴重,如果尺寸太大,信息的抽象層次不夠高,計算量也更大,7*7的大小是一個很好的平衡。
另一方面,圖像從大分辨率降低到小分辨率,降低倍數通常是2的指數次方,所以圖像的輸入一定是7*2的指數次方。以ImageNet為代表的大多數分類數據集,圖像的長寬在300分辨率左右。
所以要找一個7*2的指數次方,并且在300左右的分辨率作為輸入,其中7*2的4次方=7*16=112,7*2的5次方等于7*32=224,7*2的6次方=448,與300最接近的就是224了。
當然對于實際的項目來說,有的不需要這么大的分辨率,比如手寫數字識別,有的要更大,比如細粒度分類。
有三AI1000問-機器學習篇
為什么要分驗證集和測試集呢?
機器學習的教材,很多公開數據集中都會教我們要將數據集分為訓練集,驗證集和測試集,看起來驗證集和測試集并沒有區別,為什么要分這兩個呢?
作者/編輯 言有三
驗證集和測試集的定位是不同的,一個模型需要有好的泛化能力,需要同時在訓練過的數據和沒訓練過的數據集上取得好的結果。
我們將訓練集用于訓練,驗證集用于調參數,它們是從同一個數據集進行隨機拆分得來,驗證集扮演的是一個輔助模型增加泛化能力的作用。
而測試集不同,它僅僅用于最后評估模型的性能,可能也來自于同一個數據集,也可能不是,因此它和訓練集/驗證集的數據分布有可能不同。對于比賽用的公開數據集,驗證集會公開標注,測試集不會公開。
有三AI1000問-圖像篇
為什么OpenCV存儲的圖像格式是BGR呢?
做圖像處理的我們應該都知道,OpenCV是我們必備的一個工具,在使用OpenCV讀取圖像時你應該也發現了讀取出來的數組是BGR的順序,而不是我們聽的最多,用的最多的RGB格式,這是為什么呢?有同學思考過這個問題嗎?
作者/編輯 言有三
當我們用OpenCV庫讀取圖片時,讀取后的通道排列是BGR,而用PIL庫則是RGB,假如我們將PIL讀取的圖用OpenCV直接顯示,就會如下面右圖,顏色是不對的,新手非常容易犯錯。
之所以這樣主要是歷史原因。OpenCV在1999年由Intel建立,當時主流的攝像頭制造商和軟件供應商提供的攝像頭采集的圖像的通道排列順序就是BGR。另一方面,Windows中顯示圖片的基本格式是BMP,其中RGB顏色陣列存儲的格式就是按照BGR的順序。
正是基于BGR已經被廣泛使用,于是早期OpenCV開發者就選擇BGR顏色格式,這也就成為了一種規范一直用到現在。
為什么選擇知識星球
AI 1000問會全部在知識星球中輸出,每天至少3期。為什么不選擇在公眾號輸出?原因有幾個。
(1) 發文次數限制。公眾號一天只能發一次文章,無法實時高頻次輸出。
(2) 無法實時討論。1000問的問題未必會有唯一答案,應該激發大家進行討論,社區更適合,而且對于好的回答,我們要給予獎勵。
(3) 內容太短。1000問內容都比較短,而我們公眾號的內容都是長文,所以不適合在公眾號進行連載。
(4) 方便大家保存。有三將所有的內容作成了卡片的形式,方便大家本地存儲,隨時查看。
(5) 希望大家進一步支持有三AI。我們也做了一年了,一直堅持只做高質量的原創,平臺內容都超過70萬字,因此也希望鐵桿粉絲們能夠在有三AI星球中繼續支持我們,共同優化我們的學習平臺。
話不多說了,需要的朋友就來參與吧。知識星球每日還有模型架構和數據集的干貨分享,以有三AI之名,承諾物超所值。
轉載文章請后臺聯系
侵權必究
有三AI知識星球官宣,BAT等大咖等你來撩
揭秘7大AI學習板塊,這個星球推薦你擁有
【知識星球】做作業還能贏獎金,傳統圖像/機器學習/深度學習盡在不言
【知識星球】顏值,自拍,美學三大任務簡介和數據集下載
【知識星球】數據集板塊重磅發布,海量數據集介紹與下載
【知識星球】貓貓狗狗與深度學習那些事兒
【知識星球】超3萬字的網絡結構解讀,學習必備
【知識星球】視頻分類/行為識別網絡和數據集上新
【知識星球】3D網絡結構解讀系列上新
【知識星球】動態推理網絡結構上新,不是所有的網絡都是不變的
【知識星球】Attention網絡結構上新,聚焦才能贏
總結
以上是生活随笔為你收集整理的有三AI 1000问回归,备战秋招,更多,更快,更好,等你来战!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【NLP】 聊聊NLP中的attenti
- 下一篇: 【知识星球】几个人像分割数据集简介和下载