【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?
文章首發于微信公眾號《有三AI》
【雜談】如何學會看arxiv.org才能不錯過自己研究領域的最新論文?
今天介紹一個用于追蹤arxiv.org平臺上最新論文的工具arxiv-sanity。
作者&編輯? | vivian&言有三
?
01 什么是arxiv-sanity
我們都知道arxiv.org是一個非常大的預印本資源庫,里面有大量的最新的論文,但缺點是瀏覽、搜索和排序不是很方便。這個庫每天會更新大量的論文,如果只是通過手動搜索和瀏覽效率就太低了。
這樣特別容易讓人和一些優秀的有趣兒的論文擦肩而過,這些論文可能是和你的研究領域相關的。所以接下來你可能就能猜到這個arxiv-sanity是干什么用的了。
網址為:http://www.arxiv-sanity.com/
?
02 arxiv-sanity的基本功能
1、便捷的預覽
首先,arxiv-sanity在展示最新更新的文獻時,提供了可讀性更強的縮略圖預覽模式方便讀者來快速預覽,并在縮略圖下方的綠色區域顯示文獻的abstract 。
2.感興趣相關度排序
更重要的是,它可以讓你根據自己的閱讀興趣對文獻進行重新排序。比如這里有一篇關于對人體姿態估計的文獻是你感興趣的,點擊右上角的' rank by tf-idf similarity to this',文獻列表會按照與這篇文章的相關度進行排序,接下來我們會看到arxiv上所有關于人體姿態識別的論文。這個功能是基于TF-DF算法來實現的,效果很好。(一種文檔特征提取法,它是由Salton在1988 年提出。其中TF稱為詞頻,? IDF稱為反文檔頻率, 感興趣的可以自己百度。)
3.個人圖書館
如果你是注冊用戶,在登錄賬戶之后,還可以把自己感興趣的文獻收藏到你的個人圖書館。比如,我喜歡上圖的這篇人體姿態估計的文獻,點擊右上角存盤圖標,(看到了嗎?就在' rank by tf-idf similarity to this'下面),點擊之后就把這篇文獻存在我自己的library里面了。
這時,剛剛黑色的圖標變成了藍色,點擊上面的library標簽,可以看到它出現在了最上方。你可以像這樣收藏很多自己感興趣的文獻。想刪除的時候,在自己的library里面再次點擊那個圖標就可以刪除了。
4.感興趣推薦系統
另外,library不光是用來收藏和跟進自己領域的論文更新進度,arxiv-sanity可以通過你收藏的內容給你推薦你也許會感興趣的論文。具體怎么實現的呢?library內部的論文會被標記為positive,Library之外的論文標記為negative,然后arxiv-sanity基于bigram文本特征提取來訓練你的personal SVM,然后在reconmmended 標簽里推薦給你。點擊recommended標簽你就可以看到最近兩周arxiv-sanity認為你會感興趣的文獻。當然,你也可以通過設置時間來自己篩選,如去年,上個月,上周,昨天和全部,看看自己有沒有錯過什么文獻。
5.看看大家都在看什么
最后,再介紹一下“top recent”標簽。這里面展示的是arxiv-sanity上被用戶收藏最多的文獻。這些文獻也可以按照時間來篩選。即使你不是注冊用戶,你也可以瀏覽到大家都在收藏的文獻。
6.網站代碼開源
在頁面上方可以看到,arxiv-sanity只展示machine learning的論文,如CV,CL等ML的分支領域,因為這是arxiv-sanity作者自己的研究領域。(對,這是人家閑暇時間寫的)。作者已經把arxiv-sanity開源了,所以如果你想根據自己的研究領域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。
各分支領域縮寫翻譯如下:
cs.CV: Computer Vision and Pattern Recognition 計算機視覺與模式識別;
cs.CL:Computation and Language 計算語言學;
cs.LG:Learning 機器學習(計算機科學);
cs.AI:Artificial Intelligence 人工智能;
cs.NE:Neural and Evolutionary Computing 神經與演化計算;
stat.ML:Machine Learning 機器學習(統計學)。
好了,就是這樣,趕快用起來吧。
?
總結
能夠及時地找到自己感興趣領域里最新最全的資料,本身就是一種學習能力,如果你有更好的推薦方法和建議,不妨來有三AI分享,一起成長吧。
轉載文章請后臺聯系
侵權必究
感謝各位看官的耐心閱讀,不足之處希望多多指教。后續內容將會不定期奉上,歡迎大家關注有三公眾號 有三AI!
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AI-1000问】softmax lo
- 下一篇: 【chainer速成】chainer图像