我是如何用6个月,从0编程经验变成数据科学家的?
來源 |?medium
編譯 | 武明利
責編 |?Carol
出品 | CSDN云計算(ID:CSDNcloud)
我叫Kate,剛從長達 8 年的學習和艱苦的工作中走出來,沒有任何預兆。你可能想問,為什么有人會這么做?不得不說,是我的老板讓我崩潰了,他知道我會做出改變。
當我男朋友建議我去做一名數據科學家時,我覺得他瘋了,因為我對編程一竅不通,他高估了我的能力。
結果大約在兩周后,我的朋友安娜也提出了同樣的建議。這倒是讓我再次深思了這個可能性,為什么不嘗試一下呢?抱著這樣的想法,我決定重新開始,將自己改造成一個數據科學家。
從0 開始學習,我的目標是成為數據科學家
我想按照自己的進度學習,所以我決定參加在線課程。我認為,擁有神經科學博士學位的我,可能受過足夠的正規培訓,可以從事一份數據科學的工作。我只是需要一些實用的技能。
這個故事將描述我修過的四門不同的課程,以及它們是如何讓我在硅谷的一家醫療初創公司從事數據科學工作的。
當時,我遇到的大多數在線課程都是免費的。所以我挑戰自己,在不花錢的情況下獲得我需要的技能——我還能說啥,其實我就是摳門唄。
- “我曾經認為相關性意味著因果關系。直到我去上統計學課,現在我不這么認為了。”
- “聽起來這門課很有幫助?”
- “或許是吧。”
基本的技能
當我從加州大學舊金山分校的博士后畢業時,我沒有任何編程經驗。我在所有的研究中都使用了統計學,但規模較小。我之前分析的所有數據集都是我在實驗室中自己生成的。因此,觀測次數非常少。我需要學習更大規模地編程和分析數據。
開始編程
當我決定要成為一名數據科學家時,我最想學的就是如何編寫計算機代碼。因為我從來沒有寫過代碼,它是一個完全未知的事情。應該這么說:如果我真的很討厭編寫代碼,那么數據科學就不適合我,也就是說,如果你對這個事情根本不感興趣,那么沒必要去學習也不適合去從 0 開始學習。所以,對于我來說這是一個很好的開始。
我很幸運,因為我的合伙人Ben在很多技術領域工作過,能夠為我指明正確的方向。他建議Python可能最適合我。Python是出色的數據分析工具,用途廣泛,并且可以很好地處理大型數據集,于是我決定這就是我的起點。
學習編程
課程 1、Codecademy
為了開始學習編程,我使用了Codecademy。從Python入門開始,但是我不確定我完成的課程是否仍然像2014年那樣存在。如果我現在要使用Codecademy開始學習Python,我可能會選擇“使用Python分析數據”課程。
我發現Codecademy是一個很好的起點,主要優勢是能夠在瀏覽器中直接編寫代碼,因為在我的計算機上正確地安裝編程環境仍然是我的致命弱點,因此我很高興在一開始時先避免它。令人欣慰的是,如果我的代碼不能工作,只是因為語法問題,而不是因為環境設置錯誤。
我也喜歡用Codecademy一次做幾分鐘的工作。如果我有一些空閑時間,我會登錄和刷一些題目,因為這些題目都在那里等著我。這種零星的進展意味著我并不用害怕陷入其中。
在我完成課程時,只有很少的Codecademy上的課程是免費的。我對在線免費課程的質量感到驚訝。
學習完Python的基礎知識之后,我需要開始提升統計經驗,并學習更大規模地分析數據。
學習數據分析
課程 2、約翰·霍普金斯的Coursera數據科學專業
其次,我獲得了約翰·霍普金斯大學的Coursera數據科學專業知識。當時,你可以免費制作榮譽代碼證書版本,并且僅在需要認證證書時才需要付費。
對我來說,認證的證書似乎并不重要。反而,我需要能夠在技術面試中展示該課程中教的技能。因此,我選擇了專業版的免費版本。
對我來說,一個缺點是該系列課程是用R語言教的。R是一種用于統計分析的出色編程語言,受到學術界的青睞。然而,我想為了數據科學而學習Python。我認為Python在我想工作的創業公司中會更有用。
我研究了一些Python數據分析課程,但是它們似乎驗證了我還沒有足夠相關的知識量。看起來這些課程大多數都是針對想要過渡到數據科學的軟件工程師準備的。因此,他們假設你具有扎實的編程技能,并且已經知道如何設置Python環境。
我喜歡Coursera數據科學專業的主要方面是,它從一開始就有有關如何在Brst課程安裝R和R studio的步驟說明。這樣使在知道不會有任何技術問題的情況下,很容易處理后續的課程。
約翰·霍普金斯大學數據科學專業的另一個適合我的方面是,它是由公共衛生部門教的。我在醫療科學領域的專業知識使我能夠很容易地遵循他們列舉的例子。他們舉例說明了空氣質量對哮喘的影響以及與醫療保健相關的其他數據集。因此,我可以專注于課程內容,而不是迷惑在為數據分析提供的案例中。
這一系列的課程讓我對數據科學工作的主要方面有了基本的了解。它涉及到R編程、基本數據清理、分析、回歸和機器學習。我真的很喜歡學習編程以及如何使用代碼來分析數據,因此鼓勵我繼續學習。
關注招聘信息
在培訓的這一階段,我開始詢問圈子里的朋友,是否可以把我介紹給其他在舊金山從學術界過渡到數據科學的人。有幾個人幫我聯系上了,所以我安排了盡可能多的面試。
一位朋友把我介紹給了Modcloth的一位數據科學家,她和我走了一條相似的路。她曾是一名神經學家,我發現她的建議特別有用,她主要建議學習SQL。
學習查詢數據庫
課程 3、DB5 SQL斯坦福大學在線
約翰·霍普金斯大學的Coursera數據科學專業課程完全沒有涉及SQL。她說她每天的大部分工作都是查詢數據庫。她必須為業務開發和營銷團隊提取觀點,所以只有一小部分時間用于統計分析和機器學習。
我聽從了她的建議,并在斯坦福在線網站(Stanford Online)上開始了一個自定進度的SQL課程。在我修過的所有課程中,這是我的最愛。我之所以喜歡它,是因為老師非常出色,而且會使用簡單的示例來解釋這些概念,她還以多種不同的方式解釋了每個概念。
從那以后,我向很多人推薦了這門課程,因為我認為良好的SQL基礎對于任何數據科學家都是必不可少的。我接觸過的數據科學課程沒有涉及如何使用SQL從數據庫獲取數據。我認為這是一個巨大的疏漏。大多數課程都有準備供學生使用的CSV數據,但是根據我的經驗,行業數據科學工作很少有這種情況。
完成斯坦福大學SQL課程后,我便開始申請數據科學職位。那時,我回到澳大利亞,開始在舊金山灣區對初創公司進行Skype面試。在面試的同時,我想繼續發展自己的技能。
鞏固概念
課程 4、edX數據分析基礎
然后,我用edX的R語言學習了數據分析的基礎課程。修改我在Coursera課程中已經學過的很多概念,這是很有幫助的。
我相信從不同的老師那里學習概念可以提供新的見解。第二次學習時,更容易理解統計數據和機器學習概念。通過這門課,我覺得我有了更深的理解。
在我修這門課的時候,我成功獲得了舊金山的一家醫療初創公司入職邀請,我拿到了工作簽證,然后移居美國。
得到數據科學的工作
我認為我在最后的面試中很成功,因為我具有良好的編程能力和良好的統計學理解,但更重要的是我有醫療保健領域的知識,實驗設計和科學方法的專業知識。
在我看來,正是這些其他的方面讓我的應用程序脫穎而出,并讓這家初創公司給了我一個機會。我的資歷很淺,對工作培訓的要求更高。我認為我所完成的所有課程都足以讓招聘團隊考慮我,而且我在醫療保健領域的經驗也讓我脫穎而出。
因此,如果你想把職業生涯轉向數據科學,我建議你去找一家你現有的領域知識非常有價值的公司。
我學到了什么
在我開始新的數據科學工作之前,我希望填補我知識上的用命令行使用git的一個主要空白。我以前從未使用過終端或命令行,也不知道如何使用git將代碼提交到公司的Github倉庫。
幾個工程師花了不少時間才讓我跟上進度。我希望在開始之前至少知道如何使用它,這樣我就不會浪費他們寶貴的時間。我的同事們都很棒,他們似乎并不介意教我,但在最初的幾天里,我確實感到有點負擔。
我最終還是趕上了進度,而且發現“很難的命令行代碼學習”非常有用。
如果你正在考慮采用類似的方法進入數據科學領域,我鼓勵你繼續前進!這對我來說絕對是正確選擇。當然,不同的人會以不同的方式學習,但是,如果你有自律性來學習和完成入門,那么通過在線課程自學數據科學當然是可行的。
想知道Python如何支援抗“疫”嗎?2月15日(全天)Python線上峰會免費學!6場精華分享,用代碼“抗”疫!
詳細日程請見下方海報
兩種報名方式:
1.點擊“立即報名”--結算時使用優惠碼“pythonday”,價格變為“0"元--提交訂單,免費參與
2.點擊“立即報名”--付款“19元”報名--會議官網公示姓名--為疫區捐款表心意
福利掃描添加小編微信,備注“姓名+公司職位”,入駐【CSDN博客】,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習! 推薦閱讀:數據分析如何幫助揭示冠狀病毒的真相? 一文助你快速理解ZooKeeper 螞蟻金服AAAI收錄論文曝光,動態網絡剪枝方法、無語預訓練的網絡剪枝技術有重大突破 2.7 億學生宅家上課,家長有意見了...... 2020 年,遠程辦公太難?技術大佬齊支招! 2020年區塊鏈領域最具影響力人物Top 20 真香,朕在看了!總結
以上是生活随笔為你收集整理的我是如何用6个月,从0编程经验变成数据科学家的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从零单排HBase 02:全面认识HBa
- 下一篇: 阿里云与MongoDB达成战略合作,成“