解讀|數據科學領域常見的3種職業(yè)轉型方向

0 評論 1724 瀏覽 1 收藏 9 分鐘

本篇文章針對三種不同類型的人群:零基礎的初學者、軟件工程師、計算機數學或物理專業(yè)的應屆畢業(yè)生,給出相應的職業(yè)轉型建議。

在大學我學習物理時,每當遇到不理解的術語,我就會上網搜索,這時我常會用到的就是維基百科。

雖然維基百科很好用,但是上面很多文章都不適合我的水平。那些文章要不就是超出我的理解,或者對我來說太簡單了。這種情況時常發(fā)生,因此我從中總結的經驗就是,維基百科上的技術詞條很難既提供有效信息,又做到易于理解。

很多數據科學方面的職業(yè)建議也是如此,有些是針對完全零基礎的初學者;有些是針對初級數據科學家磨練技能;有些則針對資深的軟件工程師。而這容易讓許多想成為數據科學家的人群感到無從下手,他們不知道該如何花在哪里。

在本文中,我打算針對三種不同類型的人群給出相應的職業(yè)轉型建議。

第一類:零基礎的初學者

如果你剛剛進入數據科學領域,請記住該領域的發(fā)展速度非???,也許現在我給出的建議在你準備求職時已經過時了。如今數據科學的招聘標準與一兩年后的標準之間的差距可能會更大。

在明確這點的基礎上,如果你想進入數據科學領域,并且沒有任何編程方面的背景,我要給出的建議如下:

首先要保持開放的心態(tài)

如果你是一名初學者,那么你可能完全不知道數據科學的具體內涵。那么可以先和一些數據科學家聊一聊;關注相關的科學播客。成為一名數據科學家需要花費大量的時間和精力,因此只因為你認為自動駕駛汽車很酷就一頭扎進去,這并不是一個很好的理由。確保自己了解數據科學中不那么高大上的部分,數據處理和構建數據管道等,這些方面占數據科學家日常工作的大部分。

如果你決定繼續(xù)前進,這太好了!首先你要做的第一件事就是學習Python。參加一些在線課程,并盡快建立一個基礎項目。當你掌握一定Python技能時,學習如何使用Jupyter notebook。

在找工作時,一開始就從全面的數據科學職位并不是最好的。相反,可以選擇數據可視化或數據分析職位,這類職位市場需求量大,而且要求沒有數據科學家那么高。這些職位經常與數據科學家一起工作,當你獲得了一些經驗后,也可以著手向這個方向發(fā)展。

如何發(fā)揮自己的優(yōu)勢:

當你準備好找工作時,你會發(fā)現學會推銷自己在在數據科學中非常重要。你可能會擔心,因為你沒有任何專業(yè)經驗或計算機科學的研究生學位,推廣自己是一個難題。但這也可以成為你最大的優(yōu)勢:你是從零開始,自學成才的數據科學家,公司需要這些努力而且學習能力強的數據科學家。為此你需要符合自己的這種形象,不斷提高技能,解決一個個挑戰(zhàn),但當中的回報絕對是值得的。

第二類:軟件工程師

我遇到的想成為數據科學家的人中,可能有20%都是軟件工程師。一方面,有將代碼部署到生產和與開發(fā)團隊合作的相關經驗,這是非常重要的資產。另一方面,如今對全棧開發(fā)人員的需求非常高,有時公司會將軟件工程師歸為這個方向。因此想轉為數據科學家時,你要避免被當作軟件工程師,而不是數據科學家。

其他建議:

首先你可以考慮轉為專注后端或數據庫相關方向。熟悉數據管道是一個良好的開端,這可以幫助你構建核心數據操作技能組。

機器學習工程可能是最接近數據科學的職位,這更容易過渡。在求職時,你可以找哪些強調部署模型,或將其集成到現有應用程序的職位,這些職位將最有效地利用你現有的技能。

你很可能要建立機器學習或數據科學項目來打動雇主。利用你的軟件工程技能,將這些技能整合到可以向招聘人員展示的應用程序中。這特別有效,因為這更為明確,而且突顯了你作為全棧數據科學家的潛力。

要記住,在職業(yè)轉型時你的薪資很可能會減少。即使是高級軟件工程師,當他們轉行數據科學時,也需要從初級的職位開始。

如何發(fā)揮自己的優(yōu)勢:

最好的方法就是利用你在軟件開發(fā)方面的經驗。你已經知道如何編寫干凈、文檔記錄良好的代碼,以及該如何與他人協(xié)作,這是大多數初級職位求職者所缺乏的優(yōu)勢。

第三類:計算機科學、數學或物理專業(yè)的應屆畢業(yè)生

如果你是一名本科、碩士或博士生,你可能在統(tǒng)計學和數學方面有很好的基礎。但你可能從未申請過科技方面的工作,而且你不確定如何準備面試。此外,假設你讀書時一直在編程,你很可能無法寫出干凈、結構良好的代碼。

幾點建議:

你在讀書期間學的R語言還不夠。如果你是學物理的,那你的MATLAB或數學技能也是不夠的,去學學Python吧。

這些內容你需要盡快學習:協(xié)作版本控制,比如如何與其他人一起使用GitHub);容器化,比如如何使用Docker;開發(fā)運營,學習如何使用AWS或其他類似服務在云中部署模型;SQL也是必須的。

學習Python中的測試驅動開發(fā)。學習如何使用文檔字符串,如何將代碼模塊化,以及如何使用Jupyter notebook。

如果你在以數學為導向的領域,那么深度學習是一個很好的探索方向。要注意先從更傳統(tǒng)的“scikit-learn”型數據科學職位開始,然后轉向深度學習更容易。對你來說,最重要的是先入行,并盡快開始生產代碼。

如何發(fā)揮自己的優(yōu)勢?

如果你是數學或物理專業(yè),你最好的策略就是發(fā)揮有深厚理論知識的特定。為此,你需要能夠自信地解釋各種模型的原理,熟悉文獻中最新的文章。

結語

注意:我這里提供的建議并不能完全使用與所有情況。有些軟件工程師可能要學習的更多,而有些初學者有很好的數學基礎,更適合成為深度學習研究人員。但希望本文能你一個不錯的起點。

最后,無論你是軟件工程師,剛畢業(yè)的大學生,還是零基礎的初學者,你都要問自己一個關鍵的問題:哪種職業(yè)發(fā)展軌跡最接近你的情況?很多情況下,通過稱為數據分析師或數據可視化專家進入該領域都是不錯的選擇。

 

作者:eremie Harris,翻譯:Mika

本文由 @CDA數據分析師 翻譯發(fā)布于人人都是產品經理。未經許可,禁止轉載

題圖來自作者

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!