了解最新公司動(dòng)態(tài)及行業(yè)資訊
編譯:米卡
市場(chǎng)對(duì)數(shù)據(jù)工作者的要求很多:需要掌握機(jī)器學(xué)習(xí)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)、數(shù)據(jù)可視化、深度學(xué)習(xí)等知識(shí)。要掌握所有這些方面,至少需要學(xué)習(xí)數(shù)十種語(yǔ)言、框架和技術(shù),這顯然是困難的。
那么,數(shù)據(jù)工作者應(yīng)該如何合理分配時(shí)間,掌握哪些技能?
在本文中,我們搜索了工作網(wǎng)站,以找到數(shù)據(jù)相關(guān)工作(例如數(shù)據(jù)科學(xué)家)所需的技能。我分別分析了一般數(shù)據(jù)相關(guān)的技能和特定的語(yǔ)言和工具。
我們專(zhuān)門(mén)搜索了 、 、 和這些求職網(wǎng)站。
下表顯示了每個(gè)網(wǎng)站上發(fā)布了多少相關(guān)工作。
我分析了許多職位列表和調(diào)查,列出了最常見(jiàn)的技能要求。像“管理”這樣的詞不包括在內(nèi),因?yàn)樵S多職位發(fā)布都包括它。
所有搜索均針對(duì)美國(guó)地點(diǎn)、關(guān)鍵字中包含“數(shù)據(jù)科學(xué)家”的職位發(fā)布,并且使用完全匹配搜索來(lái)減少結(jié)果數(shù)量。但是,這種方法可確保結(jié)果與數(shù)據(jù)科學(xué)家的職位相關(guān)并影響所有搜索詞。
提供于
是招聘數(shù)據(jù)科學(xué)家的公司數(shù)量,而不是職位數(shù)量。我將排除這兩種分析,因?yàn)樗乃阉魉惴ㄊ?OR 的邏輯搜索,并且不能修改為 AND。如果您搜索“數(shù)據(jù)科學(xué)家”“”之類(lèi)的關(guān)鍵字,還不錯(cuò),但如果您搜索“數(shù)據(jù)科學(xué)家”“react.js”,它也會(huì)返回不雇用數(shù)據(jù)科學(xué)家的公司。
也被我排除在外。該網(wǎng)站稱(chēng),目前美國(guó)發(fā)布了 26,263 個(gè)“數(shù)據(jù)科學(xué)家”職位,但實(shí)際上顯示的職位不到 900 個(gè)。此外,發(fā)布的數(shù)據(jù)科學(xué)家職位不太可能是其他主流平臺(tái)的三倍。
最終分析使用通用技能分析400多個(gè)職位信息和特定技能分析200多個(gè)職位信息。有一些重復(fù),結(jié)果記錄在Sheet中。
我下載了 .csv 文件并將其導(dǎo)入。然后我計(jì)算了每個(gè)百分比,并對(duì)工作現(xiàn)場(chǎng)的數(shù)字進(jìn)行平均。
此外,我將結(jié)果與上半年發(fā)布的數(shù)據(jù)科學(xué)家工作研究進(jìn)行了比較,并結(jié)合了調(diào)查信息??梢钥闯觯恍┘寄軐?duì)數(shù)據(jù)科學(xué)家來(lái)說(shuō)越來(lái)越重要,而另一些則逐漸變得不那么重要。我們稍后會(huì)詳細(xì)看到。
交互式圖表和分析可以在我的 .我用它來(lái)進(jìn)行可視化,在寫(xiě)這篇文章的時(shí)候,使用and有一些困難,在最終文檔中有說(shuō)明
文檔
1.一般技能
以下是雇主最希望數(shù)據(jù)科學(xué)家具備的一般技能。
結(jié)果表明,數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等通用技能是數(shù)據(jù)科學(xué)家工作的核心。從數(shù)據(jù)中收集分析見(jiàn)解是數(shù)據(jù)科學(xué)的主要功能。機(jī)器學(xué)習(xí)是關(guān)于開(kāi)發(fā)能夠產(chǎn)生預(yù)測(cè)性能的系統(tǒng),它是一項(xiàng)非常流行的技能。
數(shù)據(jù)科學(xué)家需要統(tǒng)計(jì)和計(jì)算機(jī)科學(xué)技能也就不足為奇了。統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)和數(shù)學(xué)也是大學(xué)專(zhuān)業(yè),這也可能增加這些技能的使用頻率。
有趣的是,近一半的工作要求都提到了溝通技巧。數(shù)據(jù)科學(xué)家需要能夠交流自己的見(jiàn)解并與他人協(xié)作。
人工智能和深度學(xué)習(xí)并不像其他術(shù)語(yǔ)那樣頻繁出現(xiàn)。它們是機(jī)器學(xué)習(xí)的一個(gè)子集,深度學(xué)習(xí)用于越來(lái)越多的機(jī)器學(xué)習(xí)任務(wù)it技能服務(wù),以前主要使用其他算法。今天,大多數(shù)用于自然語(yǔ)言處理問(wèn)題的最佳機(jī)器學(xué)習(xí)算法都是深度學(xué)習(xí)算法。我預(yù)計(jì)深度學(xué)習(xí)技能在未來(lái)的職位發(fā)布中會(huì)越來(lái)越明確,機(jī)器學(xué)習(xí)會(huì)越來(lái)越類(lèi)似于深度學(xué)習(xí)。
那么雇主希望數(shù)據(jù)科學(xué)家使用哪些特定的軟件工具?接下來(lái),我們來(lái)看看問(wèn)題。
2.技術(shù)技能
以下是雇主最希望數(shù)據(jù)科學(xué)家掌握的前 20 種特定語(yǔ)言、庫(kù)和技術(shù)工具。
讓我們簡(jiǎn)要介紹一下最常見(jiàn)的技術(shù)技能。
是最流行的語(yǔ)言。這種開(kāi)源語(yǔ)言已經(jīng)變得非常流行。對(duì)于初學(xué)者來(lái)說(shuō),該語(yǔ)言很容易上手,并且有很多支持資源。絕大多數(shù)數(shù)據(jù)科學(xué)工具都與它兼容。它是數(shù)據(jù)科學(xué)家使用的主要語(yǔ)言。
R 語(yǔ)言也不甘落后。它曾經(jīng)是數(shù)據(jù)科學(xué)的主要語(yǔ)言,R 的需求量仍然很大。這種開(kāi)源語(yǔ)言源于統(tǒng)計(jì)學(xué),很受統(tǒng)計(jì)學(xué)家的歡迎。
或者說(shuō),R 語(yǔ)言是從事數(shù)據(jù)科學(xué)工作的必備語(yǔ)言。
SQL 的需求量也很大。 SQL 代表查詢(xún)(結(jié)構(gòu)化查詢(xún)語(yǔ)言),是與數(shù)據(jù)庫(kù)交互的主要方式。 SQL 在數(shù)據(jù)科學(xué)領(lǐng)域有時(shí)會(huì)被忽視,但如果您正在尋找數(shù)據(jù)科學(xué)領(lǐng)域的工作,這項(xiàng)技能很重要。
接下來(lái)是 Spark,兩者都是大數(shù)據(jù)的開(kāi)源工具。
是一個(gè)開(kāi)源軟件平臺(tái),用于分布式存儲(chǔ)和分布式處理大型數(shù)據(jù)集,這些數(shù)據(jù)集是用商用硬件構(gòu)建的計(jì)算機(jī)集群。
Spark 是一個(gè)快速的內(nèi)存數(shù)據(jù)處理引擎,具有強(qiáng)大且富有表現(xiàn)力的開(kāi)發(fā) API,使數(shù)據(jù)工作者能夠在需要快速迭代訪問(wèn)數(shù)據(jù)集的情況下高效地執(zhí)行流式處理、機(jī)器學(xué)習(xí)或 SQL。
與 R 和 SQL 相比,很少有求職者具備這些技能。如果您有使用 Spark 的經(jīng)驗(yàn),那么您更有可能在求職中取得成功。
接下來(lái)是 Java 和 SAS。我驚訝地發(fā)現(xiàn),這兩種語(yǔ)言在職位描述中也出現(xiàn)得非常頻繁。一般來(lái)說(shuō),Java 和 SAS 在數(shù)據(jù)科學(xué)界沒(méi)有受到太多關(guān)注。
接下來(lái)是。這個(gè)分析平臺(tái)和可視化工具功能強(qiáng)大、易于使用且越來(lái)越受歡迎。它有一個(gè)免費(fèi)的公共版本,但如果您想保持?jǐn)?shù)據(jù)的私密性,則需要花錢(qián)。如果您不熟悉,強(qiáng)烈推薦 Udemy 的 10 A-Z。
下面的技能列表顯示了更多的語(yǔ)言、框架和其他數(shù)據(jù)科學(xué)軟件工具。
根據(jù)我們的分析和調(diào)查,R 和 SQL 是最受歡迎的技能。根據(jù)局方開(kāi)發(fā)者調(diào)查分析,近年來(lái)R、Java、SAS的使用量呈下降趨勢(shì),呈明顯上升趨勢(shì)。
3.建議
根據(jù)這些分析的結(jié)果,以下是給數(shù)據(jù)科學(xué)家的一些建議。
當(dāng)雇主在尋找熟練的數(shù)據(jù)科學(xué)家時(shí),他們還希望候選人掌握常用的數(shù)據(jù)科學(xué)庫(kù):numpy、-learn 和 .如果您正在學(xué)習(xí)這些工具,我建議您使用以下資源:
如果你想學(xué)習(xí)深度學(xué)習(xí),我建議先學(xué)習(xí) Keras,然后再學(xué)習(xí) or。 Deep with 這本書(shū)是學(xué)習(xí) Keras 的絕佳資源。
除此之外,我建議您了解自己感興趣的內(nèi)容,盡管這里需要考慮時(shí)間分配等因素。
如果您正在通過(guò)工作網(wǎng)站尋找數(shù)據(jù)科學(xué)家的工作it技能服務(wù),我建議您嘗試一下,它提供最多的工作信息。
同時(shí),我建議您創(chuàng)建一個(gè)在線作品集,以很好地展示您的數(shù)據(jù)科學(xué)技能。還建議您在個(gè)人資料中注明您的技能。
24小時(shí)免費(fèi)咨詢(xún)
請(qǐng)輸入您的聯(lián)系電話,座機(jī)請(qǐng)加區(qū)號(hào)