深·觀察深·觀察

數(shù)據(jù)挖掘如何就業(yè)？

2016年11月08日 18:42 | 來源：芝諾數(shù)據(jù)分析mp

分享到：

1. 數(shù)據(jù)挖掘主要是做算法還是做應用？分別都要求什么？

這個問題太籠統(tǒng)，基本上算法和應用是兩個人來做的，可能是數(shù)據(jù)挖掘職位。做算法的比較少，也比較高級。

其實所謂做算法大多數(shù)時候都不是設計新的算法（這個可以寫論文了），更多的是技術選型，特征工程抽取，最多是實現(xiàn)一些已經(jīng)有論文但是還沒有開源模塊的算法等，還是要求扎實的算法和數(shù)據(jù)結構功底，以及豐富的分布式計算的知識的，以及不錯的英文閱讀和寫作能力。但即使是這樣也是百里挑一的，很難找到。

絕大讀書數(shù)據(jù)挖掘崗位都是做應用，數(shù)據(jù)清洗，用現(xiàn)成的庫建模，如果你自己不往算法或者架構方面繼續(xù)提升，和其他的開發(fā)崗位的性質(zhì)基本沒什么不同，只要會編程都是很容易入門的。

2. 北上廣以外的普通公司用的多嗎？待遇如何？

實際情況不太清楚，由于數(shù)據(jù)挖掘和大數(shù)據(jù)這個概念太火了，肯定到處都有人招聘響應的崗位，但是二線城市可能僅僅是停留在概念上，很多實際的工作并沒有接觸到足夠大的數(shù)據(jù)，都是生搬硬套框架（從我面試的人的工作經(jīng)驗上看即使是在北上廣深這種情況也比較多見）。

只是在北上廣深，可能接觸到大數(shù)據(jù)的機會多一些。而且做數(shù)據(jù)挖掘現(xiàn)在熱點的技術比如Python，Spark，Scala，R這些技術除了在一線城市之外基本上沒有足夠的市場（因為會的人太少了，二線城市的公司找不到掌握這些技術的人，不招也沒人學）。

所以我推測二線城市最多的還是用JAVA+Hadoop，或者用JAVA寫一些Spark程序。北上廣深和二線城市程序員比待遇是欺負人，就不討論了。

編輯：梁霄

01 02 03

關鍵詞：數(shù)據(jù) 挖掘學習公司算法機器生態(tài)圈