首頁>國企·民企>深·觀察深·觀察
數(shù)據(jù)挖掘如何就業(yè)?
1. 數(shù)據(jù)挖掘主要是做算法還是做應用?分別都要求什么?
這個問題太籠統(tǒng),基本上算法和應用是兩個人來做的,可能是數(shù)據(jù)挖掘職位。做算法的比較少,也比較高級。
其實所謂做算法大多數(shù)時候都不是設計新的算法(這個可以寫論文了),更多的是技術選型,特征工程抽取,最多是實現(xiàn)一些已經(jīng)有論文但是還沒有開源模塊的算法等,還是要求扎實的算法和數(shù)據(jù)結構功底,以及豐富的分布式計算的知識的,以及不錯的英文閱讀和寫作能力。但即使是這樣也是百里挑一的,很難找到。
絕大讀書數(shù)據(jù)挖掘崗位都是做應用,數(shù)據(jù)清洗,用現(xiàn)成的庫建模,如果你自己不往算法或者架構方面繼續(xù)提升,和其他的開發(fā)崗位的性質(zhì)基本沒什么不同,只要會編程都是很容易入門的。
2. 北上廣以外的普通公司用的多嗎?待遇如何?
實際情況不太清楚,由于數(shù)據(jù)挖掘和大數(shù)據(jù)這個概念太火了,肯定到處都有人招聘響應的崗位,但是二線城市可能僅僅是停留在概念上,很多實際的工作并沒有接觸到足夠大的數(shù)據(jù),都是生搬硬套框架(從我面試的人的工作經(jīng)驗上看即使是在北上廣深這種情況也比較多見)。
只是在北上廣深,可能接觸到大數(shù)據(jù)的機會多一些。而且做數(shù)據(jù)挖掘現(xiàn)在熱點的技術比如Python,Spark,Scala,R這些技術除了在一線城市之外基本上沒有足夠的市場(因為會的人太少了,二線城市的公司找不到掌握這些技術的人,不招也沒人學)。
所以我推測二線城市最多的還是用JAVA+Hadoop,或者用JAVA寫一些Spark程序。北上廣深和二線城市程序員比待遇是欺負人,就不討論了。
編輯:梁霄
關鍵詞:數(shù)據(jù) 挖掘 學習 公司 算法 機器 生態(tài)圈