登录
  • #数据科学
  • #2021转DS前景

为什‍‌‍‍‍‌‌‌‍‌‍‌‍‌‌‍‍‍‌‌‌‍‍‌‌‌‍‌‌‍‍‌么会说Data内卷?

staftermath
8812
33
发现居然有这么一个话题,在这个话题下看到不少说Data内卷的。作为一个相关行业的人,希望能抛砖引玉一下。

首先不太习惯统称Data。我一看是看到这个标签以为是做数据的(Data Engineer)还挺惊讶什么时候DE也有人说内卷了。看了几篇文章之后发现说的是Data science track的。并且更多的是说data analysis。从我个人的角度来看,DA/DS/MLE这个行业从来都没内卷过,或者说,从来都是这么竞争激烈。只不过随着大流名字换了而已。20年前叫BI,后来叫DA,现在直接叫DS了。然后各式各样的DS都放一起,大家就觉得这要求这么高,简历都过不去,卷的厉害。我以前在不少地方也提到过,一些大厂硬生生把DA也叫DS,搞得很多人都很焦虑。一些人认为Title叫DS以后可能好找工作,其实不一定,时间长了大家都明白。可能5,6年前看JD上说DS还有不少人认为是做ML甚至AI,现在DS职位基本上就是DA,工作依然难找。所以并不是卷的厉害,其实只是职位名字换了一个,让很多人很迷惑而已。

当然我要强调一下,DA, DS, MLE什么的,各人有各人的爱好和目标,没有高下之分。我个人对这三个方向的需求并没有饱和太多,我甚至可以说,随着行业的成熟,对各个方向的人才的需求反而更强烈,只是现在公司都很清楚他们要什么。你如果一个半吊子进去,一面就被揪出来了。Tech行业讲究的是与时俱进,是你懂的新东西和新毕业生懂的新东西比起来是不是更多更精。作为DS,当年面试问SVM,手搓KNN,深挖additive models不是罕见的事情,现在业界基本没人用SVM,KNN基本上也就个baseline,additive models是什么?会熟练安装使用lightgbm, xgboost就行,管他是不是additive。卷吗?这么一看感觉要求的还更少了。

你想有竞争力,长远来看只能提高自身知识水平,一方面来说get out of your comfort zone。不要认为我就想做这个,就完全不考虑其他的。别老在鸡毛蒜皮的地方研究回字的几种写法,KNN几种初始化方法,SVM kernel哪家强之类的。作为DA,多学学ML, 作为DS,多关心一下business和deployment,作为MLE,自己也想办法做做DA, DS的事情从他们角度来设计你的框架。

另一方面来说也要明白各个方向的贡献具体在哪儿,强化自己在那些方面的能力,不要以为光知道一些其他方向的知识,就对本方向有决定性优势了:



  • 以前可能觉得作为一个DA,我还懂点boosting tree,所以我更有优势。公司可能也以为赚到了一个能做各种东西的人。现在组里面可能完全不关心你会不会boosting tree,你这点优势就没有意义,你要明白你的分析怎么能帮助其他人,比如怎么通过分析找出一些feature。

  • 以前可能作为一个DS,我会写点shell script,除了写python script我居然还会写OOP代码,所以我更牛逼。现在有些公司可能只要求你会调参做POC,不关心你这半吊子的python代码,deploy扔给MLE,所以你这点优势可能又没意义了。

  • 以前作为MLE可能会jenkins就飞起了,所有CI/CD可能还得自己搭,写个robust的流水线可牛逼了。现在这种framework满天飞,说不定写个config就能行。而你需要想办法适应组里DS做的东西来优化和部署模型,你的优势可能还不如一个跟DS聊的溜的人。



你找工时候永远会看到自己更喜欢的职位要求更高,觉得明明自己已经很有经验了,为什么还找不到合适的。你永远在找更senior的职位,所以永远会觉得要求怎么越来越高,前几年似乎没那么高。从我个人的找工作经验来看(MLE),我会觉得为什么所有看到的都是DS?对口的职位那么少。之前更想做模型的时候,我会觉得为什么那么多职位都是DA,A/B testing,SQL。但是真的一路走过来的人会发现,前几年做A,B,C时候需要花很大力气,现在什么都有现成的工具,组里面的process也越来越完善,做起来其实比之前简单的多。所以DA, DS和MLE其实是都在把以前的process标准化,从而研究更新的需求。就算是新人进去,你要做的也仅仅是学习标准化的流程,等你学完了,你也接触到了更新的需求和解决方案,你也差不多要去下一步了。

最后补充一句,如果你的爱好是做技术,千万要注意不要太花时间在non-transferable的知识上,除非你就想做业务,不然永远要增强自己技术。技术能在另一行使用,business knowledge不行。作为做tech的,路子不要走死,行业会死,技术只会更新,打好底子,学新技术举一反三没有问题。
33条回复
热度排序

发表回复