在数据科学家这个岗位刚刚出来的时,用一句话概括数据科学家就是学统计的会编程,学编程的会统计和机器学习。但是随着时代的发展,四五年的时间已经过去,数据科学家的岗位已经有了根本性的变化。
Data Scientist, Analytics以Facebook为例,可以看到目前数据科学家已经进行了许多细分。Facebook的数据科学家在整个decision making的过程中是使用数据驱动的方法去支持整个Facebook的运营。
在工作内容方面,我们可以看到第一个要求就是Forecasting,forecasting大家都比较熟悉了,为预测的一个功能,相当于作为一个数据科学家对数据进行分析,能够预计对用户习惯,在什么场景下使用什么产品。接下来就是设计和评估实验,比如说我们有一个假设,那么我们会通过一个统计的方法去测试这个假设是否真实存在。
另外,数据科学家需要深度的进入decision making的过程,需要提示整个产品研发的方向,可以捕捉用户变化,用户行为变化以及长期的市场机会。同时建立模型也是必须可少的技能,但是在Facebook的数据科学家的实际工作当中,大部分还是使用统计的方法。
数据科学家需要会的工具有Hadoop,Hive ,MySQL,Oracle,Vertica等。这里还提到了Automating analyses,这个是大量建立数据化的系统,因为数据科学家需要把自己的报告过程作为自动化的方法,这样可以确保在产品开发的过程中公司的其余平行部门比如市场部门,产品部门,开发部门,甚至是公司的战略部门可以理解并看到数据与分析的方法。
AI Model Measurement Job Description接下来分享一个同属于Facebook数据科学家的岗位,但是这个岗位与前面的岗位差别就较大了,因为这个岗位是主要做模型的。这个岗位主要是去研究机器学习的表现,并且把结果分享到不同的部门,从而去解决复杂的、困难的且比较模糊的领域。这个工作岗位要求较高的原因就是在做别人分析工作的校验。
通过这两个Facebook数据科学家的分享,目前数据科学家已经逐渐变成了比较垂直的行业,可以看到数据科学家一个岗位在Facebook内就被分享成了多个职位。
再用Facebook的竞争对手Snapchat做个例子。
Snapchat Data Scientist Job DescriptionSnapchat里数据科学家的岗位是cross-function、cross-team的类型。Snapchat的数据科学家与产品管理,AR设计,产品工程相互沟通合作。那么这个职位的特殊地方在那里呢?这个数据科学家岗位独特性在于需要较强的数据分析能力以及数据洞察力的能力。
在技能要求里,数据科学家需要熟练使用SQL以及大数据语言,同时Python,Looker,Tableau也在要求里面。从这个岗位的要求可以知道Snapchat整个数据分析团队的框架。