Home › Forums › Chinese Forum › 大数据分析 › 【转贴】说说Facebook 的 Data Scientists 职位
-
Source:
http://www.mitbbs.com/article_t/Statistics/31379771.html
Facebook 有两种 data scientist, 一种是core data scientist,招的人比较像MSR,或者 Google Research 那种 profile。另一种是 product data scientist。我下面主要针对第二种说说。
先说analytics org,基本可以概括成分散集中制: 工作时分散的,管理是集中的。Facebook大体上可以分成 product org 和 business org。后者是 sales/HR/marketing/Finance 等等那些部门,而data scientists 是属于product org。对于product org,又分成众多的 product units, 大体有100多个。每个team 基本是4个主要pillars组成:
Engineers
Product Manager
Analysts (data scientists)
Product designers所以整个 Facebook一共有一百多个 data scientists,工作领域是分散在不同 units,但是 reporting structure 是集中的。所以hiring 也是集中的。面试Facebook的 data scientist,是 general hiring pool,不分组的,进来以后再 allocate。这点上和 engineers, product managers 什么的都相同。之所以要这样,是为了让analytics保持独立性,更好 的为产品提供 insights,而不完全受product的制约。换句话说,你的老板是 analytics head,而不是你工作的那个produc t的 head。再有就是这样会形成 analytics community,容易share resources, best practices 等等。
再说 data scientists 的日常工作组成,基本分四项 :
(1) data pipelines:这包括各种ETL,处理数据,reporting, dashboard 等等
(2) product operation:包括监测和产品的走向,own key metrics,和各种ad hoc 的 product support。这种可以简单概括成被动分析,就是有人问你关于产品问题,你得 回答。
(3) strategic analysis:各种exploratory的分析,提供insight来帮助产品 set roadmaps。这种可以简单概括成主动分析,就是没人问你问题,你自己要问你合适的问 题,并且回答,主动为产品提供发展方向。
(4) cross functional influencing:有了insights,要和另外几大 pillars 打交道( eng, pm等等),所以influencing 必不可少。 可以想想,每个产品的analysts,都是和那个产品的团队坐在一起的, 而不和你老板 坐在一起。同一个analytics team里的人,往往是分散坐在不同的楼里,而你老板可能 是坐在他最involve的一个产品那个组里。Analytics team 有weekly meeting,但是你 更多的时候是 meet 同一product team里的人。
- This discussion was modified 4 years, 1 month ago by Datura.
-
再说一下 data scientists 面试的要点:
(1) 有”一定” 的技术能力,Python + big data (比如Hive/SQL)。R 也可以,但是很多面试题用 R 来做恐怕有些困难,会Python是很有帮助的。不需要啃算法书,CS面试那种算法题不会考,我们只需要知道你有独立 handle data 的能力,遇上事情能有技术能力 unblock你自己,光会SQL是不行的。
(2) 有 “极好” 的分析能力。 这是analysts的本质,也是面试的重点。
给你一个问题(open ended),看能不能 think analytically and structurally。随便举个例子:
怎么用FB数据分析日本核电站爆炸的影响?这里要自己 formalize这个问题,提出假设,思考可以用哪些数据,怎么分析,没有某些数据怎么替代等等一系列步骤。
(3) 有”极好”的product sense。因为实际工作中,很多时候没人问你问题,你要自己问问题,问正确的问题,需要对产品有很好的理解。这里也举个例子:
假如印度的某个城市停电三天,你觉得对FB会有哪些影响?这些影响对Twitter会如何?回答这个问题,先得对行业和产品有一定了解,否则根本无从下手。
当然一些其他的东西,比如对数字的敏感度,交流的能力等等很重要,但是那些都表现在上面这些回答当中。
很大程度上,FB 的 data scientists 需要的是通才, 而不是专才,从上面这些问题就能看的出来。这也是为什么我们招进来的人什么背景的都有,背景可以千差万别,但是上面三条都一定满足。对于学统计的人,尤其是对互联网行业比较陌生的,可能在 product sense 方面会有些challenge。我们也面试过很多统计PhD,有些人回答很好,有些人就一塌糊涂,最后的差别并不在于统计,而是分析头脑和 product sense。
这里要说一点,大多数中国人都比较适合回答 close-ended questions (这个和咱们的教育背景有关), 纠结于”怎么分析”?很多时候遇上 “分析什么” 这种 open-ended questions 反而不知如何下手。
最后说点题外话。我来FB之前在Google工作了7年半,Google是个给钱多还不累的地方;FB可完全不是,FB比 Google忙的多的多的多的多,整个公司都是这个文化。 对于 mediocre performer,Google 更 tolerant,而 FB 很多就直接fire了。所以追求 work life balance 的, 基本就不要考虑FB了。
Google是很好的公司,也有很多牛人,但也有很多不干活的人在公司的各个角落。FB可以说基本没有,至少整个 analytics org 一百多人,我还没发现任何一个人有任何一点” 混”的迹象。Analytics 从 director到 manager 到 IC,都是要做 IC活 的,光管人耍嘴皮子,在FB是吃不开的。
- This reply was modified 4 years, 1 month ago by Datura.
Log in to reply.