活跃农民
积分 470
大米 颗
鳄梨 个
水井 尺
蓝莓 颗
萝卜 根
小米 粒
学分 个
注册时间 2015-6-10
最后登录 1970-1-1
2019(1-3月) 分析|数据科学类 硕士 全职 @google - 内推 - Onsite | | Other | 在职跳槽
注册一亩三分地论坛,查看更多干货!
您需要 登录 才可以下载或查看附件。没有帐号?注册账号
x
楼主从去年10月份开始系统复习准备DS analytics方向的面试,在准备过程中在地里学习了很多前人的面试经验,也被推荐了很多很有效的资源,非常喜欢这个论坛的气氛。现在找工结束,想发一些自己准备面试以及面试的经验(心得和反思都有)来回报地里。因为签了NDA,不太方便透露具体的面试题还请大家见谅,但是会举一些自己在面试中遇到的问题和自己的思考,欢迎大家一起探讨。
先报一下自己最近这波找工作的情况,因为比较忙所以没有海投,不然连猎头电话都打不过来了:
简历拒:uber,pinterest,snapchat,dropbox,glassdoor
店面挂:linkedin(技术二面)
onsite挂:quora,microsoft
onsite加面挂:facebook(对不起我热心内推积极提建议的舍友啊TAT)
offer:thumbtack(PA),google(BA和PA两个ladder),airbnb (DS-Analytics)
. ----
和很多小伙伴一样,我这次主要的方向是analytics track,准备的方面也是依据这个track的要求进行的,分为以下几个方面:
(1)Product Sense:
地里被很多人推荐的cracking the PM interview 里关于behavior的章节我看了三遍,estimation,product和case三个章节我看了至少五遍吧,最开始的时候几乎每面一个公司的每一轮面试前都会看一遍,听上去看了挺多遍的其实看到后几遍就很快,看到一个标题大致就知道这个部分说的是什么了,主要的目的是过一遍思路,让自己的思维在面试前活起来。我觉得其实很多产品题面试的时候卡壳但是面试后多花时间想一想就有解了,产品题之所以难,在我看来部分原因是思路容易受面试时紧张心态的限制发散不开,面试前过一遍,确定自己脑子里有什么武器至少对我来说还是很有用的。
其他推荐的材料我自己看过的还有case in point ,这个因为case太多了我只看了两遍,但其实这本书在解决case study(不是product question)上比cracking 我觉得要简单好用,里面的体系很有说服力,例子又多,不只能让你知道what is working,也能告诉你what is not working。
https://learn.1point3acres.com/courses/ds501-analytics/
这个是地里大神小k老师的一个付费课程,我在面试后期才开始用的,但是有点后悔买晚了。里面涉及了很多面试中考察的知识点,虽然不是每道题都讲得很透,但是如果自己先下苦功夫准备过analytics再来听这个,会非常有拾遗和验证心得的效果。
除此之外,每面试一家公司之前,推荐一定要上地里看面经,一定要在纸上多写几道产品题的答案。我当时面fb的时候在纸上写了25道产品题的自己的答案,面linkedin的时候也准备了15道,虽然最后这两家都g了,但是对我如何把资料和课程里的东西内化起了不可替代的作用,后期面狗家和空气床的时候其实是没有什么面经的,面试的时候也没有面经题,但是前期F和L的准备沉淀下来了,被问到的题自己没见过也没有很虚。
(2)SQL:.google и
这个比较简单粗暴,Leetcode的sql我刷过至少5遍,hankerank我刷过3遍,基本上就没问题了。需要提醒大家的是如果你有一阵子没刷了,一定要再刷一下,手会生的。
(3)Python - manipulation & cleaning:
在这波面试前,我其实是不太会用python做数据处理和可视化的,如果小伙伴中有跟我一样的人,我觉得我用的这些资源真的都非常好,后来面试的时候甚至又不止一次要我现场用电脑处理数据做可视化提建议,用过以下资源表示完全不虚:-baidu 1point3acres
(3.1) udemy python for Data Science and machine learning bootcamp :
https://www.udemy.com/python-for-data-science-and-machine-learning-bootcamp/learn/v4/t/lecture/5733448?start=0
这个资源我只看了前半部分关于数据处理和可视化的但是看了两遍(第二遍是快进式刷的),非常系统地教了pandas和seaborn-baidu 1point3acres
(3.2)datacamp :
里面有关于pandas ,matplotlib 和seaborn 从入门到精通所有相关的课程,我都上了,和udemy相互印证以后,基本上就有了一个比较清楚的概念了。
(4)AB-Testing:
udacity上的那门AB testing的课 是入门的利器,第一次上那门课的时候仿佛打开了一扇新世界的大门。但是其实那门课很多细节是没有讲清楚的(至少我自己没听明白),比如没有涉及t test,没有讲清楚variability, bootstrap, A-A test的意义,怎么在实验设计阶段应对learning effect, network effect,和其他一些corner case。 所以我觉得这门课入门很好,但是绝对是不够的。
. 1point3acres.com
(5)统计:
. 1point 3 acres 我17年初面过一次FB,那个时候自己还挺菜的店面就gg了。但是当时FB的面试准备资料里share的那个练习网站真的是神器,https://brilliant.org/ 网址是这个,面过FB的小伙伴应该都知道。我当时一度迷上这个网站了,在里面做题做了好久,遇到自己不会的题或者一些比较经典的题就在纸上记录下来,前前后后做了多少道肯定记不清了,但是笔记上有大概50道。除此之外我也会看地里的统计部分的面经,遇到自己不会的知识点就上网找,一遍都能有答案,然后会吧问题和答案也记在同一个地方。
之前提到的Datacamp 也是一个很重要的资源,里面有一些关于统计分布,experimentation方面的课程,我是从那些课程里第一次系统地学习并练习了了泊松分布,指数部分,permutation和bootstrap的。
最后提一个courseera上的课,也是地里的小伙伴分享的,我觉得能很清楚地帮我们理解一些看似很基础但其实很重要而大多数人不清楚的统计概念,比如random sampling和random assignment,violate each对结果的影响是什么。https://www.coursera.org/learn/probability-intro/home/welcome
(6)Machine Learning:. 1point 3acres
这个部分地里的推荐都挺好的,我自己只上过Andrew Ng的courseera和sebastian的udacity 。除此之外还上了DataCamp里关于xgboost 的专题讲解。我觉得Analytics Track的面试,有这些应该就够用了。
(7)Algorithm:
我没在这个部分上花太多的时间,只刷了leetcode上最高频的50道easy和medium level的题三遍,没想到居然又不止一次在面试中遇到过,也是走运。这波找工完了之后我接下来应该会找时间系统地学习一下数据结构和算法然后好好刷刷题 ,以后希望能做个growth engineer。
.google и
准备的材料就是这些了,接下来想说一说我实际在面试中发现自己做的好的地方以及暴露出来的一些问题,这里会涉及三个方面:behavior,product & case question以及take home challenge
1. Behavior:
这个部分是一个容易被忽视的部分,但是如果你连自己都聊不清楚,其实会让面试官,尤其是hiring manger对敢不敢用你挺犹豫的。我在这块绝大多数时候表现的是非常不错的,方法就是找几个大的topic,每个topic下面准备好故事,把故事写出来,不断地思考细节,不断地思考怎么少说废话,不断地思考怎么条理清楚。我准备的大topic有以下几个:
这里重中之重的关键是少说废话,有一个behavior 很好的模板叫S(Situation).T(Task).A(Action).R(Result)可以用来frame几乎所有的behaviroral 和culture fit的素材。在准备的时候一定要强调你做了什么,如果你能够量化结果的花那就更优秀了。
2. Product & Case Question
讲这个话题前要先吹一波Facebook,他家对define product & case question的定义和分类让我觉得非常make sense。在我看来IT界(不是咨询界)所有的product和case question到最后都可以被归纳到fb的两轮product 面试之下: Product Interpretation和Applied Data。
. 1point3acres
第一个内容的最终落脚点一般都是find a metrics to evaluate XXX。这个要求我们明白产品的用户,用户的问题,产品如何帮助用户解决问题,进而明确用户的goal,公司的goal,最后作为DS,我们的任务是找到metrics去quantify这些goal。 每一个公司,因为业务模式不同,最后都会一个独特但唯一的north star metrics。在面试之前,想清楚这个metrics是什么和为什么是这个在我看来是很重要的。在面试之中,当我们clarify了scope和ambiguous term之后,也应该按照步骤一步一步地和面试官讨论,把问题,产品的solution,goal这些东西都一步一步地聊出来。有的人建议先confirm goal,但是我觉得goal是在你和面试官都align了问题和产品后才能聊得出来的东西,这个大家如果有不同意见欢迎讨论。但是总结来说,这个部分的产品题,需要我们花时间去了解产品,然后一步步地去聊出面试官问你的问题的context。
关于appiled data,楼主自己其实也做得不太好,fb得onsite加面的就是这一轮。这里主要就说说自己的理解和遇到的问题。 这一大类的问法都是what data would you use to XXX (我在后面会沿用同样的格式),让你brainstrom用什么data去解决问题,也就是考察在实际工作中operationalize data的能力。这里可以考察的点有很多,我争取每一个自己能想到的点都举一个我自己面试的一个实例出来供大家讨论:. 1point 3acres
3. Data Challenge
关于这个部分,我觉得这个帖子已经说得非常到位了:https://www.1point3acres.com/bbs/thread-326201-1-1.html ,非常感谢这位战友分享的经验。楼主在这里就只是加一点个人的经验总结,希望对大家有帮助。如果让我用一句话总结,analytics的Data Challenge该怎么做的话,应该是:
Do as much as analysis as you can,but only showcase the most valuable findings - in a framed way。
这里有三个层面的意思:. check 1point3acres for more.
. 1point 3 acres
以上就是自己准备面试的一些方法和心得,希望对大家有帮助。 在这里感谢一下地里的各位大神和我身边的很多小伙伴在我面试过程中提供的信息上,知识上和精神上的支持。最后祝大家面试顺利,早日拿到心仪的offer!
..
.--
补充内容 (2019-3-22 01:44): . 1point 3acres
经小伙伴提醒补一下那个不work的cracking the data challenge的帖子的链接:
https://www.1point3acres.com/bbs/thread-326201-1-1.html
上一篇:
Amazon DS 第一次电面 下一篇:
Wayfair BI OA 02/17/2019 新人分享求加米 让我看到下一轮的面筋
本帖被以下淘专辑推荐:
· DS/DA 找工求职经验 | 主题: 226, 订阅: 458
· QA/DS 实习or全职 | 主题: 1034, 订阅: 117
· DS | 主题: 224, 订阅: 39
· Data Science ING | 主题: 66, 订阅: 32
· CS/DS 学习贴 | 主题: 24, 订阅: 12
· JOB | 主题: 269, 订阅: 12
· Data经验谈 | 主题: 34, 订阅: 10
· 面试拿offer | 主题: 77, 订阅: 9
· 数科面试准备及学习资料 | 主题: 3, 订阅: 3
· exp | 主题: 4, 订阅: 1
· 更多