H导师是数学博士,计算机硕士毕业。现在就职于美国最大的social media公司之一。擅长辅导零基础学员学习Machine LearningStatistical Modeling,以及如何准备Data Scientist面试。曾经辅导EE学员成功拿到Data Scientist offer,成功内推3位学员拿到全职工作

现在的工作
我现在在做Data Scientist。在我攻速对于Data Scientist还有Software Engineer的划分不是特别明显。 
我主要是负责广告组,我做的这一块叫做User Modeling,主要是利用各种数据来猜测用户的名字,地理位置,还有性别,然后打相应的广告。具体来说就是要根据用户关注的人来推测他们喜欢什么,还有根据用户习惯来打广告。

 然后就是根据初步推测出来的信息,爱好,性别来投放初期的广告。通过观察用户行为,我们再在后台修改模型。 
工作上面最大的挑战就是那些不好推测的信息。我公司对于用户的年龄,性别的模型做的很好,容易推测出来。 有一些是很不明显的,比如说兴趣爱好这一个方面。我们就需要通过观察用户关注的人,点赞历史来推测,这一方面的Feature不是特别多。
需要具备的技能
Coding的技能是必须的,比如一些high level的语言。比如说Hadoop里面要用的语言。 然后就是要了解一些大数据模型, Machine Learning的基本知识,面试官可能会问到。
虽然说工作之后会有Training,但是还是要了解Machine Learning的一些概念。比如说怎么对数据做预处理, 模型。 如果你处理过数据,那么在面试的时候就会特别突出。
在学校学的Machine Learning跟工业比起来,Data Set小,问题简单。工业上面接触到的数据会更复杂,模型也会更复杂。
学校课内课程要注重哪些内容
概率和统计, 统计推断,线性回国数学模型, 统计建模。你需要知道知道这个模型是怎么来的,还有背后的Under line的Assupmtion。
简介大数据的职位
Data Scientist有三大部分。分别是Data Analyst,Data Scientist,还有Data Engineer。
Data Analyst
主要做的是分析最初的Data,提取有用的信息,report给下面一层,不需要建造模型。

Data Scientist
主要任务是建立统计模型,implement算法,做预测和分析

Data Engineer
偏向于搭建系统架构,cluster,以及大数据的infrastructure。如果出现了不明显的,那就把数据还给第一层,然后再提取一遍。

投简历的渠道:
当时是和其他的两位同事一起准备的,大家一起刷了一些题目。然后在准备的时候,我们常常互相“刁难”对方吧。虽然一开始被提问的时候很不适应,但是这个互相提问的环节帮助我们理解更多细节上的问题
我一共拿到了Google,Facebook,我现在公司,还有Linkedin的面试,但是一共就面试了两家公司,分别是Facebook还有我现在的公司。因为原来公司的manager在Facebook,所以直接拿了onsite,我自己本身是数学背景,还是想跟多的利用数学,所以对于纯Codeing的工作不是特别感兴趣,所以就没有去Google的onsite。
面试遇到的难题:
对于我个人来说,难点还是在coding上面。面试你的公司其是也就是在确认你能写代码。遇见了一些design的题目,系统设计的题目,基本的数据结构,然后就是模型的设计。跟Google的风格很像,你如果回答的好,那么下面一题就会更难。
学员身上的共性
就像我上面说的,大数据这个方面还是很新。所以学校的一些课程还是不是特别系统。整个大数据的市场的水又深又混

还有就是大数据这里不但考验你的代码功力,还有对于很多大数据的概念的理解,还有建模这一块。 外界的帮助本来就很少。 还有很重要的一点就是,就是因为大数据这块很新,面试的标准还没有定下来,很多公司的面试都不统一,招人标准参差不齐。
给学员们的建议
我建议大家多跟前辈聊聊天,尤其是已经在做大数据的前辈们。也可以多去别的公司学习学习,读一些论文。看看在实际工业界里面,别人是在做什么。什么样的东西才是最重要的。不要只是盲目的刷题
给学员的带来的最大帮助
我在整个大数据的水更混浊的时候体验过了一次,所以我对于怎么样找工作,如何识别各个职别的要求如何准备面试什么样的公司出什么题目都很了解。
帮助学员分清楚到底自己想选择的职位是哪一个,然后帮助学员有头绪的准备。帮助学员了解做大数据到底除了写代码的技能,还要靠什么才能拿下offer。
如果你也想得到
经验丰富的业内导师1:1的修改简历的机会
学习各种面试技巧和mock interview的机会
小顾问咨询VIP服务,回复“H导师

继续阅读
阅读原文