数据科学专业对口的工作职位?
ata scientist:科技公司中用的比较多,很多要求 ph 的学历。
ata analyst:金融业用的比较多。
risk manager / risk management:金融公司里用的比较多。
business analyst:与 ata analyst 类似,但更加注重商业,技术方面的要求相对较低。
ata engineer:一般是科技公司采用这个职位,偏向 cs 专业,需要负责数据存储、实时处理的工作,对系统、programming 的要求更多。
statistician:如 google。偏向统计,要求较为深入地理解概率统计。
statistic scientist:如亚马逊。
research scientist:与 ata analyst 相关。
择业时,有哪些公司可以选择?
各行各业都在利用大数据来解决问题,所以有很多公司有相关职位。
科技公司:twitter,microsoft,bat,搜狗,美团,滴滴
金融公司:capital one(从建立之初就开始用一些数据方法进行风险控制等方面的工作),高盛,blackrock,hege fun
咨询公司:polunteer(帮助美国政府部门解决反恐、审查等工作),麦肯锡,ibm(传统咨询公司也慢慢转向 ata 方向)
专门做数据分析平台的公司:kotara,hotten,atabreaks
其他公司:horizon(电信),comecrack(传媒),消费品公司,医疗公司
数据科学的主要工作?
分为四部分:归纳问题、准备探索数据、模型训练检验调整、报告和产品。
1. 归纳问题
客户给公司的任务,或者头头给分析师的任务,不是一个具体的任务(用 xx 模型来做 xx 数据),而是一个具体的商业问题。比如,上个季度为什么盈利下降了。这就是一个归纳问题的环节,需要有专业知识帮助我们找到方向。
2. 准备探索数据
归纳问题结束之后,会产生很多假设,这就需要寻找数据验证假设。
寻找数据一般是竭尽所能,比如收入不好与市场推广有关,就会去寻找广告商的数据。
寻找数据以后,要检查数据质量,是否有异动、缺失等等。数据质量能够决定模型的准确率。所以花在“清洗整理”数据上的时间要占到总时间的 60% 甚至更多,有时候也需要跟客户进行交流。
检查完质量以后,做一些探索性分析。
3. 模型训练检验调整
先确定模型基本类型(回归、聚类等),选取比较合适的模型进行搭建,用 test 对模型进行检验。检验的同时再去寻找模型最优的参数配置,对模型进行预测,如果预测结果很好的话,建模过程就结束了。
4. 报告和产品
在咨询公司中,模型做完以后,会和客户进行交流,看是否符合实际。在科技公司中,模型往往会发展成一个产品。放在公司平台上测试,或者发布到网上。