一
个人简介
本科背景:中国人民大学计算机科学&数据科学
其他背景:
·GPA 3.5- WES GPA 3.6- RANK 18%
·托福103 GRE 323
·实习:Tiktok DS 23.7-申请时
·科研:大创机器学习科研+独立机器学习研究
·竞赛:美赛+kaggle竞赛
二
申请准备
申请是一个因果推断问题。
录取逻辑:在保证同学可以跟得上学业的情况下(GPA TG),录取更有可能创造出良好就业数据的同学(实习/科研)
三维权重:申请的90%(个人估计)
01
(1)GPA:不仅仅是绝对分数
· GPA=学校出身+专业+分数(排名)
· DS先修课:微积分+编程+线性代数+概率统计
(2)托福:尽早准备
(3)GRE:尽早准备
这里提醒大家需要注意的是,托福考试有效期为两年,可提前考试但不建议考得太早。 GRE考试有效期为5年,我认为一些英语基础较好的同学,可以先尝试GRE。考完GRE后,托福的阅读或写作可能不会有太大问题,而且早考GRE也没关系,因为有效期长达5年,大家甚至在大一就可以考GRE。
科研
02
我的科研经历:
大创:关于舆情研究,涉及文本聚类分类命名实体识别等NLP任务
独立科研:文本聚类的进一步研究
个人建议:
我认为不论是陆本还是美本,科研一定要做。 早期与老师建立联系,老师不仅可以提供科研指导,还有可能在你表现出色时为你提供推荐信或推荐机会。
关于比赛:可以参加,作用有限
科研内容选择:尽量贴合机器学习。
对于数据科学或商业分析领域而言,包括各种机器学习技术,如深度学习、自然语言处理、计算机视觉以及大数据处理等,都符合数据科学的标准。传统的技术,如推荐系统或简单的预测模型,也是可以的,至少可以证明你具备相关实力。这些经验无论是用于申请研究生、实习还是工作,都非常有用。
实习
03
个人认为实习作用比科研更大。
实习好处:
(1)适应岗位,了解自己的倾向;
(2)对于就业公司而言,实习更加重要,相对更看实习经历(有含金量的期刊除外);
(3)因为公司看重实习,所以对于关注就业报告的大多数DS/BA项目而言,会更注重实习的经历。
实习公司选择:岗位相对没那么重要,公司title更重要
岗位选择: BA<DA<DS<MLE 尽量突出自己的硬技能
我的实习经历:
tiktok DS MLE 找实习经验
实习越早准备越好,我是在23年开始的,一开始并不顺利,好在最后找到了字节的数据科学实习岗位,之后对于这个岗位或者就业市场,至少在数据科学这一块算有点小理解了,在申请之后,我现在也开始做了算法,做算法时感觉又是一个不一样的世界,所以我觉得实习经历还是蛮重要的,不仅是技能上,可能跟同事聊天也会增加自己对于行业的认识,对于求职的认识,所以说好处比较多。
实习小Tips
1、永远不要死磕
暑期实习与秋招同样难,对于没有太多实习经历的在校生来说,日常实习是非常重要的。实习的招聘门槛相对较低,但并非完全低,对于没有实习经历的人,公司可能更愿意培养他们。公司可能会考虑花更短时间培养这样的实习生,让他们在实习期间学习并在剩下的长时间里配合工作,这样公司获得了一个比较便宜的劳动力,同时我们也可以到一些经验,所以这个算是一个因病。
2、所以在日常实习中,大家一定 要表明自己愿意实习很长时间 ,即使实际情况可能不会那么长。这种表态可以显著提高成功率,特别是在科技行业中。
3、对于公司偏好来说,在寻找实习机会时,选择科技公司可能会更有优势。
推荐信
04
一般学校会要求学生提供两到三封推荐信。在确保学习能力的情况下,创造更好的就业机会是关键。通常,三封推荐信中会包括一封科研推荐信 , 一封课程推荐信 或者 一封实习推荐信 。推荐信的选择可以根据推荐人的身份和关系进行灵活调整,比如如果实习经验丰富,可以选择两封实习推荐信。
我认为 教授的名头越大越好 ,我觉得,不论是企业还是学校的教授,他们肯定都愿意提携年轻一代,所以我当时就大胆的去要了,最坏的结果也只是被拒绝。所以说,大家要建议积极主动地联系推荐人,最后一定会有好结果的。
文书
05
·整合课程,科研,实习经历,是以上经历的一个集合,突出你职业发展的故事线
·整理思路和心路历程,why DS?对于DS的理解(专业以及岗位上),之后想使用DS工具去做什么?(DA/BA/MLE)
三
专业介绍
对于数据科学这个专业,情况在很多年前就已经发生了很大变化。我认为 一个人的命运当然取决于自己的努力,同时也需要考虑历史进程的影响。
· 时代变迁:DS的岗位不再万金油,DS的职能逐渐被拆分: 分析类->DA,ML->MLE/AS/RS · 对口岗位介绍
· BA出路:金融/咨询/tech 的BA/DA/DS
· DS出路:金融/咨询/tech 的DA/DS/DE/MLE/AS
· BA 分析 <-> DS 机器学习+统计
· 选什么方向并不代表之后一定会做什么职位
· 岗位区分:以面试考察为例
四
申请过程
定校
01
比如说我是24Fall的,我就24年秋天入学,然后我就在定校的时候,基本上是在年终的时候就会拍板一个的定校基本。
定校基本可以分为三个部分:冲刺+匹配+保底:
· 梦校基本就在冲刺环节。
· 关于匹配,即选择大概率会被录取的学校,但也不一定会录取,比如我冲刺的录取概率是在10%,匹配的录取可能就在50%左右,这样就可以叫匹配院校。
· 关于保底,至少录取概率要到80%以上,这种学校一般选择两三所就可以了,后面可能大部分精力可以投入到匹配和冲刺之类。
当然,这也需要结合,比如个人的理解,或者可以与领录的老师商量, 学校也会有特定的录取偏好背景,还需考虑个人背景与学校的匹配程度。学校可能有专业偏好、学校偏好或GPA偏好等。
以我被录取的三所学校为例:
比如本科为经济学的同学,想申请美国商业分析或数据科学专业,可以选择UCB和CMU,因为这两所大学对于转专业申请者更友好,这两所学校会容易接受非理工科背景的申请者,因为它们的项目更偏向商业分析。但纽约大学却有一定的专业偏好。
我们还要考虑 学校和自己背景的匹配程度 :比如偏商业的申请同学,可能被CMU商务智能专业录取的可能性,要大于被NYU数据科学专业的录取可能性。甚至有些数据科学项目,根本不会考虑非理工科的申请背景,比如说CMU计算数据科学项目,它的出路可能是去从事软件开发工程师等,所以也要看具体项目的偏好 。
院校申请
02
在这里提一下,我同时也拿到了新加坡国立大学的数据科学与机器学习offer。 我认为想要申请一所保底院校,提前批申请也很与价值。
我的申请时间线:
23.7提前批开始申请→8月拿到offer
其他 offer 是 23.12-24.1 申请 → 24.3 拿到 offer
offer选择
03
录取是一个因果推断问题,选校和就业的关系也是。
第一性原理:
读master是为了什么?学校究竟能在什么程度上帮助就业?
选校的时候考虑的维度:
(1)学校可以提供的carrier services
(2)学校课程→很硬:或许可以学到东西/转phd ,但可能会耽误找工作; 学校课程→很软: 或许可以腾出时间找工
(3)项目在行业内知名度(过业内简历关)
(4)学校在社会大众(中/美)的知名度(和亲戚同学吹/转行)
(5)项目时长 根据求职时间线和个人需求来判断
以我自己为例:
CMU BIDA vs NYU DS vs UCB analytics
我主要在纠结的两个选择是纽约大学的数据科学和加州大学伯克利分校的分析学。在 社会大众中的知名度 方面,伯克利远胜于纽约大学,而且在社会上的声誉也明显更好。
对于考虑就业的学生来说,需要考虑项目在行业内的知名度。以CMU的商务智能与数据分析和纽大为例进行对比,业内普遍认为CMU更优秀,因为它是计算机领域的顶尖学府。然而,在数据科学领域,我认为纽大的数据科学项目可能更为出色,因为CMU相关的专业开设较多,但纽大的专业开设较早且声誉良好。
所以我在分析过后,因为可能会考虑在美国求职, 我还是选择了纽大NYU的数据科学 ,而且纽大的地理位置也不错,很多时候很多机会只对纽约的同学开放,所以我认为纽大可能更适合我一些。
还有最为关键的 项目时长 ,为什么我没有选择伯克利?因为它只有一年,纽大是两年,卡内基梅隆是一年半,在准备秋招的同学也要考虑到求职时间线的问题。在中国,企业通常对毕业时间和应届生身份有具体要求。如果你选择UCB,你需要在进入新学校的第一年同时投递美国和国内的简历。虽然在纽约大学第二年可能也会有这种情况,但选择伯克利时间上可能会有些紧迫。当然,一年制项目也并非坏事,因为你可以在出国之前或者在美本大四时开始投递国内的暑期实习,然后在出国前的暑假完成实习。这种情况下,一年制项目完全符合暑期实习转正的要求,这样你可能在留学之前就已经有了一个offer,让整个求职过程更加轻松。