Kaggle 是谷歌旗下的全球顶尖人工智能竞赛,主要提供举办机器学习竞赛、托管数据库、编写和分享代码 的平台。该平台已经吸引了 80 万名数据科学家的参与,这些用户资源及技术资源引起谷歌高度重视。凡是在 Kaggle 竞赛中获得优秀名次参赛者,大部分可以收到藤校、 G5 以及全球百强企业的橄榄枝。
Kaggle 的多数竞赛由企业或者研究机构发布,以竞赛奖励的方式向全球征集解决方案,通过众包的方式解决建模问题,诸如 Google 、 Facebook 、 Microsoft 等知名科技公司均在 Kaggle 上举办过数据挖掘比赛。对参赛者来说,他们不仅有机会接触丰富的真实数据,解决实际问题,角逐名次,赢取奖金。每年, Kaggle 官方还会举办一次大规模的竞赛,奖金高达一百万。 Kaggle 一直致力于解决业界难题,不以学历和工作经 验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。
** 01竞赛规则 :**
竞赛时间: 全年滚动,随时报名。
竞赛语言: 英文
竞赛形式: 以个人或组队的形式参加比赛,在参赛时可以相互分享经验
竞赛流程:
注册账号(一人只能有一个账号)
选择想要参赛的项目。
下载题目的数据( rain 数据集,用来优化模型; test 数据集,用来测试优化好的模) test 的结果
就是要提交的结果,提交之后就代表正式参赛,会在网上显示排名(每天可多次提交)。
直到时间截止,评出最优者。
获奖的队伍必须提交源代码(队伍之间不能私自分享代码或者数据)。
** 02竞赛内容:** ****
乍看之下, Kaggle 竞赛的参与门槛极高,但其实, Kaggle 对初学者也是十分友好的,从 Kaggle 提供的官方分类来看,其难度从初学到高阶以及求职均有涉及。最常见的竞赛可以划分为以下类型:
·Featured: Kaggle 最著名的比赛类型,适合数据科学高手参与。题目都是全面的机器学习问题,难
度较高,通常是商业或科研难题,奖金池最大;
·Research: 科研和学术性较强的比赛,同样适合数据科学高手参与,以实验研究为主要方向的竞赛,
一般需要较强的领域和专业知识,奖金相比 Featured 较少;
·Getting Started: 适合基础入门选手,与 Featured 竞赛结构类似,但并没有奖金,以初学者项目学习
积攒经验为主;
·Recruitment: 适合想要去发布公司求职的人,以各大公司需要招募相关职业为主,比赛的奖励为面
试机会;
·Playground: 提供一些公开的数据集用于尝试模型和算法; 82
·Masters: 大师级别的比赛,难度最高,项目也最少。
·Annual: 有两种类型的年度比赛: March Machine Learning Competition ,自 2014 年以来,该比赛每
年都在美国大学篮球锦标赛期间举行; Santa-themed Optimization Competition ,每年在圣诞节前后举行一次。
** 03奖项设置**
l 入门级:Getting started
入门级主要针对刚入门机器学习的初学者,是 kaggle 里最简单的比赛,都是永久性的。就好像是 kaggle
竞赛中的 Hello world 。在里面也会有很多大神给出的参考答案,是一个鼓励性质的比赛,没有奖品积分。
l 进阶级:Playground
进阶级主要面向打过初级比赛后,想要尝试增加难度的新手。这种比赛后面通常会标有 Kowledge (经
验)、 Kudos (荣誉)和少量奖金,
l 高级:Featured
Featured 比赛难度较大,需要有深厚的机器学习功底。高级比赛是有赏金的,有的奖池子高达 100 万
美元,当然没有获得奖金的也有 金牌、银牌和铜牌之分,一般都是多个,如果参加比赛的队伍有两千多个,
通常位列 200 左右也都可以获得铜牌。
l 研究级:Research
与高级比赛相比研究类比赛更具实验性,而且通常没有奖金和分数,但是其为解决某些竞争较弱的特
定领域提供了解决方案。
l 招聘型:Recruitment
在招聘竞赛中,个人将为公司策划的挑战建立机器学习模型。在比赛结束时,感兴趣的参与者可以上 传他们的简历供主持人考虑。 奖品是举办比赛的公司或组织的工作面试。