kaggle大數據競賽項目

有個(ge) 比賽能讓你快速入門並掌握機器學習(xi) 和數據分析方法,實操實戰解決(jue) 真實企業(ye) 的商業(ye) 問題,助你收獲實習(xi) 、科研、留學offer。還有機會(hui) 拿下高達50000美金的獎勵,和全球頂尖的數據科學家決(jue) 戰光明頂。

競賽介紹
Kaggle成立於(yu) 2010年,是一個(ge) 進行數據發掘和預測競賽的在線平台。從(cong) 公司的角度來講,可以提供一些數據,進而提出一個(ge) 實際需要解決(jue) 的問題;從(cong) 參賽者的角度來講,他們(men) 將組隊參與(yu) 項目,針對其中一個(ge) 問題提出解決(jue) 方案,最終由公司選出的最佳方案可以獲得5K-10K美金的獎金。
除此之外,Kaggle官方每年還會(hui) 舉(ju) 辦一次大規模的競賽,獎金高達一百萬(wan) 美金,吸引了廣大的數據科學愛好者參與(yu) 其中。但是不同於(yu) 傳(chuan) 統的低層次勞動力需求,Kaggle一直致力於(yu) 解決(jue) 業(ye) 界難題,因此也創造了一種全新的勞動力市場——不再以學曆和工作經驗作為(wei) 唯一的人才評判標準,而是著眼於(yu) 個(ge) 人技能,為(wei) 頂尖人才和公司之間搭建了一座橋梁。
隻要你有才,隻要你能解決(jue) 問題,藤校offer和頂級互聯網公司入職加薪均有可能。

適合人群
適合對date science、date mining、machine learning感興(xing) 趣的高中生;
有一定計算機背景的人群。是絕佳提升申請背景的賽事。

賽事說明

賽題示例
Allstate索賠預測挑戰 - 使用客戶的購物曆史記錄來預測他們(men) 購買(mai) 的保險單
有害評論分類挑戰 - 預測維基百科上有害評論的存在和類型
Zillow獎 - 構建一個(ge) 機器學習(xi) 算法,可以挑戰Zesow,Zillow房地產(chan) 價(jia) 格估算算法
穀歌地標檢索挑戰 - 如果有圖像,您能在數據集中找到所有相同的地標嗎?
右鯨識別 - 識別航空照片中瀕臨(lin) 滅絕的露脊鯨
大規模分層文本分類 - 將維基百科文檔分類為(wei) 約300,000個(ge) 類別之一
泰坦尼克號:從(cong) 災難中進行機器學習(xi) ,預測泰坦尼克號的生存幾率
房價(jia) 預測:回歸方法
貓與(yu) 狗:創建一種算法去區分貓與(yu) 狗
紐約出租車行程持續時間:通過數據改善乘車時間預測
商店銷售預測
新用戶預定預測

基本流程
注冊(ce) 賬號(一人隻能有一個(ge) 賬號)
選擇一個(ge) 比賽項目
加入競賽,理解項目需求
下載數據,訓練模型,得出結果
提交結果(一般隻需提交預測結果,每天可多次提交)
一直到時間截至,評出最優(you) 者
獲獎的隊伍必須提交源代碼
注:上傳(chuan) 過一次結果之後,就直接加入了這場比賽。正式比賽中每個(ge) 團隊每天有5次的上傳(chuan) 機會(hui) ,然後就要等24小時再次傳(chuan) 結果,playground的是9次。

比賽技能要求
編程語言:最基礎的入門學者也得先學會(hui) 初步使用一門編程語言。對於(yu) 毫無基礎的新手,推薦使用Python,因為(wei) Python作為(wei) 一種強大的膠水語言,可以迅速入門。
探索數據:除編程語言外,還需要學習(xi) 如何探索性分析你手上的數據,這是進入數據科學的第一步。因為(wei) 通常到手的數據都多到不可思議,你要學會(hui) 取舍和迅速獲取最有用的信息。
模型訓練:熟悉使用機器學習(xi) 庫,培養(yang) 良好的習(xi) 慣,為(wei) 之後的工作做鋪墊實戰:從(cong) 初級可以逐漸增加難度。

比賽形式
Classic:在比賽開始後,用戶可以訪問完整的數據集。並可以選擇在本地或在線進行建模、預測生成預測文件,最後提交預測結果。目前大多數比賽采取本形式。
Two-stage:分為(wei) 第一階段和第二階段,第二階段建立在第一階段的結果上,第一階段完成才可參加第二階段。
Kernels:參賽者必須在線提交代碼,更加公平,使每個(ge) 參賽者都使用相同配置的電腦。

參賽時間

全年滾動,隨時可以報名。

競賽含金量

從(cong) 留學申請者的角度來看:對於(yu) 申請Data Science相關(guan) 專(zhuan) 業(ye) 的同學來講,大數據的走紅使得Data Science的申請競爭(zheng) 愈演愈烈,因此如何提升背景也是大家非常關(guan) 心的問題。而Kaggle正好給大家提供了一個(ge) 非常好的平台,在這裏人人有參與(yu) 項目的機會(hui) ,無論你的背景是什麽(me) ,都可以通過選擇合適的項目來找到屬於(yu) 自己的位置,利用自己的專(zhuan) 業(ye) 優(you) 勢,為(wei) 整個(ge) team作出貢獻,豐(feng) 富簡曆的同時也能學習(xi) 一些幹貨,為(wei) 自己以後的學習(xi) 打好基礎。而其在領域內(nei) 的知名度足以讓你在眾(zhong) 多申請者中脫穎而出,絕對是申請利器!

從(cong) 求職者的角度來看:Kaggle提供了一個(ge) 非常好的學習(xi) 平台,在這裏你可以接觸到真正的業(ye) 界案例,收獲實際的項目經驗,在每一個(ge) 項目中不斷挑戰自己,甚至在Kaggle榜上占據一席之位,提高自己在業(ye) 內(nei) 的知名度,優(you) 秀的排位甚至可能帶來的非常好的工作機會(hui) 。

同時,也可以認識一群誌同道合的人,擴展自己的professional network,與(yu) 業(ye) 內(nei) 最頂尖的高手互動,尤其是很多隊伍在比賽結束後都會(hui) 公開自己的解法,如果這個(ge) 項目恰好你參與(yu) 過,為(wei) 之投入過無數個(ge) 日日夜夜,此時就是不可多得的學習(xi) 機會(hui) 。如果能在Kaggle這種高手雲(yun) 集的比賽中獲得一個(ge) 還不錯的成績,寫(xie) 在簡曆上足以打動你今後的Boss,跳槽就翻倍的高薪工作指日可待!值得一提的是,雖然是匯集精英的社區,Kaggle的論壇氛圍很好,對新人非常友好,大家一定要多看Script多請教!

【競賽報名/項目谘詢+微信:mollywei007】

上一篇

MCM / ICM 美國大學生數學建模競賽

下一篇

本科商科愛丁堡和華威哪個比較好?

你也可能喜歡

  • 暫無相關文章!

評論已經被關(guan) 閉。

插入圖片
返回頂部