kaggle竞赛宝典 公众号建立的初衷是希望将很多经典比赛的方案写成案例的形式,每个步骤都配有一定的阐述,讲述某些操作为什么有效等,希望可以帮助更多的新手快速入门(太多的开源只有代码,看代码的时间是巨大的,复现的代价也是很大的,而且很多操作也不一定有效)。到目前为止, kaggle竞赛宝典 已经有9个kaggle的到银牌的案例,以及10+个国内竞赛的案例,此处将这些案例以及对应的链接一起汇总在下方,方便大家快速查找学习。
Kaggle平台
1. Web Traffic Time Series Forecasting 比赛(时序问题)
Web_Traffic_Part1赛题分析
Web_traffic_Part2_EDA
Web_traffic_Part3_银牌NN方案
Web银牌规则方案
2. Corporación Favorita Grocery Sales Forecasting (时序问题)
Corporación Favorita_赛题分析
Corp_数据探索分析Part2_单变量数据探索
Corp_数据探索分析Part3_特征变量&标签关系分析
Corp_数据探索分析Part4_特征变量&特征变量关系分析
Corp_Baseline
Corp_银牌方案
3. Santander Customer Transaction Prediction (匿名,二分类)
Santander Customer Transaction Prediction竞赛Part1_EDA
Santander Customer Transaction Prediction竞赛Part2_LB:0.900
Santander Customer Transaction Prediction竞赛Part3_Magic(银牌)
Santander Customer Transaction Prediction竞赛Part4_Top1%
Santander Customer Transaction Prediction竞赛Part5_方案汇总
4. Microsoft Malware Prediction (二分类,时序)
Microsoft Malware Prediction比赛EDA_Part1
Microsoft Malware Prediction比赛Part2_LGBBaseline(LB:0.694)
Microsoft Malware Prediction比赛Part3_AvSig强特+LGB(0.701)
5. Click-Through Rate Prediction (推荐)
Click-Through Rate Prediction:数据探索分析(Part1)
Click-Through Rate Prediction:银牌(Part2)
6. Instacart Market Basket Analysis (推荐)
Instacart Market Basket Analysis(Part 1):EDA&Baseline
Instacart Market Basket Analysis(Part 2):0.3787363
Instacart Market Basket Analysis(Part3_1):0.4036596(铜牌)
Instacart Market Basket Analysis(Part3_2):0.4036596(铜牌)
7. Titanic: Machine Learning from Disaster (二分类,入门)
Titanic: Machine Learning from Disaster
8. Kaggle Two Sigma(股票预测 )
Kaggle Two Simga 第四名方案 Part 1 (Shannon提供)
Kaggle Two Simga 第四名方案 Part 2 (Shannon提供)
Kaggle Two Simga 第四名方案 Part 3 NN模型 (Shannon提供)
9. IEEE-CIS Fraud Detection (二分类,欺诈) \
IEEE-CIS Fraud Detection_Part1_赛题分析
IEEE比赛的一些建议&秋招AI/机器学习/数据挖掘岗位面试注意点
IEEE Part3: 有趣的强特&强tricks
10. ASHARE (分类, 剩余的赛后补充 )
ASHARE_Part1: 赛题分析
国内竞赛平台 ****
1. CMTR(KDD19,推荐,多分类)
ContextAware MultiModal Transportation Recommendation Part1赛题解析
ContextAware MultiModal Transportation Recommendation Part2 EDA
CAMMTR(KDD19)_Part3_多分类Baseline分享(含Code)
CAMMTR(KDD19)_Part4_复赛top10方案(含Code)
2. NIPS2018 AutoML比赛(匿名,多数据集)
2018年NIPS会议AutoML大赛Part1,AutoFeature篇
18NIPSAutoML Part2&3,ModelSelection&Hyperpara Tuning
3. JDATA19_用户对品类下店铺的购买预测(时序,推荐)
JDATA19_用户对品类下店铺的购买预测_A榜0.058(top20)方案
4. 全球城市计算AI挑战赛(时序,回归)
全球城市计算AI挑战赛Part1_EDA
天池地铁流量预测Part2_Rule(LB_12.10,Top2%) (人畜无害小白兔提供)
全球城市计算AI挑战赛Part3_(A top1, C top2方案)
5. 信贷用户逾期预测(二分类,欺诈)
“信贷用户逾期预测”算法大赛优胜奖方案分享
6. 天文数据挖掘大赛(多分类,天文)
天文数据挖掘大赛方案季军方案
7. JDD人口动态普查(时序)
JDD人口动态普查与预测,2018(正逆向时序建模)
8. 工程机械设备故障预测(多分类)
基于机器学习的工程机械设备故障预测系统Part1 - EDA 部分
基于机器学习的工程机械设备故障预测系统Part2 -- Top5方案
基于机器学习的工程机械设备故障预测系统Part3 -- 测试集leak
9. 消费者人群画像—信用智能评分
MSE+MAE提高回归精度的方法(消费者人群画像—信用智能评分为例)
消费者人群画像-信用智能评分Top1 (有夕提供)
10. 腾讯广告算法大赛19 ****
腾讯广告算法大赛19_Top5方案&代码 (有夕提供)
2019腾讯广告算法大赛方案分享(冠军)
11. 科大讯飞工程机械核心部件寿命预测挑战赛( New! )
科大讯飞工程机械核心部件寿命预测挑战赛冠军分享 ****
12. 科大讯飞工程机械核心部件寿命预测挑战赛( New! )
2019CCF-BDCI-乘用车细分市场销量预测方案(Top1%)
13. CCF BDCI新闻情感分类 ( New! )
CCF BDCI新闻情感分类初赛A榜4/2735,复赛Top1%题解报告
14. DigSci科学数据挖掘大赛 ( New! ) ****
DigSci科学数据挖掘大赛: 如何在3天内拿下DigSci亚军
备注:公众号菜单包含了整理了一本 AI小抄 , 非常适合在通勤路上用学习 。
往期精彩回顾
那些年做的学术公益-你不是一个人在战斗适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册备注:加入本站微信群或者qq群,请回复“加群”加入知识星球(4500+用户,ID:92416895),请回复“知识星球”
喜欢文章,点个 在看