kaggle时间序列top方案全分享(附baseline+金牌开源代码)
时间序列预测作为机器学习中的一项常见的任务,应用场景非常广泛,比如电力能源、交通流量、股票价格、天气变化、疾病等预测,在各个领域中都具有非常重要的作用。
我们遇到的很多预测问题其实都能看作是时序预测问题,在数据挖掘竞赛中,时间序列预测相关的竞赛也占了相当大的一部分。
今天学姐就帮同学们整理了kaggle时间序列预测相关的比赛,新赛经典赛都有,各场比赛的top方案链接都贴上了!baseline代码合集看这里👇

上次分享的是kaggle金融量化竞赛的top方案,感兴趣的同学可以点传送门。
扫码添加小享,回复“时间序列”
免费获取金牌方案baseline代码合集

1.蛋白功能预测大赛

比赛链接:https://www.kaggle.com/competitions/cafa-5-protein-function-prediction
比赛背景:该竞赛的目标是预测一组蛋白质的功能。参赛者将开发一个针对蛋白质的氨基酸序列和其他数据进行训练的模型。参赛者的工作将帮助研究人员更好地了解蛋白质的功能,这对于发现细胞,组织和器官如何工作非常重要。这也可能有助于开发针对各种疾病的新药和疗法。
评估标准:提交将对在提交截止日期之前在基因本体(GO)的至少一个子本体中没有实验确定的功能注释的蛋白质(测试集)进行评估,并且在提交截止日期和评估时间之间在该子本体中积累了经过实验验证的功能注释。
比赛时间:2023.4-2023.8
金牌方案:
竞赛尚未结束,8月21日截止投稿,想要金牌的同学加油冲!
2.Stable Diffusion 大赛

比赛链接:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts
比赛背景:竞赛的目标是逆转典型的生成式文本到图像模型的方向:不是根据文本提示生成图像,而是参赛者能创建一个模型,给定生成的图像后能预测文本提示。参赛者将在包含由 Stable Diffusion 2.0 生成的各种各样的“(提示,图像)”对的数据集上进行预测,以了解潜在关系的可逆性有多强。
评估标准:提交的评估使用预测提示嵌入向量和实际提示嵌入向量之间的平均余弦相似度得分。
比赛时间:2023.2-2023.5
金牌方案:
第一名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/411237
第二名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410606
第三名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410686
第四名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410798
第五名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410688
第六名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410768
第七名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410618
第十一名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410611
第十二名:https://www.kaggle.com/competitions/stable-diffusion-image-to-prompts/discussion/410657
3.微型企业密度预测大赛

比赛链接:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting
比赛背景:本次竞赛的目标是预测给定地区的每月微型企业密度。参赛者将开发一个针对美国县级数据训练的准确模型。参赛者的工作将帮助政策制定者了解微型企业,这是非常小实体的增长趋势。更多信息将使新的政策和计划能够提高这些最小企业的成功和影响。
评估标准:提交的评估使用预测值和实际值之间的对称平均绝对百分比误差(SMAPE)。当预测值和实际值同时为0时,我们定义SMAPE为0。
比赛时间:2022.12-2023.3
金牌方案:
第一名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/395131
第二名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/395264
第三名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/418287
第四名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/394821
第六名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/417821
第十名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/418770
第十一名:https://www.kaggle.com/competitions/godaddy-microbusiness-density-forecasting/discussion/417803
4.股票市场波动率预测大赛

比赛链接:https://www.kaggle.com/c/optiver-realized-volatility-prediction/data
比赛背景:在这个比赛的前三个月中,参赛者将构建模型来预测跨不同行业的数百只股票的短期波动率。参赛者可以获取数亿行高度细致的金融数据,用这些数据设计模型来预测10分钟周期内的波动率。参赛者的模型将在训练后的数据集的三个月评估期内与真实的市场数据进行评估。通过这个比赛,参赛者将对波动率和金融市场结构有宝贵的洞见。
评估标准:提交的评估使用均方根百分比误差(RMSPE),定义为:

比赛时间:2021.6-2022.1
金牌方案:
第一名:https://www.kaggle.com/competitions/optiver-realized-volatility-prediction/discussion/274970
第三名:https://www.kaggle.com/competitions/optiver-realized-volatility-prediction/discussion/278676
第七名:https://www.kaggle.com/competitions/optiver-realized-volatility-prediction/discussion/276506
5.简街市场预测大赛

比赛链接:https://www.kaggle.com/competitions/jane-street-market-prediction/overview
比赛背景:在一个完全有效的市场中,买家和卖家将拥有做出理易决策所需的所有代理和信息。因此,产品将始终保持其“公允价值”,永远不会被低估或定价过高。然而,金融市场在现实世界中并不完全有效。
制定交易策略以识别和利用低效率是具有挑战性的。即使一种策略现在有利可图,也可能在未来不会,市场波动使得无法确定地预测任何给定交易的盈利能力。因此,很难将好运气与做出良好的交易决定区分开来。
在此挑战中,参赛者将建立自己的量化交易模型,以使用来自全球主要证券交易所的市场数据最大化回报。
评估标准:该竞赛根据效用分数进行评估。
比赛时间:2021.2-2021.8
金牌方案:
第一名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224348
第三名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224713
第十名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/226837
6.M5预测-不确定性大赛

比赛链接:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/overview/timeline
比赛背景:在本次竞赛(第五次迭代)中,参赛者将使用全球收入最大的公司沃尔玛的分层销售数据来预测未来 28 天的每日销售额,并为这些预测进行不确定性估计。该数据涵盖美国三个州(加利福尼亚州、德克萨斯州和威斯康星州)的商店,包括项目级别、部门、产品类别和商店详细信息。此外,它还具有解释变量,例如价格、促销、星期几和特殊事件。总之,这个强大的数据集可用于提高预测准确性。
如果成功,参赛者的工作将继续推进预测的理论和实践。所使用的方法可以应用于各种业务领域。
评估标准:本次比赛使用加权缩放弹球损失(WSPL)。
比赛时间:2020.6.1-2020.6.23
金牌方案:
第二名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/166875
第三名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/166854
第五名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/163559
第六名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/168053
第十名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/163151
第十一名:https://www.kaggle.com/competitions/m5-forecasting-uncertainty/discussion/163219
扫码添加小享,回复“时间序列”
免费获取金牌方案baseline代码合集

7.M5时间序列预测大赛

比赛链接:https://www.kaggle.com/c/m5-forecasting-accuracy/
比赛背景:在本次竞赛(第五次迭代)中,参赛者将使用全球收入最大的公司沃尔玛的分层销售数据来预测未来 28 天的每日销售额。该数据涵盖美国三个州(加利福尼亚州、德克萨斯州和威斯康星州)的商店,包括项目级别、部门、产品类别和商店详细信息。此外,它还具有解释变量,例如价格、促销、星期几和特殊事件。总之,这个强大的数据集可用于提高预测准确性。
如果成功,参赛者的工作将继续推进预测的理论和实践,所使用的方法可以应用于各种业务领域。
评估标准:本次竞赛使用加权均方根缩放误差(RMSSE)。
比赛时间:2020.6.1-2020.6.30
金牌方案:
第一名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/163684
第二名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/164599
第三名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/164374
第四名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/163216
第五名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/163916
第七名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/164826
第十四名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/163211
第十六名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/169085
第二十一名:https://www.kaggle.com/competitions/m5-forecasting-accuracy/discussion/164685
8.餐厅人流预测大赛

比赛链接:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/overview
比赛背景:一个常见的困境是,餐馆需要知道每天有多少顾客可以有效地购买食材并安排员工。这个预测并不容易做出,因为许多不可预测的因素会影响餐厅的出勤率,比如天气和当地竞争。对于历史数据很少的新餐厅来说,这更难。
在本次竞赛中,参赛者面临的挑战是使用预订和访问数据来预测未来日期餐厅的访客总数。这些信息将帮助餐厅提高效率,并使他们能够专注于为顾客创造愉快的用餐体验。
评估标准:提交内容根据均方根对数误差进行评估。RMSLE 的计算公式为:

比赛时间:2018.1-2018.2
金牌方案:
第一名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49129
第七名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49259
第八名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49166
第十名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49201
第十一名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49177
第十二名:https://www.kaggle.com/competitions/recruit-restaurant-visitor-forecasting/discussion/49251
9.预测商品销量大赛

比赛链接:https://www.kaggle.com/competitions/competitive-data-science-predict-future-sales/overview
比赛背景:在本次比赛中,参赛者将使用一个具有挑战性的时间序列数据集,该数据集由俄罗斯最大的软件公司之一 - 1C Company提供,由每日销售数据组成。
我们要求参赛者预测下个月每种产品和商店的总销售额。通过解决这个竞赛,参赛者将能够应用和提高你的数据科学技能。
评估标准:提交通过均方根误差 (RMSE)进行评估。真正的目标值被裁剪到 [0,20] 范围内。
比赛时间:a year to go
金牌方案:尚未结束
10.实体店销售 - 时序预测大赛

比赛链接:https://www.kaggle.com/competitions/store-sales-time-series-forecasting/overview/evaluation
比赛背景:在此“入门”竞赛中,参赛者将使用时间序列预测来预测来自厄瓜多尔大型杂货零售商 Corporación Favorita 的数据的商店销售额。
具体而言,参赛者将构建一个模型,该模型可以更准确地预测在不同 Favorita 商店销售的数千种商品的单位销售额。参赛者将使用包含日期、商店和商品信息、促销和单位销售的平易近人的训练数据集来练习机器学习技能。
评估标准:本次竞赛的评估指标是均方根对数误差。
比赛时间:Ongoing
11.杂货销售预测大赛

比赛链接:https://www.kaggle.com/c/favorita-grocery-sales-forecasting
比赛背景:Corporación Favorita向 Kaggle 社区提出了挑战,要求他们建立一个更准确地预测产品销售的模型。他们目前依赖于主观预测方法,几乎没有数据支持,执行计划的自动化也很少。他们很高兴看到机器学习如何通过在正确的时间提供足够的正确产品来更好地确保他们取悦客户。
评估标准:提交内容根据归一化加权均方根对数误差 (NWRMSLE) 进行评估。
比赛时间:2018.1.8-2018.1.15
金牌方案:
第一名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47582
第二名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussio-n/47568
第三名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47560
第四名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47529
第五名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47556
第六名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47575
第八名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47564
第十二名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47667
第十三名:https://www.kaggle.com/competitions/favorita-grocery-sales-forecasting/discussion/47542
扫码添加小享,回复“时间序列”
免费获取金牌方案baseline代码合集
