2023美赛建模C题:预测Wordle结果 - 思路分析
背景
Wordle是《纽约时报》每日推出的一款很受欢迎的拼图游戏。玩家试图解决通过在六次或更少的尝试中猜出一个五个字母的单词,每次猜测都得到反馈。对于这个版本,每个猜测必须是一个实际的英语单词。无法识别的猜测因为比赛中的词语是不允许的。Wordle的流行度和版本不断增长这款游戏现在有超过60种语言版本。

玩家可以在普通模式或“困难模式”中玩游戏。Wordle的困难模式使游戏更加难度在于要求玩家在单词中找到正确的字母(贴图是黄色或绿色),这些字母必须在后续的猜测中使用。图1中的示例被播放困难模式。
许多(但不是全部)用户在Twitter上报告他们的分数。对于这个问题,MCM生成了一个2022年1月7日至2022年12月31日的每日结果文件(见附件1)文件包括日期,比赛号码,当天的单词,报告分数的人数那天,进入困难模式的玩家人数,以及在一分钟内猜出单词的百分比尝试,两次尝试,三次尝试,四次尝试,五次尝试,六次尝试,或无法解决谜题(由X)。例如,在图2中,2022年7月20日的单词为“TRITE”,结果为通过挖掘推特获得。尽管在某些情况下,图2中的百分比总和为100%由于四舍五入,这可能不是真的

回答以下问题
《纽约时报》要求你对这份文件中的结果进行分析回答几个问题。
•报告结果的数量每天都在变化。建立一个模型来解释这种变化使用您的模型为3月份报告的结果数量创建一个预测区间1, 2023。这个词的任何属性会影响被报告的分数的百分比吗在困难模式下玩?如果有,怎么做?如果不是,为什么不是?
•对于一个给定的未来解决方案,在未来的日期,建立一个模型,让你预测报告结果的分布。换句话说,预测相关的(1、2、3、4、5、6、X)的百分比。不确定性与什么有关你的模型和预测?举一个你预测这个单词的具体例子2023年3月1日的《怪诞》。你对模型的预测有多大信心?
•开发并总结了一个模型,按难度对解词进行分类。识别与每个分类相关联的给定单词的属性。用你的模型,EERIE这个词有多难?讨论你的分类模型的准确性。
•列出并描述该数据集的一些其他有趣的特征
思路分析
本题的核心思路可以使用lstm做时间序列预测,具体思路会放到群里,持续更新
资料思路分享Q群:714452621