S6G1L5 点列的回归曲线

给定一串点列,如何找到合适的拟合曲线呢?在 Geogebra 中已经内建统计数值分析模型,方便我们直接获取数据的一维与二维的统计资料分析。在二维的数据分析中,还可切换 [线性/指数/成长曲线/多项式/逻辑拟合] 等回归模型。在这次案例,我以【学用数学】公众号的关注人数来作一个初步的回归分析。


背景说明
这次分析的资料是 [学用数学] 从 2019/10/24 到 2020/6/3 公众号的订阅人数数据。在用线型回归模型时,得到回归直线为 y=4 x + 21 。表示这段期间在以每日 4 人的数量在增加。

但这图形后半段的增幅较大,若对 2020/4/1 到 2020/5/3 作回归分析可得 y = 7.3x - 590 。在这一个月是以每天7.3 人的增量在增长。而在在 2019/10/24~2020/3/31 这60天的平均日增约是 3 人。

若用【成长曲线】来作回归可得 y = 92*1.012^x 。在回归选项中还有个【指数曲线】也是会得到相同的函数,只不过在其解析式是用 e 为底来表示,在此例写为 y = 92xe^(0.01x) 。

然而对于人口规模模型,一般都无法持续等比增长,比较合理的增长都是用 logistic 回归(逻辑斯蒂曲线拟合)。在这模型会有个数量的最大上限,以目前这个数据得到的数值为 2975。

而我期待在 40岁生日前关注人数达到 14610 人,利用这个预期数据找出如下几类拟合曲线。
以指数拟合,每日 1.01倍再增长,则其函数为 y=79.5*1.01^x 。
若用 Logistic 拟合,设定通过 (224,1024), (524,14610), (730,16384) 这三点,则得到函数为 y = 16472/(1+534*exp(-0.02x))。
用三次多项式拟合现有的数据得到的为蓝色曲线,y=0.000169x^3-0.05x^2+7.13x 。

学习指引:
这次主要是认识 Geogbra 的曲线拟合功能。这次定位为 Lv 4 的难度,在学习这个课程时。若是 Lv1~2 的新手,可只完成【任务一】的部分,同时建议复习基础教程中的 《S411L3 表格区与递回关系》的基础教学视频。在【任务二】将利用序列对原资料作些重新取样与调整。在【任务三】会在了解、[多项式拟合]与[逻辑斯蒂拟合]
基础教程
S411L3 表格区与递回关系
https://mp.weixin.qq.com/s/Pt4NGNhE3Pjp8jruv83GYg
https://www.bilibili.com/video/BV14x41197wy/

数学思维
理解线性拟合与直线回归方程
理解曲线拟合
Geogebra 技能
利用表格区的[双变数回归分析]
[多项式拟合]、[逻辑斯蒂曲线拟合]
任务一:利用表格区作拟合曲线
【目的】将表格区的资料作双变数回归分析。
数据资料: https://ggb123.cn/classic/hkbw56jh
阶段作品:https://ggb123.cn/classic/eqqupmtq
【分析】GGB 已内建回归曲线绘制功能,从 [表格区] 点选资料,就可一键生成回归分析的图。并可切换 [线性/指数/成长曲线/多项式/逻辑拟合] 等回归模型,获得对应的回归解析式以及函数图像。
【操作】
1. 先由 https://ggb123.cn/classic/hkbw56jh 打开含数据资料的 GGB,另存一份获取资料。
2.通过以下步骤,来取得数据的回归模型,可切换模型观察不同模型的回归曲线。得到回归模型函数后,可以计算预测点的数值。
(1)选取栏位资料,(2)点选【双变数回归分析】(3)选取合适的回归模型

3. 可点选上方的统计资料观察到相关系数,标准差等资料。另外,也可显示残差图。


任务二:重新取样后再作拟合曲线
【目的】要对表格的数据作些重新的采样,观察不同采样数据点时,回归曲线的变化。
阶段作品: https://ggb123.cn/classic/f5vta8ra
【分析】可将图像同步到代数区与绘图区,同步后可得到原始资料的list,通过滑动条 start, end, gap 来控制取样的范围,得到新的点列。再对这点列利用多项式拟合、指数拟合得到新的拟合函数。
【操作】
从统计图表区,点选上方的复制到绘图区

2. 建立三个滑动条 start, end, gap
n = 224
start = 滑动条(1,n,1)
end = 滑动条(1,n,1)
gap = 滑动条(1,30,1)
lgap = 序列(l1(k), k, start, end, gap)
fp3 =多项式拟合(lgap,3)
fp1 =多项式拟合(lgap,1)
fexp =生长曲线拟合(lgap)

任务三:逻辑斯蒂曲线拟合的探讨
【目的】当预期在 x=524, y=14610 ,那该找个哪类拟合曲线较合适。
阶段作品: https://ggb123.cn/classic/rrhedvc2
【分析】我们想基于现有的几个取样点 (69,331), (160,520), (224,1024) (524,14610) 来找到合适的拟合曲线。其中利用四个点可以拟合三次以下的多项式。我们将设定一个滑动条k 来观察不同次数的拟合多项式。
但对于人口增长的模型,通常有个最大上限,这时比较好的模型是用逻辑斯蒂曲线拟合。我们再增加一个动点来观察不同最大值时的逻辑斯蒂曲线拟合。

【操作】先建立几个取样点再直接套用拟合函数。
建立拟合点
P1=(69,331)
P2 =(160,520)
P3=(224,1024)
P4=(524,14610)
P5=(730,16384)
Ps = {P1,P2,P3,P4,P5}
2. 设定拟合曲线
k=3
pkl1 = 多项式拟合(l1,k)
pkps = 多项式拟合(Ps,k)
logil1 = 逻辑斯蒂曲线拟合(l1)
logips = 逻辑斯蒂曲线拟合(Ps)


延伸练习
你可使用以下资料 Covid-19 的全球感染人数,来作个相关练习
资料:https://ggb123.cn/m/hupayr28
参考作业:https://www.geogebra.org/m/gqjapce9#chapter/496526

小结
统计这类要需要大量计算的问题,就适合搭配 Geogebra 等计算软件来进行教学。Geogebra 现在内建很多统计相关函数,可以一个指令就快速调用这些统计函数。这次的任务主要介绍 GGB 的统计的回归分析功能,可看到除了直线回归,还可作到多项式、指数、逻辑斯蒂曲线回归等功能。本次任务除了让大家认识回归功能外,也希望介绍逻辑斯蒂曲线这函数。让大家从「用数学」的角度来欣赏数学的实用之美。
限时挑战
欢迎加微信 Acchu0331 入群打卡学习,每次任务有 20 元奖励红包。此次任务小打卡中获得最多赞可得 8元人气奖,另抽一位打卡者获得手气奖 8元 。另外,还有 4 个 总额 4元的随机红包为关注奖。本次任务的打卡期限为 2020/6/23。请参考视频,交一份作业在小打卡内,附上作品截图或动图,并写下 32 字以上的心得,如以下格式。
任务:S6G1 点列的回归曲线
姓名:朱安强
心得:Geogebr 的统计功能真的很方便,可以快速计算出各类回归模型,且还可在代数区作后续的加工调整。使得方便改变样本点就可即时观看回归曲线的变化。
作品:https://www.geogebra.org/m/jbteh5tc
相关资料
Bili 视频:https://www.bilibili.com/video/BV1wT4y1J7sY/
Bili 文章:https://www.bilibili.com/read/cv6359310
公众号:https://mp.weixin.qq.com/s/G7I49sLWqii6K_egZJ0v0g
GGB 绘本:https://www.geogebra.org/m/gqjapce9#chapter/496526
youtube :https://www.youtube.com/playlist?list=PLXH05kw-i_5K29N2fsK0EBg8USYMPWk_f
