Spatially Varying Relation between Built
Spatially Varying Relation between Built Environment and Station-Level Subway Passenger-Distance 2023 Journal of Advanced Transportation SCI4区 SWJTU 阅读原因:和前篇文章有关联,赵学长写的 Abstract: 本文研究了建筑环境和乘客距离的关系(station-level passenger-distance,SLPD,乘客在特定站点上下车的总行程长度),比较GWR和MGWR模型,并得到11个与SLPD有关的因变量。 Ridership means the number of trip for each station也就是说,乘数代表一个站点上下车的次数 这篇文章提出前,已有GWR\MGWR提出来用于分析 Introduction: R. Ewing and R. Cervero, “Travel and the built environment,” Journal of the American Planning Association, vol. 76, no. 3, pp. 265–294, 2010.和R. Ewing and R. Cervero, “Travel and the built environment: a synthesis,” Transportation Research Record: Journal of the Transportation Research Board, vol. 1780, no. 1, pp. 87–114, 2001.这两篇文章揭示了建筑环境变量由3个变为了6个 Literature Review: J. Zhao, W. Deng, Y. Song, and Y. Zhu, “What influences Metro station ridership in China? Insights from Nanjing,” Cities, vol. 35, pp. 114–124, 2013. 这篇文章 OLS(Ordinary least squares,普通最小二乘) S. Li, D. Lyu, G. Huang et al., “Spatially varying impacts of built environment factors on rail transit ridership at station level: a case study in Guangzhou, China,” Journal ofTransport Geography, vol. 82, Article ID 102631, 2020. 这篇文章GWR(geographically weighted regression models,地理加权回归) M.-J. Jun, K. Choi, J.-E. Jeong, K.-H. Kwon, and H.-J. Kim, “Land use characteristics ofsubway catchment areas and their influence on subway ridership in Seoul,” Journal ofTransport Geography, vol. 48, pp. 30–40, 2015.这篇文章MGWR(mixed geographically weighted regression,混合地理加权回归) Data Description: Buffer Zone (缓冲区):在地图上绘制的区域,通常是一个围绕着特定点、线或区域的边界。 Catchment Area (覆盖区域):特定地点或设施(如铁路站、商店、医院等)的服务范围。 用arcgis测量了136*136个成都站点的距离 因为因变量呈左偏态分布。所以对自变量进行了对数处理(?),这是一种常见的数据预处理方法,提高拟合效果和准确性。 咱们确定聚类数量可以同时用肘部法和轮廓系数。这篇文章聚类的数据是每个地铁站的25个自变量(?) 这篇文章哪些内容配什么图可以借鉴一下。 Logarithm对数 Models and Methods: 这两篇文章都对ols,gwr,mgwr做了介绍,但提炼了不同说法 Results and Discussion: 当构建回归模型的时候,为了防止参数不准确和模型不稳定。可以使用了方差膨胀因子(VIF)来衡量自变量之间的相关性。一般来说,当VIF小于10时,表示自变量之间没有多重共线性问题。需要把VIF大于10的变量排除。 文章还对每个影响因变量的环境变量做了详细分析。 用GWR 4.0这个软件可以对MGWR和GWR进行拟合。 Residual(残差)指的是实际观测值与回归模型(通常是线性回归模型)预测值之间的差异或偏差。用来评估回归模型的拟合程度和模型的有效性. AIC(Akaike Information Criterion):赤池信息准则,用于衡量模型对数据的拟合程度以及模型的复杂度。AIC值越低表示模型在拟合数据和保持简单性之间取得了更好的平衡。 AICc(Akaike Information Criterion with correction):经过修正的赤池信息准则,用于修正样本量较小的情况下AIC的偏差。AICc通常在样本量较小的情况下更可靠。 BIC(Bayesian Information Criterion):贝叶斯信息准则,类似于AIC,但对模型复杂度的惩罚更严格。BIC值也越低越好。 CV(Cross-validation):交叉验证,是一种通过将数据集分为训练集和测试集来评估模型性能的方法。通常使用K折交叉验证,其中数据集被分成K个子集,模型在其中K次训练和测试。CV可以用于估计模型的泛化性能。 R-squared(R2):决定系数,表示因变量的变异中可以由模型解释的部分比例。R2值范围从0到1,越接近1表示模型能够更好地解释因变量的变异性。 Adjusted R-squared(Adj.R2):调整后的决定系数,考虑了模型中自变量的数量。它通过惩罚模型中不必要的自变量来避免过拟合,通常在比较不同模型时更有用。 全局变量(Global Variable)、局部变量(Local Variable):全局变量具有更广泛的作用域和较长的生命周期,而局部变量具有更窄的作用域和较短的生命周期。 第十页右边的那一段居然数字标错了,Figure 14应该只有3个submaps 未来方向:增加人口密度和区域经济的数据,缓冲区选取800米半径的圆的科学性需要进一步探讨,MWGR模型不能对时间因素分析、一刀切地使用圆形缓冲区可能没考虑到地形的障碍和不连续性 要是对成都个地铁站与周边环境的相互关系科学数据分析的人应该看看这篇

