多元线性回归模型表示一种地理现象与另外多种地理现象的依存关系,这时另外多种地理现象***同对一种地理现象产生影响,作为影响其分布与发展的重要因素。
稀疏模型:
稀疏模型将大量的冗余变量去除,只保留与响应变量最相关的解释变量,简化了模型的同时却保留了数据集中最重要的信息,有效地解决了高维数据集建模中的诸多问题。稀疏模型具有更好的解释性,便于数据可视化、减少计算量和传输存储。
1996年Tibshirani把岭回归估计的L2范数罚正则化项替换为L1范数罚正则化项得到了Lasso(Least Absolute Shrinkage and Selection Operator, Lasso)。L1范数罚具有产生稀疏模型的能力,使用L1范数罚作为正则化项的Lasso具有变量选择功能和变量空间降维功能。
实际上在Lasso之前已有能够产生稀疏解的非负绞刑估计 (nonnegative garrote estimator)和桥回归(bridge regression)模型被提出。
但由于缺少高效的求解算法因而没有引起足够的重视,而自从Lasso这种稀疏模型以及可对其有效求解的LAR算法(Least Angle Regression, LAR)被提出后,稀疏模型才得到了广泛深入的研究,并在机器学习、数理统计和生物信息学等领域逐渐流行起来。