背景
大一做项目,使用过huff模型与gwr模型(地理加权回归)的线性化。在处理数据过程中也遇到了平滑数据处理的问题。这里做一个总结记录。
非线性模型转换为线性模型
背景
模型可以分为线性模型和非线性模型,有时候为了处理需要将线性模型转换为非线性模型,如地理加权回归模型只能适用于线性数据,而huff模型是非线性模型,两种模型结合的一个方法就是将huff模型线性化,再利用地理加权回归进行线性回归分析。
非线性关系线性化的几种情况
一般我们可以直接对模型两侧取对数,转换为线性模型,例如:
对于指数曲线 y = d e b x y=de^{bx}y=debx ,令 y ′ = l n y y^{'}=ln^{y}y′=lny,可以将其转化为直线形式: y ′ = a + b x ′ y^{'}=a+bx^{'}y′=a+bx′,其中a = l n d a=ln^{d}a=lnd;
对于幂函数曲线y = d x b y=dx^{b}y=dxb,令y ′ = l n y y^{'}=ln^{y}y′=lny,x ′ = l n x x^{'}=ln^{x}x′=lnx,可以将其转
化为直线形式:y ′ = a + b x ′ y^{'}=a+bx^{'}y′=a+bx′其中,a = l n d a=ln^{d}a=lnd;
其他的情况可以将非线性的x、y整体视为未知数进行替换。如把
x ′ 视为 n x x^{'}视为n^{x}x′视为nx:
对于对数曲线y = a + b l n x y=a+bln^{x}y=a+blnx,令y ′ = y y^{'}=yy′=y,x ′ = l n x x^{'}=ln^{x}x′=lnx,可以将其转化为直线形式:y ′ = a + b x ′ y^{'}=a+bx^{'}y′=a+bx′;
对于双曲线1 y = a + 1 x \frac{1}{y}=a+\frac{1}{x}y1=a+x1,令y ′ = 1 y y^{'}=\frac{1}{y}y′=y1,x ′ = 1 x x^{'}=\frac{1}{x}x′=x1,转化为直线形式:y ′ = a + b x ′ y^{'}=a+bx^{'}y′=a+bx′;
应用
对原始竞争选址模型进行线性变换是应用地理加权回归模型的前提。这是因为地理加权回归模型只能适用于线性模型,对于非线性模型则需要对其进行线性变换。本文应用 NC 变换(Nakanishi and Cooper’s transformation)对模型进行处理,使其无损变换为线性模型。本文以 Huff 模型敏感参数的评估精度来度量选址的竞争。Huff 模型作为竞争选址的主要方法,是一种非线性模型。为了探索Huff 模型敏感参数的空间异质性,需要对其进行线性变换。Huff 模型变换以后,如下式所示:

通过gwr回归后的结果具有了空间异质性。能够反映不同空间商圈的吸引力。
平滑数据处理
在数据处理中,经常要计算数据出现的概率估计。但是,算法训练的时候,可能会出现值为零的数据,人们发明了不少可以改善新数据出现的概率算法,即数据的平滑。最常见的数据平滑思路包括如下几种:
1,对0值直接+1
2,加k,k可以是一个很小的值。
如:B i = [ a N ∗ I + ( 1 − a ) A ] B i − 1 B_{i}=[\frac{a}{N}*I+(1-a)A]B_{i-1}Bi=[Na∗I+(1−a)A]Bi−1;a为一个很小的值。
参考文献
[1]Jiang, W.; Wang, Y.; Dou, M.; Liu, S.; Shao, S.; Liu, H. Solving Competitive Location Problems with Social Media Data Based on Customers’ Local Sensitivities. ISPRS Int. J. Geo-Inf. 2019, 8, 202. https://doi.org/10.3390/ijgi8050202
[2] 吴军, 数学之美
[3] https://blog.csdn.net/fuermolei/article/details/81353746
新开通了本人的公众号,欢迎关注:燕南路GISer ,专注GIS干货分享,不定期更新。
主要兴趣:GIS、时空数据挖掘、python、机器学习深度学习
CSDN的部分内容会重写再搬迁到公众号,欢迎关注!