今天在sigmoid
函数中使用 numpy.exp
的时候,遇到了 RuntimeWarning: overflow encountered in exp
,看到其他人的博客里面的解决方法。
# https://www.cnblogs.com/zhhy236400/p/9873322.html
def sigmoid(inx):
if inx>=0: #对sigmoid函数的优化,避免了出现极大的数据溢出
return 1.0/(1+exp(-inx))
else:
return exp(inx)/(1+exp(inx))
作者其实说清楚了,但是我自己看得时候,总觉得不太直观,差那么一点意思。于是就自己写一下。
f ( x ) = e x f(x) = e^xf(x)=ex 的函数如下图:
x > = 0 x >= 0x>=0 时,e x e^xex 随 x xx 增长比较快,就很容易上溢。
对于 sigmoid 函数,
s i g m o i d = 1 1 + e − x sigmoid = \frac{1}{1 + e^{-x}}sigmoid=1+e−x1
如果在使用过程中 x < 0 x < 0x<0 ,e − x e^{-x}e−x 就非常容易上溢。
RuntimeWarning: overflow encountered in exp
和 sigmoid
本身没有关系,只和 e − x e^{-x}e−x 有关。
- x < 0 , 令 t = − x , 则 t > 0 , e t x < 0, 令 t = -x, 则t > 0, e^tx<0,令t=−x,则t>0,et 就非常容易上溢出。
- x > 0 , 令 t = − x , 则 t < 0 , e t ∈ ( 0 , 1 ) x > 0, 令 t = -x, 则t < 0, e^t \in (0, 1)x>0,令t=−x,则t<0,et∈(0,1) 就不会有什么问题。
而
1 1 + e − x = e x e x + 1 \frac{1}{1 + e^{-x}} = \frac{e^x}{e^{x} + 1}1+e−x1=ex+1ex
那么就可以根据 x xx 是否大于零,来选择两个公式。
但是 x < 0 x < 0x<0 时,e x e^xex 同样有下溢的风险。
只是 numpy
报了 warning
,而 python 没有报而已,两者并没有任何差别。
参考:
https://www.cnblogs.com/zhhy236400/p/9873322.html
版权声明:本文为CY_TEC原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。