激活函数

阅读：1325615032 分享到

激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。

激活函数的特点

优秀的激活函数应满足：

1.非线性：激活函数非线性时，多层神经网络可逼近所有函数。

2.可微性：优化器大多用梯度下降更新参数。

3.单调性：当激活函数是单调的，能保证单层网络的损失函数是凸函数。

4.近似恒等性：f(x)≈x当参数初始化为随机小值时，神经网络更稳定

激活函数输出值的范围：

1.激活函数输出为有限值时，基于梯度的优化方法更稳定。

2.激活函数输出为无限值时，建议调小学习率。

激活函数总之就是我们的神经网络前向传播结果的一个函数，该函数可以很好的调整前向传播结果，使其在梯度下降过程中更平滑更友好。

常见的激活函数有：sigmoid、tanh、ReLU、Leaky ReLU、PReLU、RReLU、ELU、softplus、softsign、softmax等，下面介绍几个典型的激活函数。

sigmoid 激活函数

在 tensorflow 中，tf.nn.sigmoid 实现了sigmoid 激活函数的计算。

sigmoid 函数的优点：

1.输出映射在(0, 1)之间，单调连续，输出范围有限，优化稳定，可用作输出层。

2.求导容易。

sigmoid 函数的缺点：

1.易造成梯度消失。

2.输出非0均值，收敛慢。

3.幂运算复杂，训练时间长。

sigmoid 函数可应用在训练过程中。然而，当处理分类问题作出输出时，sigmoid 却无能为力。简单地说，sigmoid 函数只能处理两个类，不适用于多分类问题。而 softmax 可以有效解决这个问题，并且 softmax 函数大都运用在神经网路中的最后一层网络中，使得值得区间在（0,1）之间，而不是二分类的。