逻辑回归(LogisticRegression)参数介绍

class sklearn.linear_model.LogisticRegression(penalty=’l2’dual=Falsetol=0.0001C=1.0fit_intercept=Trueintercept_scaling=1class_weight=Nonerandom_state=Nonesolver=’warn’max_iter=100multi_class=’warn’verbose=0warm_start=Falsen_jobs=Nonel1_ratio=None)

penalty:惩罚项,可为'l1' or 'l2''netton-cg', 'sag', 'lbfgs'只支持'l2'

  1. 'l1'正则化的损失函数不是连续可导的,而'netton-cg', 'sag', 'lbfgs'这三种算法需要损失函数的一阶或二阶连续可导。
  2. 调参时如果主要是为了解决过拟合,选择'l2'正则化就够了。若选择'l2'正则化还是过拟合,可考虑'l1'正则化。
  3. 若模型特征非常多,希望一些不重要的特征系数归零,从而让模型系数化的话,可使用'l1'正则化。

dual:选择目标函数为原始形式还是对偶形式。

将原始函数等价转化为一个新函数,该新函数称为对偶函数。对偶函数比原始函数更易于优化。

  • tol:优化算法停止的条件。当迭代前后的函数差值小于等于tol时就停止。

 

  • C:正则化系数。其越小,正则化越强。
  • fit_intercept:选择逻辑回归模型中是否会有常数项bb。
  • intercept_scaling
  • class_weight:用于标示分类模型中各种类型的权重,{class_label: weight} or 'balanced'

    1. 'balanced':类库根据训练样本量来计算权重。某种类型的样本量越多,则权重越低。
    2. 若误分类代价很高,比如对合法用户和非法用户进行分类,可适当提高非法用户的权重。
    3. 样本高度失衡的。如合法用户9995条,非法用户5条,可选择'balanced',让类库自动提高非法用户样本的权重。
  • random_state:随机数种子。
  • solver:逻辑回归损失函数的优化方法。

    1. 'liblinear':使用坐标轴下降法来迭代优化损失函数。
    2. 'lbfgs':拟牛顿法的一种。利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。
    3. 'newton-cg':牛顿法的一种。同上。
    4. 'sag':随机平均梯度下降。每次迭代仅仅用一部分的样本来计算梯度,适合于样本数据多的时候。
    5. 多元逻辑回归有OvR(one-vs-rest)和MvM(many-vs-many)两种,而MvM一般比OvR分类相对准确一些。但是,'liblinear'只支持OvR。
  • max_iter:优化算法的迭代次数。
  • multi_class'ovr' or 'multinomial''multinomial'即为MvM。

    1. 若是二元逻辑回归,二者区别不大。
    2. 对于MvM,若模型有T类,每次在所有的T类样本里面选择两类样本出来,把所有输出为该两类的样本放在一起,进行二元回归,得到模型参数,一共需要T(T-1)/2次分类。
  • verbose:控制是否print训练过程。
  • warm_start
  • n_jobs:用cpu的几个核来跑程序。

 ## penalty: 过拟合解决参数,l1或者l2

## solver: 参数优化方式 ### 当penalty为l1的时候,参数只能是:liblinear(坐标轴下降法);

### nlbfgs和cg都是关于目标函数的二阶泰勒展开 ### 当penalty为l2的时候,参数可以是:lbfgs(拟牛顿法)、newton-cg(牛顿法变种),seg(minibatch)

# 维度<10000时,lbfgs法比较好, 维度>10000时, cg法比较好,显卡计算的时候,lbfgs和cg都比seg快

## multi_class: 分类方式参数;参数可选: ovr(默认)、multinomial;这两种方式在二元分类问题中,效果是一样的;在多元分类问题中,效果不一样

### ovr: one-vs-rest, 对于多元分类的问题,先将其看做二元分类,分类完成后,再迭代对其中一类继续进行二元分类

### multinomial: many-vs-many(MVM),对于多元分类问题,如果模型有T类,我们每次在所有的T类样本里面选择两类样本出来,

#### 不妨记为T1类和T2类,把所有的输出为T1和T2的样本放在一起,把T1作为正例,T2作为负例,

#### 进行二元逻辑回归,得到模型参数。我们一共需要T(T-1)/2次分类

 


版权声明:本文为weixin_41690708原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。