逻辑回归是应用非常广泛的一个分类机器学习演算法,它将数据拟合到一个logistic函数中,从而能够完成对事件发生的概率进行预测。从大的类别上来说,逻辑回归是一种有监督的统计学习方法,主要用于对样本进行分类。
对于每一个输入的x,都有一个对应的y输出。x和y都是连续型数据。但是对于逻辑回归,输入可以是连续的,但输出一般是离散的,即只有有限多个输出值。例如,其值域可以只有两个值{0, 1},这两个值可以表示对样本的某种分类,高/低、患病/健康、阴性/阳性等,这就是最常见的二分类逻辑回归。
逻辑回归与线性回归模型的形式基本上相同,都具有 ax+b,其中a和b是待求参数,其区别在于他们的因变数不同,线性回归直接将ax+b作为因变数,即y = ax+b,而logistic回归则通过函数S将ax+b对应到一个隐状态p,p= S(ax+b),然后根据p与1-p的大小决定因变数的值。这里的函数S就是Sigmoid函数。