生成式算法和判别式算法的区别是什么?

下面是CS299课堂讲稿中最重要的部分(作者:Andrew Ng)，它帮助我理解了判别学习算法和生成学习算法之间的区别。

假设我们有两类动物，大象(y = 1)和狗(y = 0)， x是动物的特征向量。

给定一个训练集，像逻辑回归或感知器算法这样的算法(基本上)试图找到一条直线——也就是一个决策边界——将大象和狗分开。然后，分类一种新动物，比如大象或狗，它会检查它的哪一边决定其所处的边界，并据此做出预测。我们称之为判别学习算法。

这里有一个不同的方法。首先，看看大象，我们可以建立一个大象的模型。然后，看着狗，我们可以建立一个单独的狗狗模型。最后，为了给一种新动物分类，我们可以将新动物与大象模型相匹配，并将其与狗的模型，看看新动物是否更像大象或者更像我们在训练场上看到的狗。我们称之为生成式学习算法。

想象一下，你的任务是将演讲分类为一种语言。

你可以通过以下任何一种方式:

学习每一种语言，然后用你刚刚学到的知识对它进行分类

or

在不学习语言的情况下确定语言模型的差异，然后对语音进行分类。

第一种是生成方法，第二种是判别方法。

查看参考资料了解更多细节:http://www.cedar.buffalo.edu/~srihari/CSE574/Discriminative-Generative.pdf。

下面是CS299课堂讲稿中最重要的部分(作者:Andrew Ng)，它帮助我理解了判别学习算法和生成学习算法之间的区别。

假设我们有两类动物，大象(y = 1)和狗(y = 0)， x是动物的特征向量。

给定一个训练集，像逻辑回归或感知器算法这样的算法(基本上)试图找到一条直线——也就是一个决策边界——将大象和狗分开。然后，分类一种新动物，比如大象或狗，它会检查它的哪一边决定其所处的边界，并据此做出预测。我们称之为判别学习算法。

这里有一个不同的方法。首先，看看大象，我们可以建立一个大象的模型。然后，看着狗，我们可以建立一个单独的狗狗模型。最后，为了给一种新动物分类，我们可以将新动物与大象模型相匹配，并将其与狗的模型，看看新动物是否更像大象或者更像我们在训练场上看到的狗。我们称之为生成式学习算法。

一般来说，机器学习社区有一个惯例，那就是不要学你不想学的东西。例如，考虑一个分类问题，目标是为给定的x输入分配y个标签。如果我们使用生成模型

p(x,y)=p(y|x).p(x)

我们必须为p(x)建模，而p(x)与当前任务无关。像数据稀疏性这样的实际限制将迫使我们用一些弱独立性假设来建模p(x)。因此，我们直观地使用判别模型进行分类。

生成算法模型将完全从训练数据中学习，并预测响应。

判别算法的工作就是对两种结果进行分类或区分。

不同的模型归纳如下表:

图片来源:监督学习小抄-斯坦福CS 229(机器学习)

推荐文章