生成式算法和判别式算法的区别是什么?

可生成式和可生成式的区别是什么有识别力的算法?

当前回答

生成算法对数据如何生成进行建模，以便对信号进行分类。它提出了一个问题:根据我的世代假设，哪个类别最有可能产生这个信号?

判别算法并不关心数据是如何产生的，它只是对给定的信号进行分类。

其他回答

这篇文章帮助我理解了这个概念。

总之,

两者都是概率模型，这意味着它们都使用概率(准确地说，是条件概率)来计算未知数据的类别。生成式分类器在数据集上应用联合PDF和贝叶斯定理，并使用这些值计算条件概率。判别分类器直接在数据集上找到条件概率

一些不错的阅读材料:条件概率，联合PDF

假设你有一个输入数据x，你想把数据分类为标签y。生成模型学习联合概率分布p(x,y)，判别模型学习条件概率分布p(y|x)——你应该把它理解为“给定x的y的概率”。

这里有一个非常简单的例子。假设你有(x,y)形式的以下数据:

(1,0), (1,0), (2,0), (2, 1)

p (x, y)

      y=0   y=1
     -----------
x=1 | 1/2   0
x=2 | 1/4   1/4

p (y | x)

      y=0   y=1
     -----------
x=1 | 1     0
x=2 | 1/2   1/2

如果你花几分钟时间盯着这两个矩阵看，你就会明白这两个概率分布之间的区别。

分布p(y|x)是将给定示例x分类为y类的自然分布，这就是为什么直接对其建模的算法被称为判别算法。生成算法建模p(x,y)，应用贝叶斯规则将p(y|x)转化为p(y|x)，用于分类。然而，分布p(x,y)也可以用于其他目的。例如，您可以使用p(x,y)来生成可能的(x,y)对。

从上面的描述中，您可能会认为生成模型更普遍，因此更好，但它并不是那么简单。这篇论文是关于区分分类器和生成分类器的一个非常流行的参考，但它相当沉重。总的要点是，在分类任务中，判别模型通常优于生成模型。

我的观点是: 歧视性的方法突出了差异生成方法不关注差异;他们试图建立一个能代表班级的模型。两者之间有重叠之处。理想情况下，两种方法都应该使用:一种有助于发现相似之处，另一种有助于发现不同之处。

生成算法对数据如何生成进行建模，以便对信号进行分类。它提出了一个问题:根据我的世代假设，哪个类别最有可能产生这个信号?

判别算法并不关心数据是如何产生的，它只是对给定的信号进行分类。

不同的模型归纳如下表:

图片来源:监督学习小抄-斯坦福CS 229(机器学习)

推荐文章