监督学习和无监督学习的区别是什么?

我一直认为无监督学习和有监督学习之间的区别是随意的，有点令人困惑。这两种情况之间没有真正的区别，相反，在一系列情况下，算法可以或多或少地“监督”。半监督学习的存在是界限模糊的一个明显例子。

我倾向于认为监督是对算法提供关于应该首选哪些解决方案的反馈。对于传统的监督设置，比如垃圾邮件检测，你告诉算法“不要在训练集上犯任何错误”;对于传统的无监督设置，比如聚类，你告诉算法“彼此接近的点应该在同一个聚类中”。很巧的是，第一种反馈形式比后者更具体。

简而言之，当有人说“有监督”时，想想分类，当他们说“无监督”时，想想聚类，尽量不要过于担心除此之外的问题。

已经有很多答案可以详细解释这些差异。我在codeacademy上找到了这些动图，它们经常能帮助我有效地解释它们之间的差异。

监督式学习

请注意，训练图像在这里有标签，并且模型正在学习图像的名称。

无监督学习

注意，这里所做的只是分组(聚类)，模型不知道任何图像。

监督学习是指你为算法提供的数据被“标记”或“标记”，以帮助你的逻辑做出决策。

示例:贝叶斯垃圾邮件过滤，您必须将一个项目标记为垃圾邮件以优化结果。

无监督学习是一种试图在原始数据之外没有任何外部输入的情况下找到相关性的算法。

例如:数据挖掘聚类算法。

机器学习是一个让机器模仿人类行为的领域。

你训练机器就像训练婴儿一样。人类学习、识别特征、识别模式并训练自己的方式，就像你通过输入各种特征的数据来训练机器一样。机器算法识别数据中的模式，并将其分类到特定的类别。

机器学习大致分为两类，有监督学习和无监督学习。

监督学习是一个概念，你有相应的目标值(输出)的输入向量/数据。另一方面，无监督学习的概念是只有输入向量/数据，没有任何相应的目标值。

监督学习的一个例子是手写数字识别，其中有对应数字[0-9]的数字图像，而非监督学习的一个例子是根据购买行为对客户进行分组。

我一直认为无监督学习和有监督学习之间的区别是随意的，有点令人困惑。这两种情况之间没有真正的区别，相反，在一系列情况下，算法可以或多或少地“监督”。半监督学习的存在是界限模糊的一个明显例子。

我倾向于认为监督是对算法提供关于应该首选哪些解决方案的反馈。对于传统的监督设置，比如垃圾邮件检测，你告诉算法“不要在训练集上犯任何错误”;对于传统的无监督设置，比如聚类，你告诉算法“彼此接近的点应该在同一个聚类中”。很巧的是，第一种反馈形式比后者更具体。

简而言之，当有人说“有监督”时，想想分类，当他们说“无监督”时，想想聚类，尽量不要过于担心除此之外的问题。

我可以给你们举个例子。

假设您需要识别哪些车辆是汽车，哪些是摩托车。

在监督学习的情况下，你的输入(训练)数据集需要被标记，也就是说，对于你的输入(训练)数据集中的每个输入元素，你应该指定它是代表一辆汽车还是一辆摩托车。

在无监督学习的情况下，你不标记输入。无监督模型将输入聚类到基于相似特征/属性的聚类中。所以，在这种情况下，没有像“car”这样的标签。

推荐文章