监督机器学习

监督学习是机器学习的一种类型,其中机器使用“标记好的”训练数据进行训练,机器根据这些数据预测输出。标记数据意味着一些输入数据已经用正确的输出标记。

在监督学习中,提供给机器的训练数据作为监督者,教导机器正确预测输出。它应用了与学生在老师的监督下学习相同的概念。

监督学习是向机器学习模型提供输入数据和正确输出数据的过程。监督学习算法的目标是找到一个映射函数来映射输入变量(x)和输出变量(y)

在现实世界中,监督学习可用于风险评估、图像分类、欺诈检测、垃圾邮件过滤等。

监督学习如何运作?

在监督学习中,模型使用标记数据集进行训练,其中模型学习每种类型的数据。训练过程完成后,模型会根据测试数据(训练集的子集)进行测试,然后预测输出。

通过下面的例子和图表可以很容易地理解监督学习的工作:

监督机器学习

假设我们有一个不同类型形状的数据集,包括正方形、矩形、三角形和多边形。现在第一步是我们需要为每个形状训练模型。

  • 如果给定的形状有四个边,并且所有边都相等,那么它将被标记为Square

  • 如果给定的形状有三个边,那么它将被标记为三角形

  • 如果给定的形状有六个相等的边,那么它将被标记为六边形

现在,训练后,我们使用测试集测试我们的模型,模型的任务是识别形状。

该机器已经对所有类型的形状进行了训练,当它找到一个新的形状时,它会根据多个边对形状进行分类,并预测输出。

监督学习涉及的步骤:

  • 首先确定训练数据集的类型

  • 收集/收集标记的训练数据。

  • 将训练数据集拆分为训练数据集、测试数据集和验证数据集

  • 确定训练数据集的输入特征,该特征应该具有足够的知识,以便模型能够准确预测输出。

  • 确定适合模型的算法,如支持向量机、决策树等。

  • 在训练数据集上执行算法。有时我们需要验证集作为控制参数,它们是训练数据集的子集。

  • 通过提供测试集来评估模型的准确性。如果模型预测了正确的输出,则意味着我们的模型是准确的。

监督机器学习算法的类型:

监督学习可以进一步分为两类问题:

监督机器学习

1. 回归

如果输入变量和输出变量之间存在关系,则使用回归算法。它用于预测连续变量,例如天气预报、市场趋势等。 以下是一些流行的受监督学习回归算法:

  • 线性回归

  • 回归树

  • 非线性回归

  • 贝叶斯线性回归

  • 多项式回归

2. 分类

当输出变量是分类变量时使用分类算法,这意味着有两个类,如 Yes-No、Male-Female、True-false 等。

垃圾邮件过滤,

  • 随机森林

  • 决策树

  • 逻辑回归

  • 支持向量机

注意:我们将在后面的章节中详细讨论这些算法。

监督学习的优点:

  • 在监督学习的帮助下,该模型可以根据先前的经验预测输出。

  • 在监督学习中,我们可以准确了解对象的类别。

  • 监督学习模型帮助我们解决各种实际问题,例如欺诈检测、垃圾邮件过滤等。

监督学习的缺点:

  • 监督学习模型不适合处理复杂的任务。

  • 如果测试数据与训练数据集不同,监督学习无法预测正确的输出。

  • 训练需要大量的计算时间。

  • 在监督学习中,我们需要足够的关于对象类别的知识。


  • 使用社交账号登录,本站支持
全部评论(0)