December 3, 2021

文章分类

信息论

机器学习

1. 监督学习&无监督学习

监督学习最适合于预测、分类、性能比较、预测分析、定价和风险评估等任务。

半监督学习通常对一般的数据创建和自然语言处理有意义。

至于非监督学习,它在性能监测、销售功能、搜索意图以及潜在的更多方面都有一席之地。

1.1 监督学习

监督学习是学习函数的机器学习任务,该函数基于示例输入 – 输出对将输入映射到输出。它推断出一个函数标记的训练数据由一组训练样例组成。在监督学习,每个实施例是一个对由输入物体(通常为矢量)和期望的输出值的(也称为监控信号)。监督学习算法分析训练数据并产生推断函数,该函数可用于映射新示例。最佳方案将允许算法正确地确定看不见的实例的类标签。这要求学习算法以“合理”的方式从训练数据推广到看不见的情况。

———维基百科

一个通俗的学习过程:

  1. 选择一个合适的数学模型
  2. 把一堆已经分好类的文章和他们的分类给机器
  3. 机器学会了分类的“方法论”
  4. 机器学会后,再丢给他一些新的文章(不带分类),让机器预测这些文章的分类

监督学习使用标记数据集培训算法来分类数据、预测结果等。监督学习算法是针对特定输出注释的输入数据进行训练,直到它们能够检测到输入和输出结果之间的潜在关系。在训练阶段,系统会得到标记数据集,这些数据集告诉它哪些输出与每个特定的输入值相关。监督学习过程通过不断测量结果输出并微调系统以接近目标精度来进行。

监督学习的一个缺点是,不仔细审查培训数据集可能会导致灾难性的结果。

常见算法

Untitled

1.2 无监督学习