客户端|机器学习系统，需要从图像计算出的数值特征( 二 )

在讨论实际的机器学习技术之前，应该解决术语模型的使用。模型可以指机器学习方法的一般形态，例如决策树或支持向量机，也可以指深度学习网络的具体形式。模型也可以指机器学习工具的训练版本，因此读者必须从上下文中推断出模型的含义是调查者的意思。因为本文没有描述任何经过训练的版本，所以模型总是指架构而不是经过训练的版本。逻辑回归是一种成熟的技术，尽管它的名字，它更普遍地用作分类器。逻辑回归模型具有固定数量的参数，这些参数取决于输入特征的数量，并且它们输出分类预测。它类似于线性回归，其中几个点被拟合到一条线上，从而最小化诸如均方误差 (MSE) 之类的函数。逻辑回归将数据拟合到从 0 到 1 的函数，并且当输出小于 0.5 时，将示例分配给一个类，否则它是另一个。决策树之所以得名，是因为它们会做出一系列二元决策，直到做出最终决策。在最简单的情况下，尝试了一系列值，并且最佳阈值是获得最多情况正确的阈值。通常只有 1 个这样的分支对于实际用途来说太简单了。训练过程包括确定对哪个特征做出决定和标准是什么。用于选择特征的度量通常是分类决策树的基尼指数或熵。或回归树的平均误差或 MSE 。这些指标都集中在寻找最能提高预测效果的特征上。一旦确定了该特征，就会计算阈值/决策标准。这个寻找特征和标准的过程被递归地应用于每个组，这些组是由应用分割产生的，直到满足某个停止标准。决策树的一个重要优点是它们易于解释。尽管其他机器学习模型接近于黑匣子，但决策树提供了一种图形和直观的方式来理解 ML 模型的作用。