客户端|机器学习系统,需要从图像计算出的数值特征( 二 )


在讨论实际的机器学习技术之前 , 应该解决术语模型的使用 。模型可以指机器学习方法的一般形态 , 例如决策树或支持向量机 , 也可以指深度学习网络的具体形式 。模型也可以指机器学习工具的训练版本 , 因此读者必须从上下文中推断出模型的含义是调查者的意思 。因为本文没有描述任何经过训练的版本 , 所以模型总是指架构而不是经过训练的版本 。 逻辑回归是一种成熟的技术 , 尽管它的名字 , 它更普遍地用作分类器 。逻辑回归模型具有固定数量的参数 , 这些参数取决于输入特征的数量 , 并且它们输出分类预测 。它类似于线性回归 , 其中几个点被拟合到一条线上 , 从而最小化诸如均方误差 (MSE) 之类的函数 。逻辑回归将数据拟合到从 0 到 1 的 函数 , 并且当输出小于 0.5 时 , 将示例分配给一个类 , 否则它是另一个 。决策树之所以得名 , 是因为它们会做出一系列二元决策 , 直到做出最终决策 。 在最简单的情况下 , 尝试了一系列值 , 并且最佳阈值是获得最多情况正确的阈值 。 通常只有 1 个这样的分支对于实际用途来说太简单了 。 训练过程包括确定对哪个特征做出决定和标准是什么 。 用于选择特征的度量通常是分类决策树的基尼指数或熵 。 或回归树的平均误差或 MSE 。 这些指标都集中在寻找最能提高预测效果的特征上 。 一旦确定了该特征 , 就会计算阈值/决策标准 。 这个寻找特征和标准的过程被递归地应用于每个组 , 这些组是由应用分割产生的 , 直到满足某个停止标准 。 决策树的一个重要优点是它们易于解释 。 尽管其他机器学习模型接近于黑匣子 , 但决策树提供了一种图形和直观的方式来理解 ML 模型的作用 。