特征工程 机器学习
特征工程 机器学习

特征工程 机器学习

引用文献

特征工程

数字图像处理

表示学习

正文

概述(字面意思)

特征是机器学习系统的原材料。在机器学习中,特征工程是重中之重

字典解释:一事物异于其他事物的特点。可以理解为:特征是区分事物的关键

所以,我们要对事物进行分类或识别,实际上就是提取特征,对特征进行判断

特征(数字图像处理)

基础概述

图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。

颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质;纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质

颜色特征

颜色直方图:基于RGB HSV 灰度图的

其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。

其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。

形状特征

边缘

区域

基于小波和相对矩的形状特征提取与匹配

边缘特征

边界特征法

傅里叶形状描述法

纹理特征

概述

纹理特征也是一种全局特征

灰度共生矩阵

属于信号处理法

统计特征

LBP特征

表示学习(机器学习)

概念

为了提高机器学习系统的准确率,我们就需要将输入信息转换为有效的特 征,或者更一般性地称为表示(Representation).如果有一种算法可以自动地学习出有效的特征,并提高最终机器学习模型的性能,那么这种学习就可以叫作表 示学习(Representation Learning)

在表示学习中,有两个核心问题:一是“什么是一个好的表示”;二是“如何学习到好的表示”.

语义鸿沟

语义鸿沟问 题是指输入数据的底层特征和高层语义信息之间的不一致性和差异性

局部表示

也称为离散表示或符号表示

关键

要学习到一种好的高层语义表示(一般为分布式表示),通常需要从底层特征开始,经过多步非线性转换才能得到.

深层结构的优点是可以增加特征的重用性,从而指数级地增加表示能力.因此,表示学习的关键是构建具有一定深度的多层次特征表示

传统机器学习

在传统的机器学习中,也有很多有关特征学习的方法,比如主成分分析、线 性判别分析、独立成分分析等. 但是,传统的特征学习一般是通过人为地设计一 些准则,然后根据这些准则来选取有效的特征.特征的学习是和最终预测模型的 学习分开进行的,因此学习到的特征不一定可以提升最终模型的性能.

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注