基于内容的服装图像情感语义识别和检索
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3本书研究内容

本书主要对基于内容的男西装图像和服装面料图像的情感语义识别和检索技术进行论述。

为了让计算机对服装所带来的情感进行识别和理解,首先需对服装情感进行量化描述并建立情感空间。而由于人对情感认识的主观性和模糊性,长期以来人们对服装情感的认识大多停留在定性阶段[3]

另外,服装款式和种类繁多,颜色复杂多样,面料成千上万,图案变幻无穷,配饰各具特色,而这些因素的不同组合又会带来千变万化的服装情感,因此,建立一个适用于所有类别服装的情感空间是不现实的,如童装和中老年装的情感描述词就相差甚远。然而,同一类型的服装往往具有类似的服装情感,如西装一般穿着在比较正式的场合,因此它所带来的服装情感可能是正式的、庄重的、严肃的等。

既然目前对服装的情感描述还没有定论,那么不妨采用调查的方法来确定一下到底有哪些情感词可以用来描述服装;另外,考虑到不同种类的服装具有不同的、甚至词义相反的情感描述词,所以我们只考虑某类的服装,然后通过调查确定其情感描述词。对于男西装图像,我们找来30张不同款式和颜色的服装,通过常用情感词调查、服装专家审核以及对情感测试数据进行统计分析后确定五对情感词为男西装图像的最终情感描述词,分别是:“正式的—休闲的”、“儒雅的—粗犷的”、“古典的—现代的”、“简洁的—复杂的”、“艳丽的—淡雅的”。对于服装面料,采用60种不同种类的面料进行调查测试,最终确定“强烈的—柔和的”、“温暖的—凉爽的”、“华丽的—简约的”、“高雅的—朴素的”、“张扬的—文静的”、“厚重的—飘逸的”、“丰富的—纯净的”七对情感词为其最常用的情感描述词。

在服装图像低层特征和情感描述联系方面,通过对图像低层特征和情感因子空间的因子(因子和情感描述值可以互相推导)之间的关系进行分析,逐一对照,找出影响因子的那些低层特征及与这些特征之间的量化关系,为图像情感语义识别和检索提供基础。

由于目前图像情感语义识别和检索的技术所限,目前还不可能实现百分百的识别和检索效果,本书在男西装图像情感语义方面采用了BP神经网络(Back-Propaga-tionNetwork,简称BP网络)对数据进行训练和学习,而在服装面料图像情感语义方面采用了支持向量机对数据进行训练和学习,达到了较好的效果,也算为缩小“语义鸿沟”做出了一定的贡献。

对男西装图像情感语义识别和检索采用以下技术和步骤:首先通过对男西装情感描述词的筛选、投票、初步确定、相关性分析、因子分析等研究过程,得出了一个二维的男西装图像情感因子空间,这样每幅图像对应着该因子空间上一个二维的坐标值,使得在因子空间上定义男西装图像之间的情感相似度和对男西装图像按情感相似性进行评估和索引成为可能。然后通过对男西装图像低层颜色特征与情感因子之间的关系分析,得出十维亮度—冷暖模糊直方图、七维的饱和度—冷暖模糊直方图加色彩对比度值的综合特征可以分别与男西装图像情感因子空间的两个因子产生量化关系。在构建出的二维图像情感因子空间和男西装图像低层特征的基础上,通过机器学习(BP神经网络)实现了男西装图像的低层特征到情感因子空间的映射,根据图像低层颜色特征可以自动完成图像情感因子值和情感描述值的计算,并把识别后的新图像数据自动加入图像数据库中,实现了基于内容的男西装图像情感语义识别,然后根据情感相似度对男西装图像实现了基于内容的图像情感语义检索。

对服装面料图像的情感语义识别和检索采用了以下技术和步骤:首先通过对面料情感描述词的筛选、投票、初步确定、相关性分析、因子分析等研究过程,得出了一个三维的面料图像情感因子空间,这样每幅面料图像的情感描述对应着该因子空间上的三维坐标值。经过对面料颜色和纹理的低层特征与情感因子空间三个因子之间的关系进行分析,表明第一个因子可以用七维特征(六维的饱和度—冷暖模糊直方图加一维的图像对比度)来表征;第二个因子可以用257维特征(256维的灰度图加一维的彩色对比度)来表征;第三个因子可以用四维特征(三维的灰度矩阵参数加一维的平均色调值)来表征。最后通过支持向量机实现了图像情感因子值的自动识别。通过对60张面料图像样本的实测值和预测值的对比分析,表明该方法能较好地实现基于内容的面料图像情感语义的识别,然后根据相似度对服装面料图像实现基于内容的图像情感语义检索。

本书的第2~第5章主要论述基于内容的男西装图像情感语义识别和检索;第6~第10章主要论述基于内容的服装面料图像情感语义识别和检索。