基于多种模态信息的图像标注的研究与实现.docx

资料分类:计算机信息 上传会员:紫色烟火 更新时间:2022-06-11
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:10329
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:图像已经成为互联网上最广泛传播的媒介形式,特别是,随着数码技术的普及,每天以海量级别在不断地生成图像数据,并由互联网工具快速在网络上复制传播。由于图像数据是无结构化数据,传统的关系数据库等组织管理方式很难用于图像数据,因此,如何有效地组织管理这些无结构的图像数据,已经成为近十年来学术和产业届的研究热点。

-图像标注、场景理解、事件理解是图像理解的三个关键步骤,其中,图像标注是基础。近十年来,图像标注研究逐步深入,取得了一些标志性进展,但还未实现高质量的图像标注,如果图像标注没有较显著的进展,场景理解、事件理解就无法开展。本论文的主要工作是基于多种模态信息下的研究实现语义邻域标签传播算法,然后对训练集划分语义组并建立待标注图像的邻域图像集,以实现高质量的图像标注。

 

关键词:语义邻域;多模态信息;图像标注

 

目录

摘要

Abstract

1引言-1

1.1研究的背景与意义-1

1.2 论文页眉页脚的编排-1

2图像标注的相关技术-3

2.1基于生成模型的图像标注-3

2.2基于判别模型的图像标注-4

2.3基于图模型的图像标注-5

3基于语义邻域标签传播的图像标注方法-6

3.1基本思想-6

3.2选择标准数据集-6

3.3对数据集图像进行预处理-7

3.3.1处理数据集图片-7

3.3.2计算图像均值-8

3.4视觉特征选择-9

3.5距离类型选择-9

3.6距离转相似度-10

3.7标注结果-10

4基于度量学习的语义邻域标签传播的图像标注方法-12

4.12PKNN思想-12

4.2度量学习方法简介-12

4.2.1线性判别分析(LDA)-12

4.2.2最大间隔临近法(LMNN)-13

4.2.3流形学习算法-13

4.3融合2PKNN与度量学习-14

4.4实验结果-14

结论-16

参考文献-17

致谢-19

相关论文资料:
最新评论
上传会员 紫色烟火 对本文的描述:在这项工作中,我们有兴趣利用具有高度表现力的多模态信息来处理多标签图像标注问题。使用最大的公开可用的多标签数据集corel5k,我们观察到与传统特征相比显着的性能提升。......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: