基于OCR的视频字幕提取.docx

资料分类:科技学院 上传会员:溪老师 更新时间:2020-11-02
需要金币2000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:18255
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:当今时代是信息爆炸的时代,而视频是一种非常重要的信息呈现方式,越来越多的信息以视频的方式传递给大众,视频已经成为人们获取信息的一个不可或缺的媒介。而且随着现代科技的发展,信息数字化技术和多媒体技术得到了快速的发展,音频、视频等多媒体文件已经成为信息传递的主流媒介,随着这种多媒体技术和数字化技术的发展,视频数据的海量性是一种必然的趋势。

面对数量如此庞大的视频流时,人们如果想要快速获取所需要的信息,这变得比登天还难,如同大海捞针一般。因此一些相关科研人员把研究的方向转向了视频检索方面,对视频检索的研究方兴未艾,同时一发不可收拾。针对这一研究热点,基于视频内容与视频字幕有很强的语义相关性,我们可以通过提取视频字幕达到视频检索的目的。

基于OCR的视频字幕提取系统主要包括字幕帧检测,文本定位,字符分割和OCR识别几个部分。字幕帧检测是应用字幕帧检测算法来进行字幕帧的筛选,目的在于判断筛选出那些带字幕文字的视频帧,文本定位是找到包含文字的区域并用矩形框给出精确的定位,文本校正是利用radon hough变换等方法对偏转倾斜等失真的文字进行校正,图片分割是通过投影直方图分割出单行的文本的图片,前面的步骤都看一看做OCR识别的预处理。最后部分是OCR识别,OCR识别就是对文字图片进行光学字符识别。该系统基于这几个部分识别视频中字幕文字,很大程度可以解决基于视频内容的内容监管和内容检索。

 

关键词:信息时代;视频;数字化;文本定位;文本校正;OCR识别;字幕提取;内容检索

 

目录

摘要

Abstract

1.绪论-1

1.1研究背景-1

1.2研究目的及意义-1

1.3 本文的组织-2

2. 相关工作现状及分析-3

2.1技术研究-3

2.2技术应用-4

2.2.1 网络视频的内容安全监控:-4

2.2.2 视频检索领域的应用:-4

2.2.3 视频字幕翻译:-4

2.2.4 实时车牌识别:-5

2.2.5 快递单号扫描:-5

3.总体方案-6

3.1 开发平台-6

3.2 开发方案-6

4.视频字幕提取的关键算法-8

4.1字幕的检测定位-8

4.1.1字幕帧的检测-9

4.1.2 字幕的定位-10

4.1.3检测定位流程-11

4.2 文本校正和字符分割-15

4.2.1文本校正-15

4.2.2 字符分割-15

5.字幕文字识别-19

5.1文字归一化-20

5.2汉字分类特征选择-20

5.2.1 粗网格特征-21

5.2.2粗外围特征-21

5.2.3 局部笔划方向密度特征-22

5.3利用 tesseract进行文字识别-23

6.系统测试与结果分析-24

6.1字幕检测实验结果-24

6.2字幕定位与分类实验结果-25

6.3开展课题研究过程中遇到的一些问题-26

7.总结-27

参考文献

致谢

相关论文资料:
最新评论
上传会员 溪老师 对本文的描述:本文先介绍了基于OCR识别技术的研究背景,强调了OCR技术在如今信息数字化时代和多媒体时代的重要地位,并且详细介绍了它的一些应用的实际场景,表明了OCR识别技术的重要性与应用......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: