设为首页收藏本站

EPS数据狗论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2318|回复: 0

[乐研杯信息素养大赛] 图像类档案语义检索

[复制链接]

22

主题

760

金钱

947

积分

初级用户

发表于 2018-4-16 13:49:54 | 显示全部楼层 |阅读模式

通过调研发现, 步入现代化的数字档案馆 (室) 除有文本类文献信息外, 还有图像、图形以及音频、视频、动画等大量的多媒体电子信息。图像类档案语义检索, 主要是采用基于内容的多媒体检索技术 (Content Based Retrieval, CBR) 的一种检索方式。它是在克服基于描述 (description-based) 的多媒体信息检索不足的情况下研发出来的。基于描述的多媒体信息检索只是对画家名称、音乐作品类型、出版年份等信息的描述, 不能揭示多媒体内容的特点。而基于内容的多媒体信息检索融合了图像理解、模式识别、计算机视觉等技术, 可通过对图像、音频、视频等媒体的内容进行分析, 把图像的颜色、形状和纹理, 以及音乐的音频、响度和音高等特征揭示出来, 并通过比较检索提问和检索系统的多媒体信息之间的相似度来决定检索结果, 查询提问不是检索词, 而是多媒体本身。目前, 较普及的基于内容的图像检索系统有百度识图、Google图片搜索引擎、Tin Eye等。

随着图像类语义检索技术的发展, Eakins进一步将基于内容的图像检索 (content-based image retrieval, CBIR) 划分为三个不同的层次:基于视觉特征的图像检索、基于对象类型的图像检索、基于抽象属性的图像检索。后两层级的检索被称为基于语义的图像检索。这项技术对高校档案信息检索工作的应用价值主要表现为:第一, 基于视觉特征的图像类档案检索技术方式, 可通过选择颜色的比例、形状、纹理等图样进行查询。如:用画图工具生成草图进行查询, 或选择一幅示例图像展开基于图像示例的检索 (query by image example) 。这种“以图找图”搜索引擎采用的图片指纹技术, 可依据图像类档案固有的特征进行标引和检索, 从而彻底颠覆“以词找图”的检索模式。第二, 根据图像类档案的含义, 可提供更高层次的语义信息的处理和检索。基于语义的图像类档案检索结合使用MPEG-7标准和XML描述语言, 通过“输入图像、图像分割、特征抽取、对象识别、图像标注和结果显示”这一技术处理流程, 可实现图像类档案语义的提取、描述、存储和检索, 因而是更合理的图像类档案检索方式。第三, 根据用户检索的需要, 可进行基于视觉特征和基于语义特征的图像类档案复合检索。运用复合检索技术时, 只要直接将图像类档案的视觉特征或语义特征描述出来 (既可以是样例图像, 又可以是语义描述) , 系统返回的结果图像不仅在视觉表征上相关, 而且在语义表征上也相关, 用户可在大容量档案图像库中迅速找到自己所需的图像。第四, 借助图像文件分析工具, 可着力提升高校照片档案整理的效率和科学性。高校档案管理机构在收集照片档案时经常会发现, 很多活动摄影者在拍照的时候会连续拍摄多张照片, 这样导致后期在整理归档的过程中就会出现内容相似的多张图像, 不仅占用了大量的系统空间而且还要依靠人工肉眼识别的方式来鉴定取舍, 费时费力。在语义Web检索技术的支撑下, 借助实用工具Xn View即可智能地分析出文件夹内相似的图像文件。操作时只需选择“相似的图片内容”选项, 然后点击“查找”按钮就可以了。软件用缩略图的形式自动显示出分析的结果, 使用者可以很明显地对两张图片的内容和效果进行对比并方便地进行删减操作。

需要指出的是, 提供符合人类认知模式所需的语义检索功能将是未来高校档案信息检索研究的重点, 但研究自动化的语义提取和标准方法仍是档案处理的主要难题。此外, 针对声音、图像、视频等不同媒体, 基于内容的检索方法不完全相同, 因为它们的数字化方法不同, 但检索过程基本相同, 都是一个通过与用户交互, 对查询结果逐步求精, 不断调整特征、重新匹配的循环过程。
应用语义理解等技术的智能搜索引擎, 其核心是智能代理 (Agent) 技术。未来融入搜索引擎技术精华的新型高校档案信息智能检索系统, 将在“聪明的蜘蛛” (Smarter Spider) 引导下, 突破呆板、僵硬的线性单向服务模式, 实现从基于关键词到基于知识 (或概念) 的提升。即:不再是简单、机械、无识别能力地检索和标引信息, 而是能对内容的相关性及质量等作出判断, 质量差或内容不相关的页面将被主动舍弃, 并让用户的知识浏览和知识检索活动变为一种低认知负担的学习过程。


摘自:语义Web技术对高校档案信息检索工作的应用价值



您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

客服中心
关闭
在线时间:
周一~周五
8:30-17:30
QQ群:
653541906
联系电话:
010-85786021-8017
在线咨询
客服中心

意见反馈|网站地图|手机版|小黑屋|EPS数据狗论坛 ( 京ICP备09019565号-3 )   

Powered by BFIT! X3.4

© 2008-2028 BFIT Inc.

快速回复 返回顶部 返回列表