词条 | 图像检索与压缩域处理技术的研究 |
释义 | 《图像检索与压缩域处理技术的研究》是关于图像检索与压缩域处理技术的一本学术专著,反映了相关技术领域近年来的最新研究进展。 图像检索与压缩域处理技术的研究作者:沈兰荪 张菁 李晓光 市场价:¥98.00 ·出版社:人民邮电出版社 ·页码:496 页 ·出版日期:2008年 ·ISBN:9787115189943 ·条形码:9787115189943 ·版本:1版 ·装帧:精装 ·开本:16 ·中文:中文 ·丛书名:高新技术专著系列 内容简介《图像检索与压缩域处理技术的研究》共分4篇20章。第一篇为基础知识,介绍数字图像与编码的基础知识、图像编码的基本方法与有关国际标准,基于内容的图像检索技术;第二篇为基于视觉感知的个性化图像检索技术,分析论述视觉注意机制及注意模型、视点跟踪技术、客观化的视觉感知技术、个性图像检索技术以及用户兴趣模型等内容;第三篇为基于压缩域的图像处理技术,阐述压缩域纹理图像分类、基于轮廓特征检索、DCT域处理、小波域处理以及JPEG2000等内容;第四篇为《图像检索与压缩域处理技术的研究》的结束语,主要介绍当前图像检索与压缩域处理方面的一些研究热点。 《图像检索与压缩域处理技术的研究》可供通信与电子系统、信号与信息处理、计算机应用等相关专业的研究人员、工程技术人员、高校教师、研究生和高年级本科生学习参考。 作者简介沈兰荪,北京工业大学教授、博士生导师,北京市信号与信息处理研究室主任,IEEE学会高级会员,国际欧亚科学院院士,北京市有突出贡献专家。历任中国科技大学电子工程系主任、中国科技大学高技术学院副院长、北京工业大学副校长、北京市自然科学基金会副会长等。现任《中国大百科全书(二版)》电子学学科副主编,中国微弱信号检测学会副理事长,国家自然科学基金委信息科学部专家评审组成员,中国科技大学等校兼职教授等。 主要研究领域为图像/视频编码、传输、处理,以及中医舌象采集与分析技术等,著有《数据采集技术》、《图像编码与异步传输》、《小波编码与网络视频传输》、《中医舌象的采集与分析》等著作。 目录第一篇 基础知识 第1章 数字图像 1.1 图像与视频 3 1.2 数字图像的特点 4 1.2.1 图像数据的海量性 4 1.2.2 图像的压缩格式具有普遍性 5 1.2.3 图像的内容表现具有非结构性 6 1.2.4 应用环境的多元化 6 1.3 图像的彩色空间 7 1.3.1 彩色空间的视觉属性 7 1.3.2 RGB彩色空间 7 1.3.3 YCbCr彩色空间 8 1.4 视频格式 9 1.5 感兴趣区的人眼视觉系统特性 10 1.5.1 视觉感兴趣区 10 1.5.2 视觉掩盖效应 11 1.6 图像质量的评价 15 1.6.1 概述 15 1.6.2 客观质量的评价 16 1.6.3 主观质量的评价 16 1.6.4 感兴趣区质量评价 17 1.6.5 感兴趣区质量评价的实验结果 19 1.7 讨论 21 参考文献 21 第2章 图像压缩编码技术的发展 2.1 概述 23 2.2 熵编码 24 2.3 传统的图像/视频编码技术 25 2.3.1 预测编码 25 2.3.2 变换编码 26 2.3.3 矢量量化 28 2.4 新型图像/视频编码技术 28 2.4.1 第二代图像编码方法 29 2.4.2 分形编码 29 2.4.3 模型编码 30 2.4.4 小波编码 31 2.5 图像/视频编码标准 32 2.5.1 静止图像编码的标准 35 2.5.2 视频编码标准 35 2.6 JPEG2000标准 40 2.6.1 JPEG2000体系结构与关键技术 40 2.6.2 JPEG2000的主要特点与性能描述 45 2.7 讨论 46 参考文献 49 第3章 基于内容的图像检索技术 3.1 概述 52 3.2 图像的内容特征 54 3.2.1 颜色特征 55 3.2.2 纹理特征 57 3.2.3 轮廓特征 60 3.2.4 形状特征 60 3.2.5 对象特征 61 3.2.6 空间特征 63 3.2.7 字符特征 64 3.2.8 语义特征 64 3.2.9 图像的语义层次模型 66 3.3 图像相似度计算 67 3.3.1 距离度量 67 3.3.2 相关计算 68 3.3.3 关联系数计算 69 3.3.4 多特征相似度计算 70 3.3.5 具有光照不变性的图像检索 70 3.4 人机接口及相关反馈 71 3.4.1 友好的人机交互接口 71 3.4.2 相关反馈的新进展 74 3.5 图像的检索 76 3.5.1 低层视觉特征 76 3.5.2 局部图像 76 3.5.3 自定义特征检索 77 3.5.4 示例图与草图检索 77 3.5.5 浏览检索 77 3.6 图像检索系统 78 3.7 图像检索性能的评价 79 3.8 讨论 80 参考文献 82 第二篇 基于视觉感知的个性化图像检索 第4章 视觉注意机制及注意模型 4.1 概述 89 4.2 人眼视觉系统的生理特性 90 4.2.1 视觉感官 92 4.2.2 视觉通路 93 4.2.3 视觉中枢 94 4.2.4 视觉感知 97 4.3 视觉注意机制 98 4.3.1 What和Where视觉通路 98 4.3.2 预注意和注意阶段 99 4.3.3 自底向上和自顶向下的注意模式 99 4.3.4 选择性注意机制 100 4.3.5 注意焦点的选择与转移 102 4.4 视觉注意模型 102 4.4.1 基于空间的注意模型 103 4.4.2 基于特征的注意模型 111 4.4.3 基于空间和特征整合的注意模型 112 4.4.4 基于对象的注意模型 112 4.5 讨论 113 参考文献 114 第5章 基于视觉注意模型的感兴趣区检测 5.1 概述 118 5.2 感兴趣区检测的研究进展 119 5.3 一种基于改进Itti模型与进化规划的感兴趣区检测方法 121 5.3.1 视觉显著度量 122 5.3.2 注意焦点的选择与转移 124 5.3.3 感兴趣区的生成 126 5.3.4 一种基于改进Itti模型与进化规划的感兴趣区检测方法的实验 128 5.4 基于相似距离的Top-Down模型的初步研究 135 5.4.1 基于相似距离的Top-Down模型结构 135 5.4.2 相似区域的判定方法 136 5.4.3 基于相似距离的视觉期望 137 5.4.4 基于相似距离的Top-Down模型的初步实验 138 5.5 讨论 139 参考文献 140 第6章 视点跟踪技术 6.1 概述 142 6.2 视点跟踪技术的研究进展 143 6.2.1 人眼的运动特性 143 6.2.2 视点跟踪设备 144 6.2.3 人眼检测与定位 145 6.2.4 视点跟踪技术分类 147 6.3 改造的视点跟踪设备 150 6.3.1 视点跟踪设备的选择及参数设置 150 6.3.2 视点跟踪设备的改造方案 154 6.3.3 方案选择与对比 157 6.4 基于Gabor变换的人眼定位方法 157 6.4.1 归一化处理 158 6.4.2 Gabor小波变换 159 6.4.3 投影分析 160 6.4.4 基于Gabor变换的人眼定位方法的实验 161 6.5 一种基于双阈值的低复杂度视点跟踪方法 163 6.5.1 双阈值人眼定位算法 163 6.5.2 双阈值人眼定位算法的实验 166 6.5.3 基于几何映射的视点跟踪方法 167 6.5.4 一种基于双阈值的低复杂度视点跟踪方法的实验 168 6.6 一种基于Web Camera的自适应模板视点跟踪方法 169 6.6.1 自适应模板人眼定位算法 169 6.6.2 自适应模板人眼定位算法的实验 171 6.6.3 基于神经网络法的视点跟踪方法 172 6.6.4 一种基于Web Camera的自适应模板视点跟踪方法的实验 174 6.7 讨论 175 参考文献 176 第7章 客观化的视觉感知技术 7.1 概述 179 7.2 客观化的视觉感知信息 180 7.3 基于视觉感知的感兴趣区检测 181 7.3.1 注视点分布图 181 7.3.2 注视兴趣度 183 7.3.3 基于视觉感知的感兴趣区 184 7.4 基于视觉感知的感兴趣区检测实验平台 186 7.4.1 实验平台 186 7.4.2 实验结果 188 7.5 讨论 198 参考文献 199 第8章 个性化图像检索技术 8.1 概述 200 8.2 图像搜索引擎 202 8.3 用户兴趣模型 205 8.3.1 Agent推理机 205 8.3.2 个性化文件 209 8.3.3 用户兴趣模型的更新 213 8.4 基于规则的个性化推荐 214 8.5 基于内容的个性化推荐 218 8.5.1 概述 218 8.5.2 潜在变量分析 219 8.5.3 广义概率主分量分析模型 221 8.6 协作过滤的个性化推荐 224 8.6.1 概述 224 8.6.2 基于记忆的协作过滤 225 8.6.3 基于模型的协作过滤 229 8.6.4 基于协作过滤的图像检索 230 8.7 混合过滤的个性化推荐 233 8.8 个性化推荐系统的评价 235 8.9 相关反馈技术 235 8.10 讨论 237 参考文献 238 第9章 应用于个性化图像检索的用户兴趣模型的构建 9.1 概述 242 9.2 用户兴趣模型描述 243 9.2.1 用户兴趣的表示方式 243 9.2.2 用户兴趣模型的分类 244 9.2.3 用户兴趣模型的构建方法 245 9.2.4 用户兴趣模型的框图 246 9.3 用户短期兴趣的获取 247 9.3.1 短期视觉特征 248 9.3.2 短期视觉特征实验结果 253 9.3.3 短期语义特征 257 9.3.4 短期语义特征实验结果 263 9.4 用户长期兴趣的获取 263 9.4.1 推理机的设计与实现 264 9.4.2 长期视觉特征 265 9.4.3 长期视觉特征实验结果 266 9.4.4 长期语义特征 270 9.4.5 长期语义特征实验结果 273 9.5 基于用户兴趣模型的个性化图像检索系统 273 9.5.1 个性化图像检索系统组成 273 9.5.2 个性化图像检索实验结果与分析 274 9.6 讨论 281 参考文献 282 第三篇 基于压缩域的图像处理 第10章 压缩域图像处理技术综述 10.1 概述 287 10.2 压缩域图像处理系统的构成 288 10.2.1 基于压缩域的图像检索系统框图 289 10.2.2 压缩域处理可操作位置 289 10.3 压缩域图像处理的研究方法 290 10.3.1 寻求对等操作 291 10.3.2 寻求特有操作 291 10.4 压缩域图像检索技术的研究进展 292 10.4.1 变换压缩域检索技术 292 10.4.2 空间压缩域检索技术 298 10.4.3 混合压缩域检索技术 299 参考文献 300 第11章 压缩域纹理图像分类 11.1 概述 305 11.2 基于DCT压缩域区域能量方向性的纹理图像分类 306 11.2.1 基于DCT编码的基本框图 306 11.2.2 DCT域区域能量的方向性 307 11.2.3 基于能量方向性的纹理图像分类算法设计 309 11.2.4 基于DCT压缩域区域能量方向性的纹理图像分类算法实验 310 11.3 基于DCT压缩域的具有旋转不变性的纹理图像分类 312 11.3.1 DCT域的多分辨率特性 312 11.3.2 具有抗旋转性的纹理图像分类方法 314 11.3.3 基于DCT压缩域的具有旋转不变性的纹理图像分类算法实验 315 11.4 基于小波压缩域纹理图像分类 317 11.4.1 基于小波的纹理分析方法的发展 317 11.4.2 基于子带间相关性纹理特征提取 318 11.4.3 基于小波压缩域纹理图像分类算法 321 11.4.4 基于小波压缩域纹理图像分类算法实验 321 11.5 讨论 323 参考文献 324 第12章 DCT压缩域基于轮廓特征的图像检索 12.1 概述 327 12.2 基于图像检索的连通直方图方法 328 12.2.1 图像的连通直方图 328 12.2.2 基于连通直方图的图像检索 330 12.2.3 基于连通直方图的图像检索的实验 331 12.3 DCT压缩域基于轮廓特征的图像检索方法 333 12.3.1 重组DCT系数 334 12.3.2 提取图像的轮廓 334 12.3.3 基于轮廓的连通直方图 336 12.3.4 DCT压缩域基于轮廓特征的图像检索流程 337 12.3.5 DCT压缩域基于轮廓特征的图像检索的实验 337 12.4 讨论 340 参考文献 340 第13章 压缩域字符定位 13.1 概述 341 13.2 DCT压缩域的字符定位方法 343 13.2.1 DCT压缩域中字符特征的提取 343 13.2.2 DCT压缩域的字符定位算法 344 13.2.3 DCT压缩域字符定位算法的实验 345 13.3 基于加权频率的DCT压缩域的字符定位方法 347 13.3.1 DCT压缩域字符区新特征——加权频率 347 13.3.2 基于加权频率的DCT压缩域字符定位算法 348 13.3.3 基于加权频率的DCT压缩域字符定位算法的实验 352 13.4 小波压缩域字符定位 355 13.4.1 字符特征在小波压缩域图像中的表示 355 13.4.2 基于小波压缩域的字符定位算法 357 13.4.3 基于小波压缩域字符定位算法的实验 362 13.5 讨论 363 参考文献 364 第14章 压缩域的肤色分割 14.1 概述 366 14.2 DCT压缩域基于三维椭圆模型的自适应肤色分割 367 14.2.1 三维椭圆肤色模型 367 14.2.2 基于DCT直流系数的肤色初分割 371 14.2.3 自适应修正分割结果 372 14.2.4 DCT压缩域中基于三维椭圆模型的自适应肤色分割实验 373 14.3 小波压缩域双适形肤色分割模型 375 14.3.1 双适形肤色模型 375 14.3.2 小波压缩域基于双适形模型的肤色分割 377 14.3.3 平滑滤波与连通域分析 378 14.4 讨论 378 参考文献 379 第15章 压缩域的人脸检测 15.1 概述 381 15.2 DCT压缩域的人脸检测方法 383 15.2.1 一种基于多级梯度能量特征的DCT压缩域人脸检测算法框图 383 15.2.2 多级梯度能量特征 385 15.2.3 级联分类器 387 15.2.4 搜索策略 388 15.2.5 基于多级梯度能量描述的DCT压缩域人脸检测算法的实验 389 15.3 小波压缩域的人脸检测 390 15.3.1 一种基于多级梯度能量描述的小波压缩域人脸检测算法框图 390 15.3.2 多级梯度能量描述 391 15.3.3 级联检测器 394 15.3.4 搜索策略 396 15.3.5 结果仲裁 397 15.3.6 实验结果 397 15.4 讨论 400 参考文献 400 第16章 基于JPEG2000压缩码流的检索方法 16.1 概述 402 16.2 JPEG2000码流结构及包头信息 403 16.3 基于JPEG2000压缩码流的图像检索 404 16.3.1 提取包头信息 404 16.3.2 基于包头信息构建特征量 405 16.3.3 特征量归一化 406 16.3.4 相似度匹配 406 16.4 基于JPEG2000压缩码流检索方法的实验 407 16.4.1 特征量计算及相似度匹配 407 16.4.2 检索结果的准确性 408 16.4.3 检索效率与压缩比的讨论 410 16.5 讨论 412 参考文献 412 第17章 基于反对称双正交小波的压缩域图像检索方法 17.1 概述 413 17.2 基于反对称双正交小波的多尺度边缘提取算法的研究 414 17.2.1 小波用于图像边缘提取 414 17.2.2 反对称双正交小波的多尺度边缘提取算法 417 17.2.3 基于反对称双正交小波多尺度边缘提取算法实验 421 17.3 方向梯度相角直方图及其特性 424 17.3.1 方向梯度相角直方图的构造 424 17.3.2 方向梯度相角直方图的特性 426 17.4 基于反对称双正交小波的压缩域图像检索算法的研究 431 17.4.1 基于反对称双正交小波的图像压缩编码算法 431 17.4.2 基于反对称双正交小波的压缩域图像检索算法 432 17.4.3 基于反对称双正交小波的压缩域图像检索算法实验 432 17.5 讨论 437 附录:小波滤波器系数 438 参考文献 439 第18章 一种支持检索的分类矢量量化压缩编码方法 18.1 概述 441 18.2 不同量化方法与图像检索 442 18.2.1 标量量化 442 18.2.2 矢量量化 442 18.2.3 分类矢量量化 444 18.2.4 检索性能分析 445 18.3 一种支持检索的分类矢量量化压缩编码算法的研究 447 18.3.1 基于反对称双正交小波的分类矢量量化压缩编码算法框图 448 18.3.2 矢量码书的设计 450 18.3.3 基于压缩数据的图像检索 454 18.3.4 一种支持检索的分类矢量量化压缩编码算法实验 456 18.4 讨论 460 参考文献 460 第19章 一种支持检索的迭代分形图像压缩方法 19.1 概述 462 19.2 迭代分形编码 463 19.2.1 迭代分形编码的理论基础 463 19.2.2 迭代分形编码的基本原理 465 19.2.3 分形与其他方法的结合 466 19.2.4 迭代分形用于图像检索的分析 467 19.3 基于迭代分形的图像压缩编码与检索算法研究 467 19.3.1 小波变换域内基于迭代分形的图像压缩编码算法 468 19.3.2 基于迭代分形压缩数据的图像检索的实现 471 19.3.3 基于迭代分形的图像压缩编码与其检索算法实验 472 19.4 讨论 475 参考文献 476 第四篇 结束语 第20章 结束语 20.1 人眼视觉系统特性的讨论 481 20.2 视频关键帧的压缩域提取 482 20.2.1 等时间间隔采样方法的关键帧提取 482 20.2.2 基于帧间内容变化方法的关键帧提取 483 20.2.3 基于聚类方法的关键帧提取 484 20.2.4 针对敏感视频识别应用的关键帧的提取方案 484 20.3 语义鸿沟 485 20.3.1 基于对象本体论定义高层语义 486 20.3.2 机器学习方法建立低层视觉特征与高层语义的关系 486 20.3.3 相关反馈学习用户主观意图 488 20.3.4 生成语义模板支持高层图像检索 488 20.3.5 讨论 489 20.4 压缩域图像特征的提取 490 20.4.1 压缩域图像中的空间视觉特征 490 20.4.2 压缩域编码特征 491 20.4.3 不同压缩域的统一特征 492 20.4.4 讨论 492 参考文献 493 …… 序言长期以来,人们在自然界感受到的信息主要是视觉信息。与此不同,传统的计算机与通信领域,能够处理和传输的主要是文字和语音信息。近年来,全球信息化和经济全球化已成为时代的发展潮流,研究新的宽带业务,开发网络多媒体应用,提高人类的生活质量,已成为各国科技界与产业界共同关注的问题。由于宽带业务与多媒体信息的主体是图像/视频,因此,研究开发以图像/视频为主体的多媒体业务已成为当今信息科学与技术的重要研究领域。 如何对急速膨胀的海量图像数据进行有效的检索处理,是人们研究开发以图像/视频为主体的多媒体业务首先要面对的一个问题。针对目前广泛使用的基于关键字检索(Keywords-Based Retrieval)的图像检索方法的种种不足,人们提出了基于内容的图像检索(CBIR,Content-Based Image Retrieval)技术。CBIR技术通过提取图像的低层视觉特征(如颜色、纹理和形状等)为图像建立索引;用户通过提供示例图、草图或描述图像特征等进行检索;系统进行相似度匹配,返回与特征相似的结果。CBIR技术的优点是,它在一定程度上体现了图像的内容,具有较强的客观性。 后记本书是北京市信号与信息处理研究室十年来在图像检索与压缩域处理技术方面研究工作的总结,是研究室教师与同学集体工作的结晶。没有大家共同的努力,就没有这本书的问世。在此要特别感谢他们的辛勤工作。 有关人员的分工如下:张菁博士负责第3~9章以及第20.3节初稿的写作;李晓光博士负责第13~15章以及第20.4节初稿的写作;沈兰荪负责第1、2、10~12、16~19章以及第20.1节初稿的写作,并负责全书总体设计,博士生赵士伟负责第20.2节初稿的写作。沈兰荪、张菁、李晓光等共同承担全书统稿及定稿工作。 本书写作直接参考了魏海、黄祥林、李晓华、刘党辉、朱旭娟、宋磊、孔潇、孙慧平、李嵩、贺琳、赵孟凯、高静静、赵士伟等在本研究室学习时完成的学位论文与公开发表的学术文章。贺琳硕士参加了全书文稿的整理工作。王素玉博士帮助审阅了第17章初稿,李云章教授审阅了第17章小波部分的数学内容。在此一并致谢。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。