请输入您要查询的百科知识:

 

词条 计算机视觉——算法与系统原理
释义

基本信息

中文名: 《计算机视觉——算法与系统原理》

作者: 高文,陈熙霖

类别: 计算机

价格: 29.0元

语种: 汉语

ISBN: 7302032327

出版社: 清华大学出版社

页数: 312页

开本: 16开页

出版时间: 1999年2月

装帧: 平装

简介

《计算机视觉——算法与系统原理》 根据研究内容可以把计算机视觉划分为计算理论、表达与算法和系统实现三个层次。本书系统地介绍了计算机视觉的计算理论和算法的原理,给出了主要算法的证明,介绍了计算机视觉系统的构成原理。为了便于读者将理论与实现进行对照和进行自己的应用系统设计,本书还介绍了到目前为止国际上比较著名的计算机视觉系统。

本书可作为计算机科学、人工智能、图象处理与模式识别、人机交互、智能机器人、信息处理以及认知科学等有关专业的大学高年级学生和研究生的教学和自学教材使用,也可供以上领域中的科研工作者使用。

内容概述

研究计算机视觉的目的是为了让计算机能够利用图象和图象序列来识别和认知我们周围的世界,以满足社会对于计算机高级应用的需求。一个计算机视觉系统可以分为计算理论、表达与算法、系统实现三个层次。本书系统地介绍了计算机视觉的计算理论和算法的原理等。

目的与意义

人类研究计算机的目的,是为了提高社会生产力水平,提高生活质量,把人从单调复杂甚至危险的工作中解脱出来。今天的计算机在计算速度上已经远远超过了人,然而在很多方面,特别是在与人类智能活动有关的方面例如在视觉功能、听觉功能、嗅觉功能、自然语言理解劝能等等方面,还不如人。这种现状,无法满足一些高级应用的要求。例如,我们希望计算机能够及早地发现路上的可疑情况并提醒汽车驾驶员以避免发生事故,我们更希望计算机能够帮助我们进行自动驾驶,目前的技术还不足以满足诸如此类高级应用的要求,还需要更多的人工智能的理论研究成果和系统实现的经验。在人工智能领域,尤其是在计算机视觉领域,已有哪些成果,其原理是什么,还有哪些问题需要研究等等,是本书要介绍的主要内容。

(1)根据一幅或多幅二维投影图象计算出观察点到目标物体的距离;

(2)根据一幅或多幅二维投影图象计算出目标物体的运动参数;

(3)根据一幅或多幅二维投影图象计算出目标物体的表面物理特性;

(4)根据多幅二维投影图像恢复出更大空间区域的投影图象。

计算机视觉要达到的最终目的是实现利用计算机对于三维景物世界的理解,即实现人的视觉系统的某些功能。什么是计算机视觉研究的本质问题?如果用一句话来概括,就是利用二维投影图象来重构三维也纳物体的可视部分。

人类智能系统是一个完整的功能系统、是—个整体。它不能被分割成毫不相干的几个子系统来单独运行。这与目前人工智能通常采用的习惯出发点是根本不同的。人工智能目前处于比较初级的研究阶段,所研制和开发的对象都是独立运行的功能子系统,例如,听觉子系统、视觉子系统、触觉子系统、推理子系统等等。一般认为,只有当这些单独的子系统的研究都比较彻底,理论体系比较成熟,人的智能活动的内部机理全部搞清楚之后,才有可能在较高层次上研究真正意义下的人工智能系统。然而,这种观点的最大问题是人工智能系统的工作机理与人类智能系统的工作机理完全不同。人类智能系统中的感知行为是多通道协同工作的。换句话说,每一个通道负责获取一部分信息,这一部分信息对于完成环境或事件的理解也许是不完全的,但所有信息通道得到的信息总和(加上历史信息和背景信息)却是完全的。人工智能研究中的子系统总是被希望做成一个完美的系统,一个不需要和其他通道合作就可以独立工作的完整系统。这样就要求该通道所提供的信息必须是完全的,而这与我们日常生活中的信息背景是不一样的,是对信息源提出的过分苛刻的要求。为了达到这样的要求,要么制造一些与现实环境相差甚大的理想数据,要么施加种种约束条件。但不管怎样,这样的系统一定是不很实用的和脆弱的。作者希望读者现在就建立一个观念:不要认为我们下面将要介绍的计算机视觉系统是孤立的和万能的,而是在不同的应用背景中它应该与不同的感知通道相配合,例如用在人类通信中可以与语音通道相配合,用在发现和跟踪目标中可以与激光和超声波等技术相配合,等等。

为了达到计算机视觉的目的,有两种技术途径可以考虑。第一种是仿生学方法,即从分析人类视觉的过程入手,利用大自然提供给我们的最好参考系——人类视觉系统,建立起视觉过程的计算模型,然后用计算机系统实现之。第二种是工程方法,即脱离人类视觉系统框框的约束,利用一切可行的和实用的技术手段实现视觉功能。此方法的一般做法是,将人类视觉系统作为一个黑盒子对待,实现时只关心对于某种输入,视觉系统将给出什么样的输出。在大量统计实验的基础上,得到一个较为令人满意的脉冲响应函数,然后利用工程的方法实现。这两种方法从理论上都是可以使用的,但面临的困难是,人类视觉系统对应于某种输入的输出到底是什么,这是无法直接测得的。因为不像在动物实验时可以做到的那样,我们不能在人的脑细胞或者视网膜或者视神经之上插入电极进行刺激响应的测试,因而无法利用生理学实验的方法得到任何实际的脉冲响应对。再音,即使可以用动物(例如狗)的视觉系统做上述实验,然而对于什么是视觉输入的真正信号,什么是噪音,实际上很难区分。而且由于人的智能活动是一个多功能系统综合作用的结果,即使是得到了一个输入输出对,也很难肯定它是仅由当前的输入视觉刺激所产生的响应,而不是一个与历史状态综合作用的结果。由于仿生学方法的进展较缓,在本书中,我们讨论的内容大多数属于工程方法。

不难理解,计算机视觉的研究具有双重意义。其一,是为了满足人工智能应用的需要,即用计算机实现人工的视觉系统的需要。这些成果可以安装在计算机和各种机器人上,使计算机和机器入能够具有“看”的能力。其二,视觉计算模型的研究结果反过来对于我们进一步认识和研究人类视觉系统本身的机理,甚至人脑的机理,也同样具有相当大的参考意义。

创作过程

从1991年的秋季学期,本书的第一作者开始给计算机科学系的研究生和本科生开设“计算机视觉”课程。当时,很想找一本合适的中文版教材、但没能找到,最后使用了一本日文的著作作为教材的蓝本,再加上一些相关的英文论文。因为学生中第一外语学日语的很少,所以当时作者是一边翻译一边讲课的。从那时起作者就计划写一本计算机视觉方面的教材。后来,从1992年的秋季开始,作者先后得到了清华大学智能系统国家开放实验室和国家自然科学基金委的支持,从事计算机视觉模型方面的研究,并在此方向上开始培养硕土生和博士生,教材和研究生参考书的双重需求使作者下决心要尽早动笔。本书的实际写作是1992年年底开始的。由于当时科研和其他业务工作的任务很重,作者花了一年时间完成了现在您所看到的本书的前三章及第五章的大部分内容,而且这主要是在寒假和暑假中完成的。1994年和1995年,由于承担了一些国家计划的工作和出国进行客座研究,曾使得写作工作一度停止下来。后来,在众多师长与同仁的鼓励和清华大学出版社几位编辑的关心下,我们两位作者又用了两年的时间,总算使这本书脱稿。

计算机视觉是一个发展中的学科方向,其理论体系还不完备,新理论、新算法、新应用还在不断地涌现。目前,每年计算机视觉方面的文章有数千篇,有关的专业国际会议有十几个。因此,现在要想写出一本内容全面的计算机视觉教材和专业参考书是很困难的。尽管我们知道现在动笔很可能是挂一漏万,但是为了教学和科研的需要,也实在不能等到理论体系完备了以后再动笔。

目录

第一章 概论

1.1 人类视觉系统的构成与视觉机理

1.1.1 眼睛

1.1.2 视觉神经系统

1.1.3 视觉机理假说

1.1.4 视觉中的一些心理和生理特征与现象

1.1.5 视知觉对深度的感知

1.2 计算机视觉研究的特点

1.3 计算机视觉与相关领域的关系

1.4 计算机视觉的发展

第二章 计算机视觉中的空间关系

2.1 基本概念

2.2 成象模型与视觉坐标系

2.3 齐次坐标与N矢量

2.4 平面对偶原理

2.5 直射变换、对射变换与标准极变换

2.6 平移运动

2.6.1 N速度与轨迹

2.6.2 平移运动的出现点与从平移恢复形状

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/1/27 21:03:28