词条 | 视音频信息 |
释义 | 概述音频信息是指自然界中各种音源发出的可闻声和由计算机通过专门设备合成的语音或音乐。 按用途分为三类:语音、音乐和效果声。 视频信息是指活动或连续的图像信息,它由一系列连续呈现的图像画面所组成,每幅画面成为一帧,帧是构成视频信息的基本单元。 声音是一种物理现象,人耳听到则是一种心理现象。人耳具有分辨声音的强度、音调及音色的能力,还能够分辨出声音的方向和深度,并感受到空间感和纵深感。通常将人耳对声音的主观感受,即响度、音调和音色称之为声音的三要素。 响度响度是听觉的基础,为人耳对声音强弱的感觉程度,主要取决于声波振幅的大小,正常人听觉的强度范围是0dB~140dB(也有些资料人为是–5dB~130dB)。超出人耳可听频范围的声音,即使响度在再大,也听不见。 (1)频率响应声压级越高,人耳的听觉频响曲线就越趋近于平直,声压级越低人耳的听觉频响就越差;高于20KHz的和低于20Hz的声音,人耳基本上听不见;而对于3KHz到5KHz的声音感觉最灵敏,响度与声压级有一定的关系,但大小并不完全一致,声压级大,人耳的感觉不一定响,因为听到的声音响度还与声音的频率密切相关。 (2)等响曲线描述响度、声压级和声源频率之间的关系曲线称之为等响曲线,其基本规律是每条曲线上所代表的与声压级、频率相对应的声音,人耳听来都是同样的响。例如将1KHz时以dB表示的声压级定义为响度级,单位为phon(方)。可以看出,高于或低于1KHz声音的响度级与声压级就有了偏差。 0方(phon)以下的声音,人耳是听不见的,所以该曲线可称为可闻阈;120phon以上的声音会使人耳感到疼痛,该曲线可称为痛阈。 100Hz的声音,必须具有40dB声压级,人耳才能听到,而1KHz声音大于0dB声压级,人耳就能听到,因此,当改变一个放音装置的音量时,声音信号中各频率的响度就会改变,使听音人会感到音色的变化。即使是一个高级的放音装置,在低声压级音量时,也会感到放音频带变窄,声音变弱。所以调音人员在使用调音台调整声音的过程中,作为标准的监听,其声压级应在80dB~90dB之间。由曲线可以看出声压级在80dB~90dB时,不同频率引起的响度不平衡差别相对减少,声音的主观听觉偏差较小,才能使声音的频率均衡调整得比较正确,才能听到频响平直的声音。 音高音调是人耳对声音高低的感觉,主要与声音的振动频率有关,但不是正比关系,也与频率的倍数值有关,通常,我们用频率的倍数或对数关系表示因调,频率越高,人耳的感觉因调也就越高,在音乐上称之为音高。 频率增加一倍,称之为一个倍频程,也叫做提高了一个八度。音调的单位是mel(美),以频率1KHz,声压级60dB的纯音产生的音调,定义为1000mel。 音调还与声压级有一定的关系,对于1KHz~2KHz以上的声音,当声压级增大听起来会比原来的音调有所抬高;而对于500Hz以下的声音,频率越低,声压级增大听起来就越低沉,因此我们说,音调还在一定程度上与声压级有关。 音色由于各种发声体的结构和材料不同,即使发出相同音调、相同响度的声音,人耳也能听出它们之间的差别,这就是由于音色不同。例如:两个人讲同一句话,听话人能判断他们各自的声音,是因为每个人的发音器官(声带、口腔、舌、齿等)有差别,使得讲话的音色不同。根据研究分析,相同音调的声音,其基频是相同的,如果,所发出声音的谐波次数和幅度不同,频谱结构也就不同,音色也就不同。 音色由声音波形的谐波频谱和包络决定,其基频所产生的听得最清楚的称为基音,各次谐波微小振动所产生的声音称泛音,单一频率的音称为纯音,具有谐波的音称为复音,每个基音都有固有的频率和不同响度的泛音,借此可以区别具有相同响度很音调的声音。声音波形各次谐波的比例和随时间的衰减大小决定了各种声源的音色特征,其包络是每个周期波峰间的连线,包络的陡缓影响声音强度的瞬态特性。声音的音色色彩纷呈,变化万千。声音高保真的目标就是要尽可能准确地传输、还原重建原始声场的一切特征,使人们真实的感受到诸如声源定位感、空间包围感、层次感、厚度感各种临场听感的立体声环绕效果。 声源发出的声音含有许多复杂的频率。频谱是把时间函数的分量按幅值或相位表示为频率函数的分布图形。根据声音的不同,它的频谱可能是线谱、连续谱或者是二者之和,即混合谱。实际声音是由许多不同频率、不同强度的纯音组合而成的。对一个声源发出的声音的频率成份和强度的分析,叫频谱分析,并且可用频谱图表示,其纵轴为幅度,横轴为频率。将声音的基频和各次谐波按频率分别用一竖线画在横轴上,它的长短表示幅度的大小。 音色是一个主观量,所以音色无法进行量化,其又与频谱的关系很密切,与声音的瞬态情况如发声体振动的起振、稳定和衰减时间过程有关,通常用一些数语来表示,例如:柔和、刺耳、低沉、力度不足等等。 掩蔽效应在日常生活中,可以发现在安静的环境中能够分辨出轻弱的声音,但在嘈杂的环境中,轻微的声音就会被嘈杂的声音掩蔽而不能听到。在聆听一个声音时,被另一个较强的声音所掩盖,而出现听不见的显现称为掩蔽效应。 基本类型(1)频域掩蔽是指掩蔽声与被掩蔽声同时作用的效应,又叫同时掩蔽,掩蔽声在掩蔽效应发生期间一直起作用。通常,领域中的强音会掩蔽与之同时发声在附近的弱音,弱音频率离强音频率越近,就越容易被掩蔽;反之,离强音频率越远的弱音,就不容易被掩蔽。 例:一个1KHz的声音比另一个900Hz的声音高18dB,后者便很容易被前者所掩蔽;若一个1KHz的声音频率比另一个较远的1.8KHz的声音高18dB,则这两个声音将同时被人耳听到;若要使1.8KHz的声音听不到,则1KHz的声音要比1.8KHz的声音高45dB。一般来说,低频率的声音容易掩蔽高频率的声音。 (2)时域掩蔽是指掩蔽声与被掩蔽声不同时出现时的掩蔽效应,又称异时掩蔽,其又分为两种。掩蔽声音出现前一段时间内发生称为导前掩蔽;否则叫滞后掩蔽。产生时域掩蔽是因为人的大脑处理信息需要花费一定的时间,随着时间的推移它很快会衰减,是一种弱掩蔽效应。一般情况下,导前掩蔽只有3ms~20ms,而后滞掩蔽却可以持续50ms~100ms。 (3)掩蔽规律掩蔽效应遵循的基本规律是低频声音可以掩蔽高频声音,高频声音较难掩蔽低频声音;提高掩蔽声的声压级,掩蔽的范围将扩大。被掩蔽声的频率越接近掩蔽声,掩蔽的效应就越显著。 (4)应用实例在管弦乐队中安置数量较多的小提琴,可增大小提琴的声压级,并将传声器装置在合适的位置上,才不至于被打击乐或发音强的铜管乐所掩盖;在使用调音台合成男女二重唱时,需提高女声通道的输出音量,方能使女声在合唱中不被男声所掩盖。 优先效应假设有两个相同的声音先后到达人耳,如果时间差在50ms以内,并且后到达的声音较弱于第一个到达的声音,则人耳只会感觉到第一个声音的存在,这种效应叫优先效应,也称哈斯效应。如果时间差大于50ms,则人耳就能先后听到两个声音。 视频技术基础动态图像传输在电信领域被称为视频业务或视讯业务,在计算机界常常称为多媒体通信、流媒体(下载像流水)通信等。视频通信技术是实现和完成视频业务的主要技术。 视频信号视频信号视频信号是一种模拟信号,由视频模拟数据和视频同步数据构成,用于接收端正确地显示图像。信号的细节取决于应用的视频标准或者“制式”--NTSC(美国全国电视标准委员会,NationalTelevisionStandardsCommittee)、PAL(逐行倒相,PhaseAlternateLine)以及SECAM(顺序传送与存储彩色电视系统,法国采用的一种电视制式,SEquentialCouleurAvecMemoire)。在PC领域,由于使用的制式不同,存在不兼容的情况。就拿分辨率来说,有的制式每帧有625线(50Hz),有的则每帧只有525线(60Hz)。后者是北美和日本采用的标准,统称为NTSC。通常,一个视频信号是由一个视频源生成的,比如摄像机、VCR或者电视调谐器等。为传输图像,视频源首先要生成—个垂直同步信号(VSYNC)。这个信号会重设接收端设备(PC显示器),保征新图像从屏幕的顶部开始显示。发出VSYNC信号之后,视频源接着扫描图像的第一行。完成后,视频源又生成一个水平同步信号,重设接收端,以便从屏幕左侧开始显示下一行。并针对图像的每一行,都要发出一条扫描线,以及一个水平同步脉冲信号。 另外,NTSC标准还规定视频源每秒钟需要发送30幅完整的图像(帧)。假如不作其它处理,闪烁现象会非常严重。为解决这个问题,每帧又被均分为两部分,每部分262.5行。一部分全是奇数行,另一部分则全是偶数行。显示的时候,先扫描奇数行,再扫描偶数行,就可以有效地改善图像显示的稳定性,减少闪烁。目前世界上彩色电视主要有三种制式,即NTSC、PAL和SECAM制式,三种制式目前尚无法统一。我国采用的是PAL-D制式。一般等离子都兼容以上的电视制式。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。