本帖最后由 coolbaobao 于 2021-5-26 12:12 编辑
作为一个视频工作者,试着从自己熟悉的图像领域,谈谈对数字音频系统的“时钟”和“jitter”这两个概念的理解,如有错误之处,欢迎指正~~
要从图像的角度来理解音频,首先让我们在大脑中做一个实验,自创一套“光学DAC”系统
第一步,我们需要一个“图像格式的音源文件” 我们知道音源文件有很多不同的格式,但目的只有一个:完整地记录下音频信息 理论上只要能记录信息,你可以创造任何格式,txt也可以记录信息,jpg也可以记录信息…… 那么如果有一个分辨率足够高的图像文件,完整地记录下波形,为什么不可以拿来当音源用呢?
比如这张图,记录了一段波形 当我们把它放大,看到的是这样的画面 这不就是数字波形么?这张图的横向分辨率和纵向分辨率不就是音频的采样率和位深么? (声明:这里只谈理论,不谈实际可行性,实际上分辨要求要大得多,文件尺寸也会远大于一般音频文件,请不要从实际应用来杠我,谢谢~)
好,接下来我们来读取这张图。 假想有一个光学读取头,对准显示屏上的一条纵向扫描线,然后让这张图在显示屏上横向匀速移动,用光电感应得到的电平高低放大后驱动杨声器……
于是,我们就得到了一个光学DAC 系统~~~ 
这并不是什么新发明, 实际上存在激光LP 这种东西,电影放映机也是用一样的光学原理来拾音的,我自己16毫米、35毫米电影放映机和拷贝玩了好几年了~~
但是相比激光LP和电影放映机的纯模拟系统,这个“虚拟光学DAC系统”存在一个很大的软肋,那就是“图像的移动”
我们知道显示屏上任何画面的移动都不是真实的物理移动,只是在一定刷新率下不断变化位置的静帧而已 那么对于上述这样一个系统,一种理想状况是:屏幕每刷新一次,图像恰好横向“移动”一个像素点 这就需要图像“移动”速度和屏幕刷新率的精确配合,如果配合出现一点点误差,比如在单位时间内移动了半个像素,会怎样呢? 我们知道屏幕是无法显示半个像素的,它只能二选一:要么多停留一个像素,要么跳过一个像素 如果是前一种情况,波形会多出一个采样点,如果是后一种情况的话,那么以这张图为例,波形就失去了一个波峰 对比一下是不是很明显?
![]()
如上所述,图像移动和屏幕刷新率的配合,需要一个精准的时钟来控制,时钟不准就会产生“抖动”,而这个抖动会改变实际读取到的波形,甚至丢失信息
那么如果我不采用屏幕读取,而是把这个波形刻到黑胶唱片上,用唱针来读取呢,或者印到胶片上,用光电管来读取呢? 显然,不管转速再怎么不准,也只会造成声调变化,不会丢掉那个波峰的 模拟系统也许会有震动、转速不准等问题,但不会产生jitter,不可混为一谈
|