飞道的博客

音频和视频的基础知识及计算

302人阅读  评论(0)

音频(audio)
声音信号,即相应于人类听觉可感知范围内的频率。多媒体中使用的是数字化音频 。采样后的声音以文件方式存储后,方可进行声音处理。声音文件有多种格式,目前常用的有:
无损格式,例如WAV,FLAC,APE,ALAC,WavPack(WV),cda
有损格式,例如MP3,AAC,Ogg Vorbis,Opus
计算公式 音频大小(字节)= (采样频率 * 采样精度 * 声道数) / 8 * 时间 (秒)
采样频率 也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。
采样精度 采样精度是指通过采集声音的动态范围来反映度量声音波形幅度的精度。
采样精度决定了记录声音的动态范围,它以位(Bit)为单位,比如8位、16位。8位可以把声波分成256级,16位可以把同样的波分成65,536级的信号。可以想象,位数越高,声音的保真度越高。
样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65535的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。

声道数

音频剪裁和压缩
采样率就是44.1KHz
比特率就一般是128kbps kb是大小,ps是每秒,/s . 所以一个mp3的大小就是128460=30720kbp=3.07M
类似的单位还有兆位每秒(又称兆比特每秒,megabit per second, Mbps),Gbps(俗称千兆)
采样率就是44.1KHz这个值,越高反应音乐效果越好
比特率就一般是128kbps,反映每秒所使用的空间大小(比方硬盘空间大小),同样是越高反应音乐效果越好。
以下是更多的信息:
简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。横坐标的采样率表示了每秒钟的采样次数。纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。
采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。
而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。 同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。
当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100213=1146600,也就是说CD每秒的数据量大约是144KB,而一张CD的容量是74分等于4440秒,就是639360KB=640MB

VBR (Variable Bitrate) 动态比特率
也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;
ABR (Average Bitrate) 平均比特率
是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
CBR (Constant Bitrate) 常数比特率
指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

动画(animation)
将静态的图像、图形及连环图画等按一定时间顺序显示而形成连续的动态画面。

视频(video)
视频文件格式 mp4 avi flv rmvb mov asf
计算公式
数据量(位/秒) = (画面尺寸色彩位数(bit) 帧数) 应该就是视频比特率
视频大小(字节) = (画面尺寸色彩位数(bit) 帧数)* 时间(秒)/ 8
数据量 * 时间 / 8 = 文件总字节
视频比特率(码率,每秒传送的比特数-bit数,单位为 bps(Bit Per Second),比特率越高,传送数据速度越快。)


转载:https://blog.csdn.net/m0_37537624/article/details/106506282
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场