Web 技术研究所

我一直坚信着,Web 将会成为未来应用程序的主流

WAV文件格式(PCM方式)

  目前各浏览器对HTML5的AUDIO标记基本都支持了WAV(貌似IE自己不支持,但IE上可以用它特有的WMP对象来播放),所以WAV可以作用通用的声音格式。而PCM方式编码的WAV中的数据是明文存储,所以非常容易使用,不过在带宽占用方面还需要优化。
  下面就是PCM方式WAV文件的结构:
位置类型(Little-Endian)
00 01 02 03Char(4)"RIFF"
04 05 06 07Uint32文件总大小(Byte)=文件头大小+数据长度
08 09 0A 0BChar(4)"WAVE"
0C 0D 0E 0FChar(4)"fmt "
10 11 12 13Uint32WAV头大小(PCM方式这个值为16)
14 15Uint16编码方式(PCM方式这个值为1)
16 17Uint16声道数量
18 19 1A 1BUint32采样频率(Hz)
1C 1D 1E 1FUnit32每秒字节数(Byte)=(采样频率*采样块大小)
20 21Uint16采样块大小(Byte)=(声道数量*采样点大小/8)
22 23Uint16采样点大小(Bit)
24 25 26 27Char(4)"data"
28 29 2A 2BUint32数据长度
余下部分Int采样点大小数据
  WAV文件实际上是基于RIFF的存储,它使用RIFF头。头中的前几个字段是使用RIFF的格式来描述这个文件是一个WAV和一些其它必要的信息。之后还需要一个用于描述音频配置信息的WAV的头(也就是表格中淡绿色背景的部分),这个WAV头的大小会因为使用的编码方式的不同而不同,在WAV头之前的RIFF头字段(淡红色背景的最后一个字段)中描述了这个头的大小。PCM方式的WAV头是16个字节,所以使用此方式时那个字段的值固定为16。WAV头中的第一个字段描述了编码方式,为1就是描述这个文件是PCM方式存储的,其它字段根据PCM的定义描述了这个音频的一些配置信息。
  头部分完了之后就是数据部分,先是一个4字节的字符串"data"表示数据部分开始,然后是数据长度,最后是数据。数据存储的最小单元是采样点,也就是说,如果WAV头中配置采样点的大小是16bit,那么两个字节代表一个采样点(Int16),如果为32bit则是4个字节代表一个采样点(Int32)。然而,它们都是无符号整型,只是采样的精度不同而已。另外,要为每个声道都存储采样点。也就是说,如果是单声道的话,采样点就是简单的顺序排列。如果是双声道,采样点就是左右声道交错排列。采样频率也需要与数据的保持一致,否则可能会造成音频播放速度上出现异常。当然,可以对数据和比率做适当的调整来对这些音频做一些特殊处理。
  最后,要注意的是所有数据使用的Little-Endian存储,也就是说对其中的数据,低位字节在前,高位字节在后。
网名:
3.80.55.*
电子邮箱:
仅用于接收通知
提交 悄悄的告诉你,Ctrl+Enter 可以提交哦
神奇海螺
[查看全部主题]
各类Web技术问题讨论区
发起新主题
本模块采用即时聊天邮件通知的模式
让钛合金F5成为历史吧!
次碳酸钴的技术博客,文章原创,转载请保留原文链接 ^_^