声音文件的扩展名有:1、WAV,是微软公司开发的一种声音文件格式;2、MIDI,是数字音乐/电子合成乐器的统一国际标准;3、MP3,能够以高音质、低采样率对数字音频文件进行压缩;4、MP4,采用以“知觉编码”为关键技术的a2b音乐压缩技术;5、VQF,是由YAMAHA和NTT共同开发的一种音频压缩技术;6、OGG,是一种新的音频压缩格式,类似于MP3等现有的音乐格式。
本教程操作环境:windows7系统、Dell G3电脑。
声音文件(音频文件)是互联网多媒体中重要的一种文件,它是通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据。
一般获取音频数据的方法是:采用固定的时间间隔,对音频电压采样(量化),并将结果以某种分辨率(例如:CDDA每个采样为16比特或2字节)存储。采样的时间间隔可以有不同的标准,如CDDA采用每秒44100次;DVD采用每秒48000或96000次。因此,采样率,分辨率和声道数目(例如立体声为2声道)是音频文件格式的关键参数。
需要分清楚的是音频文件和编解码器不同。尽管一种音频文件格式可以支持多种编码,例如AVI文件格式,但多数的音频文件仅支持一种音频编码。
有两类主要的音频文件格式:
-
无损格式,例如WAV,FLAC,APE,ALAC,WavPack(WV)
-
有损格式,例如MP3,AAC,Ogg Vorbis,Opus
有损文件格式是基于声学心理学的模型,除去人类很难或根本听不到的声音,例如:一个音量很高的声音后面紧跟着一个音量很低的声音。MP3就属于这一类文件。
无损的音频格式(例如FLAC)压缩比大约是2:1,解压时不会产生数据/质量上的损失,解压产生的数据与未压缩的数据完全相同。如需要保证音乐的原始质量,应当选择无损音频编解码器。例如,用免费的FLAC无损音频编解码器你可以在一张DVD-R碟上存储相当于20张CD的音乐。
有损压缩应用很多,但在专业领域使用不多。有损压缩具有很大的压缩比,提供相对不错的声音质量。
音频数据格式
1、WAV格式
WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,跟CD一样,对存储空间需求太大不便于交流和传播。
2、MIDI格式
MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的文件,在MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。
3、CDA格式
大家都很熟悉CD这种音乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数,跟WAV一样,但CD存储采用了音轨的形式,又叫“红皮书”格式,记录的是波形流,是一种近似无损的格式。
4、MP3格式
MP3全称是MPEG-1 Audio Layer 3,它在1992年合并至MPEG规范中。MP3能够以高音质、低采样率对数字音频文件进行压缩。换句话说,音频文件(主要是大型文件,比如WAV文件)能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。
MP3,为ISO/IEC国际标准,是现在最普及的一种数字音频编码和有损压缩格式,几乎所有的终端和软件都支持此格式。
5、MP3Pro格式
MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding科技公司所特有的解码技术,二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。
6、WMA格式
WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。
7、MP4格式
MP4采用的是美国电话电报公司(AT&T)所研发的以“知觉编码”为关键技术的a2b音乐压缩技术,由美国网络技术公司(GMO)及RIAA联合公布的一种新的音乐格式。MP4在文件中采用了保护版权的编码技术,只有特定的用户才可以播放,有效地保证了音乐版权的合法性。另外MP4的压缩比达到了1:15,体积较MP3更小,但音质却没有下降。不过因为只有特定的用户才能播放这种文件,因此其流传与MP3相比差距甚远。
8、SACD格式
SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声音的细节表现更为丰富。
9、QuickTime
QuickTime是苹果公司于1991年推出的一种数字流媒体,它面向视频编辑、Web网站创建和媒体技术平台,QuickTime支持几乎所有主流的个人计算平台,可以通过互联网提供实时的数字化信息流、工作流与文件回放功能。现有版本为QuickTime 1.0、2.0、3.0、4.0和5.0,在5.0版本中还融合了支持最高A/V播放质量的播放器等多项新技术。
10、VQF格式
VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。
11、DVD Audio格式
DVD Audio 是新一代的数字音频格式,与DVD Video尺寸以及容量相同,为音乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24比特,它们之间可自由地进行组合。低采样率的192kHz、176.4kHz虽然是2声道重播专用,但它最多可收录到6声道。而以2声道192kHz/24b或6声道96kHz/24b收录声音,可容纳74分钟以上的录音,动态范围达144dB,整体效果出类拔萃
12、MD格式
Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一张小小的盘中存储60~80分钟采用44.1khz采样的立体声音乐,就是因为使用了ATRAC算法(自适应声学转换编码)压缩音源。这是一套基于心理声学原理的音响译码系统,它可以把CD唱片的音频压缩到原来数据量的大约1/5而声音质量没有明显的损失。ATRAC利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)以及人耳对信号幅度、频率、时间的有限分辨能力,编码时将人耳感觉不到的成分不编码,不传送,这样就可以相应减少某些数据量的存储,从而既保证音质又达到缩小体积的目的。
13、RealAudio格式
RealAudio是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。RealAudio文件格式主要有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽敞的听众获得较好的音质
14、VOC格式
VOC文件,在DOS程序和游戏中常会遇到这种文件,它是随声霸卡一起产生的数字声音文件,与WAV文件的结构相似,可以通过一些工具软件方便地互相转换。
15、AU格式
AU文件,在Internet上的多媒体声音主要使用该种文件。AU文件是UNIX操作系统下的数字声音文件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种文件成为WWW上唯一使用的标准声音文件。
16、AIFF格式
AIFF(.AIF) 是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。
17、SVX格式
Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。
18、snd格式
MAC声音(.snd) :Apple计算机公司所开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。
19、S48格式
S48(stereo、48kHz)采用MPEG-1 layer 1、MPEG-1 layer 2(简称Mp1,Mp2)声音压缩格式,由于其易于编辑、剪切,所以在广播电台应用较广。
20、AAC
AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、