An average human looks without seeing, listens without hearing, touches without feeling, eats without tasting, moves without physical awareness, inhales without awareness of odour or fragrance, and talks without thinking.
– Leonardo da Vinci
1. 什么是声学:
1.1 定义:
声学的英文Acoustics,来源于希腊语ακούειν,意为“听”。维基百科上的定义为:声学为物理学分支,涉及机械波在气体、液体和固体中的研究,包含的课题有振动、声音、超声和次声。作为一种可以被人类听觉系统所感知的物理现象,声音对每一个人来说都很重要。声音甚至在一个人还没出生时唯一可以感知世界的方式。
1.2 声学的研究范围:
简单来说:声学是声音的科学。也就是说,一切和声音有关的事物,都在声学研究的范围内。从各种东西发出声音,经过不同的东西传播,被能听见声音的器官,比如耳朵,接收并感知到,这一系列过程的每一个环节都和声学相关。声学的特点就是交叉性极强。
1.3 声学分类与用途:
美国声学协会ASA(Acoustical Society of America)对声学领域的进行了如下分支:
-
- 气动声学(Aeroacoustics):关注声音/噪声如何通过气体流动产生以及传播,比如噪声怎样通过航天器和风车产生,以及吹奏乐器如何发声等等。
- 信号处理(Audio signal processing):涉及范围比较广,比如模拟声音信号处理,涉及到电气工程;去噪降噪;音频文件压缩,比如大名鼎鼎的MP3;声音信号识别,比如摇一摇搜歌。
- 建筑声学(Architectural acoustics)
- 生物声学(Bioacoustics):主要研究动物间声音的产生和听觉。包括声音交流和动物行为和种类进化的关系,动物的听力原理和神经生理学,利用声音来监督动物种群,认为噪声对动物的影像等等。
- 电声学(Electroacoustics):涉及到耳机、麦克风、音响等声音系统的声音重建和录制的设计。随着手机等便携式电子设备的兴起而迅猛发展,HiFi爱好者对其也有很大推动。相关的电子企业都有电声方面的研究。
- 环境声学(Environmental Acoustics):控制环境中交通、飞机、工业设备、娱乐活动等产生的振动和噪声。声学从业者需要能够定量检测噪声,并且提出解决方案。很多声学咨询都可以提供相关服务,国内外在环境声学领域都有很多人在做。由于和人的健康息息相关,环境噪声对人的影响越来越大,也因此更受重视。声景(Soundscape)是环境声学衍生出来的新宠,不止关注与噪声,也关注如何积极地利用声音,为人服务。
- 音乐声学(Musical Acoustics):致力于研究音乐的物理特性和感知。主要包括乐器和电子合成器的功能和设计,人类的嗓音研究,电脑分析音乐和合成,医用的音乐理疗等等。
- 噪声控制(Noise Control):顾名思义,关注怎样降低噪声,可从三个领域降噪:噪声源、传播途径和接受者(比如戴耳塞)。噪声控制里面包含一个重要的工业应用分支:NVH(noise, vibration, and harshness),在汽车领域扮演者极为重要的角色。
- 心理声学(Psychoacoustics):声学和心理学的结合,是声学领域的新贵。人脑这个黑箱,给声学带来了无尽不确定性以及挑战。
- 语音(Speech):包括语音的产生、处理和感知,涉及到物理、生理、心理、语音信号处理和语言学。在人工智能/机器学习中,语音识别和语义分析是两大重要课题。如何让语音清晰、高效、高质量的被传递和接受是现在语音交互中的难点。
- 超声(Ultrasonics):虽然频率太高,人类听不见,但是在医疗领域应用广泛,其他领域还包括无损监测、水声等。
- 水声(Underwater Acoustics):说了半天水上的,终于来了个水下的。经典的水声研究就是水下声源定位,在军事上广泛应用。除了人类活动之外,水声也和生物声学交叉,面向水下动物。
- 振动和动力(Vibration and Dynamics):研究机械系统的振动,比如铁轨的地面振动、建筑物的隔振(消声室)、人类振动(手-手臂振动症候群)、桥梁防震、建筑中结构声等等。
- 除了ASA提到的这些分类,我个人觉得还有几个分需要以补充(部分和上边提到的有重叠):医疗声学、材料声学、虚拟声学。
2 声音到底是个啥?
声音由物体的振动产生。当物体振动时振动会引起介质——空气分子有节奏的振动,使周围的空气产生疏密变化,形成疏密相间的波,这就产生了声波,这种现象会一直延续到振动消失为止。声波是一种常见的机械波需要在介质中传播。(电磁波真空中也可以)在物理学和数学等相关领域中,波是由于一个或多个场的干扰,从而使场的值围绕稳定的平衡值(静止值)反复振荡的结果。波可以将能量或者信息从一个位置传输到另一个位置。
2.1 波的类型:
2.1.1 横波:振动方向垂直于波传播方向的波叫横波。一个简单例子就是在薄膜上产生的波。波在平行于膜平面的方向上传播,也就是沿着膜传播。但是膜本身垂直于该平面上下移动。横波一般发生在弹性固体中。(想起点什么来有没有?)
2.1.2 纵波:是介质的位移与波的传播方向相同或者相反的波。机械纵波有时候也称为压缩波。因为它们在穿过介质时会产生压缩与稀疏。最常见的纵波就是声波,靠介质分子的前后振荡向前传播。还有拉升弹簧传播的波也是纵波。横波的每个粒子上下移动形成类似于蛇爬行的蜿蜒形状。事实上,声波更加像蚯蚓爬行一样通过不断压缩和舒张而移动的波被称为纵波。两种形式的波都可以在弹簧中传播:
2.1.3 行波:如果场中不同点的相对振幅发生变化,则称该波为行波。机械性的行波是介质中的单个原子或者分子在其平衡位置附近振荡,然后会与相邻的介质粒子发生相互作用(比如碰撞等)将一些能量传递给它们。通过这种方式,能量就可以在介质中传输,而不需要传输任何物质。
2.1.4 驻波:如果场中不同点处的相对振荡振幅保持恒定,换句话说也就是,波在时间上振荡,但是其峰值幅度分布不随空间移动,则称该波为驻波。振幅最小的位置成为波节,振幅最大的位置称为波腹。这种现象可能是由于介质沿与波相反的方向移动发生的,或者是由于两个沿相反反向传播的行波的叠加产生的。
2.2 声音的构成:四大要素
2.2.1 音高:
由物体振动的频率决定,单位时间内频率越快,声音越高越尖锐;反之频率越慢,声音越低越低沉。例如大部分小提琴的A弦会在演奏前调整为440 Hz,代表着A弦每秒钟做440次周期性振动发出的声音。
2.2.2 音值(声音的持续时间):
由声音振动的时间决定,它指的是一个音从开始到结束所持续的时间。就像当我们停止拉弦时,声音并不会立刻消失。中国人会使用余音绕梁来形容一件美妙的乐器即使停止演奏,声音并不会立刻停止。
2.2.3 音强(声音的强弱):
指的是声音的强度,它由声音振动的幅度决定,振幅越大,声音越强。当我们面对一把音量很大的琴的时候,至少说明这把琴的各组件振动幅度很大。虽然对一些人来说会偏爱音量大的小提琴,但这是否是对的是个需要讨论的问题。
2.2.4 音色(声音的类别):
由发声物体本身决定,发声物体不同,音色不同。这可能是所有人最关心的问题,我们会放在最后讨论。在讨论音色之前还有一些更基础的条件与概念需要被考虑到。
3 声音的范围:
声音作为一种机械波,频率在20 Hz~20 kHz之间的声音是可以被人耳识别的。在乐器声学主要研究的范围就在此之间。对于小提琴来说6000Hz以上的频率很难被人感知。但是每个人还是有差别的。年龄,性别和一些先天性的原因会让人与人之间听力的差异性较大。想测试你的听力如何,下面的视频可以告诉你答案。对于很多对音色有追求的朋友来说,正确的认识自己的听力范围会对未来的音色判定更有帮助。
4 音量是什么——声学的基本物理量:声功率、声强、声压
- 4.1 声功率(Sound power):声功率是指声源在单位时间内向空间辐射声的总能量,单位为W(瓦)。
- 4.2 声强(Sound intensity):声强是指声波在单位面积内沿垂直于该面积方向传播的声功率(单位面积内的声能量),单位是瓦/平方米(W/m²)。声强跟声功率有啥关系呢?我们可以这样来理解,声功率的单位为W,声强的单位为W/m²,声强比声功率多了一个平方米的界定,也就说声强指的是某一个平方米的声功率的大小(参考图1),可理解为声功率的“密度”分布情况。
- 4.3 声压(Sound pressure):当空气被声波扰动后,其会在原有的大气压强上叠加上因声扰动而额外产生的压强,用叠加后的压强减去原有的大气压强,就是所谓的声压,声压记为 (小写),单位为帕(Pa)。用通俗一点的话来说,声压其实就是一种逾量压强,我们可以这样来理解,假设一个媒介质点原本的压强为 ,在受到声波扰动后,其压强变成 ,那么此声波的声压就为 。声压分为瞬时声压(峰值)和有效声压(rms),由于人的大脑对瞬时声压幅值波动不敏感,对动态声压的均方根值(rms)却响应良好,故此,我们在进行声压相关方面的计算时,一般用的是有效声压(rms),请注意,在没有特殊说明的情况下,本文中的声压 一律指的是 。声压是个很重要的东西,因为人的耳膜是直接靠声压来推动的。
- 4.4音量或响度:通常被认为是人耳对于声音大小的主观感受。然而人耳对声压或者声能的感受并不是线性的,比如说,人并不会觉得1kHz、2kPa的纯音信号是1kHz、1kPa纯音信号的2倍响。为了描述人耳对声压的实际感受,科学家定义了声压级(SPL)的概念,单位为分贝(dB):
上述物理量的比较
彩蛋问题点击获取答案:你猜现实中最大的音量是多少?
目前地球上已知最大的音量是194 dB,但是我们可以通过两种方式来超越这个值。
冲击波
当能量足够大时,其将超越194dB的限制,虽然其最低压已经到达了绝对真空的零压,但其高压会让声音超过194dB。
在194dB时,波的峰值在正常压的两倍和真空之间交替出现——但是一旦达到195dB,能量不能在空气中传播并将空气向外推开而在中心区域形成真空。超过194dB的分贝越多,真空泡到达的地方越远,影响越大。其以快速增长的半球形式向外扩散。
这个真空泡的边缘是一个超压缩气体(super-compressed gas)组成的的边界,当这个边界扫过陆地时,其会扫平途径的任何东西。随着真空泡的扩张,其能量逐渐减小直至消失。但是,如果你在此之前遭遇到冲击波时,那绝对不会是一段美好的体验。原因有三:第一,撞到超压缩气体的边界就像撞到砖砌成的墙一样。第二,压缩气体很热。第三,它不仅会撞击你全身的部位,还会穿过你的身体,如果能量足够大,还会把你的骨头变成粉末,把你的器官变成汤。
这里有一些音量超过194dB的典型事件:
土星五号(Saturn V)发射:土星五号的发射状况就像一匹野兽一样,其发射产生的冲击波强烈到能够点燃一英里范围内的草地。甚至在三英里远探测器还能检测到135dB的声波。火箭发射产生了如此强烈的声波,因此当火箭发射时,空间发射机构往往将发射台放在水中以吸收其产生的声波从而保护火箭不被声压破坏。
广岛和长崎爆炸:根据资料,其声波强度超过了200dB。冲击波大到在30秒中传播了11km。
1883年喀拉喀托(Krakatoa)火山爆发:喀拉喀托火山的事情足够令人震撼,且与大家细说。
- 喀拉喀托是印度尼西亚的一个岛屿,在1883年8月27日火山爆发。
- 火山爆发彻底摧毁了这座岛屿,以每秒0.4km的速度将巨大碎片送入17英里(27km)高的天空。它也造成了历史上最致命和最深远的海啸之一,据统计,火山爆发中36,000人遇害。
- 但是关于火山爆发的最令人惊奇的是它的声音,它可以说是现代历史上地球上最响亮的声音。
- 声音非常大,以至于足以使40英里以外的水手的耳膜破裂。
- 100英里之外,声音仍然可以达到172分贝,足以永久性地摧毁某些人的耳朵,甚至杀死他们。
- 无论你身在何处,想想一个距离大约100英里(161公里)的地方,发生了某些事情导致你所在的地方产生了非常巨大的声音,这声音比你用最大的声音直接向别人耳朵喊的声音还要大很多。作为对比,火星五号发射时在100米远声音大小是170dB,而喀拉喀托爆发时在100英里外声音强度比170dB还高。
- 声音使300英里(483公里)外的一英尺厚的混凝土墙破裂。
- 声音传遍了整个澳大利亚(听起来像远处炮弹发射的声音),甚至远在3000英里外的罗德里格斯岛还能听到。想象一下,如果在加利福尼亚或欧洲发生的事情,在纽约可以听到。
- 声波远远超出人类听觉范围后,全世界的气压计在接下来的几天都会发狂,因为声波在地球上空盘旋了3.5次。
- 最后,你知道有名的画作The Scream吗?你知道里面的天空为什么是红色的吗?是因为画家爱德华·蒙克(Edvard Munch)在喀拉喀托火山喷发后的一年看到了整个西半球由其引起的红色天空,因此受到启发。
这真是一场大爆发。
使用其他媒介
有比194dB更高的声音——只是不在地球表面上。可能在海洋、在陆地或者其他行星上。比如说,我们太阳系中某处有着比地球中更加致密的大气,其允许更高的压力波振幅,还有更加令人难以置信的强风和强风暴,那里有很多的机会制造更大的声音。
太空中基本都是安静的。你可能听到过这句话:声音不能在真空中传播。现在这个可以理解了,声音是物质产生的压力波,如果没有物质的话,就没有声音。虽然其可能会有巨大的热量、辐射以及力,但是对于近距离观察的人类来说,所有的一切都是死寂的。
如果,假设宇宙中充满了空气,所有的物体都会发出声音(忽略超新星声音的概念——因为仅是安静的太阳都会产生290dB的声音)。根据一个太阳物理学家的说法,这意味着在地球上,无论什么时候,无论在哪里,我们都会听到100dB(大概是摩托车音量)的声音。所以说声音不在真空中传播是一件多么幸运的事情。
5 音色是什么?
音色,一般指声音的品质,英文为Timbre。这个单词源于法语。在古法语中,它指的是不同乐器发出的声音。与人的主观听力与审美有直接关系,受其他各种主观与客观因素影响容易出现变化。因此,物理量上并没有音色这个概念。而这其实也是大多数人最关注的一点。至今为止,关于音色并没有明确的科学定义。在此直接引用美国声学协会(ASA)给出的定义
that attribute of auditory sensation which enables a listener to judge that two nonidentical sounds, similarly presented and having the same loudness and pitch, are dissimilar
可简译为:人们用于区分两个具有相同响度和音调声音的特性。譬如,同一个曲子,人们很容易区分使用钢琴还是小提琴演奏的,这就是因为钢琴和小提琴的音色不一样;同一首歌,也很容易区分是演唱家的原唱还是朋友们的翻唱,这也是因为两个人的音色不一样。真是一个偷懒的定义,看完可能对音色的概念还是有点模糊,没有讲清楚音色到底是什么。以至于有学者吐槽音色是:一段声音中,除了音高和响度的其他特征都是音色。。。
“…the psychoacoustician’s multidimensional waste-basket category for everything that cannot be labeled pitch or loudness.”
简译:除了音高和响度的其他特征都是音色。
5 .1 频谱是什么?
简单来说,频谱是一种使用快速傅里叶变换算法将声音的频率图形化分析的方法。用于寻找与分析声音中重要的特征参数。通常以下面这种曲线图出现。其中横轴为频率,纵轴为幅值。下面的频谱图来自于一把小提琴A弦录音。
- 基频:左边第一个明显的曲线尖峰就是A1的主音 。如果想要发出准确的A1,频谱图只需要这个尖峰就够了。然而实际上,如果真给到你一个纯净的A1不含有其他尖峰的声音并不好听。和拿起电话听筒时听到的纯正弦波一样。
- 谐波:往右在 (左数第二个尖峰)、 (左数第三个尖峰)……位置处出现了多个频率值同主音频率成倍数关系的尖峰,这些尖峰统称为主音的谐波分量,而正是这些谐波分量的位置、大小和分布等决定了不同乐器发出同一个音时的音色。自然界中的每一种声音都是由物体发出的不同振动频率共同组成的。这些复杂的波形都能通过傅里叶分析分解成很多正弦波,换句话说就是复杂的波形可以通过很多正弦波叠加获得。
下面视频给出了不同管乐器(乐器依次为:钢琴,大键琴(Harpsichord),古典吉他,印度西塔琴 (Sitar),中提琴 (Viola),大提琴 (Cello),上低音萨克斯 (Baritone saxophone),低音管 (Bassoon),日本尺八 (Shakuhachi),手风琴 (Accordion))弹奏同一个音(B2)时的音频和对应的随时间变化频谱图,观看视频,可以感受一下音色和频谱(谐波分量)之间的关系。
5 .2 包络是什么?
包络描述的是声音随时间的变化与振幅(音量)的关系。最常见的包络模型就是ASDR,四个字母对应的就是模型里四个主要参数(Attack、Decay、Sustain、Release)的首字母:
- 起音(Attack):声音从开始发出到达到最大音量所需的时间。
- 衰减(Decay):声音达到最大音量后衰减至保持音量所需的时间。
- 保持(Sustain):声音衰减后保持音量的大小。
- 释音(Release):保持结束后,声音从保持音量降到零所需的时间。
四个参数不一样,相同的音听起来也会不一样,之前视频底部给出的就是相应的包络。非常粗糙的解释的话,长笛声音的基础是三角波Triangle,小提琴是Saw锯齿波,由他们引发的泛音也和他们本身形状相同,同时自然中上几乎不存在纯的单一波形,基本都是波形的重叠。最后在相同音高上,改变琴体/笛体的结构,能改变泛音的比例。
当我们用录音软件收录小提琴的声音时,都会有下面这样一段图形。这就是由成千上万个声纹组成的小提琴包络结构。以G、D、A、E空弦为例,他们的包络结构如下图。可以看到虽然频率不同但整体上全都符合标准的包络模型。
5.3. 什么是波形(Waveform)
当我们用音频软件的放大功能观察上面那段包络录音时,可以看到它是由成千上万个波形组成的。这是组成声音可视化图形中最小的单位。波形可以用于描述物体振动的四种振动模态。分别是正弦波、方波、三角波和锯齿波。不同的乐器波形是不一样的。小提琴的波形属于锯齿波。
References
Donec aliquam auctor tortor, non malesuada magna consectetur vitae. Nam condimentum justo metus, ac varius neque molestie eget. Aliquam ultricies eros viverra, vulputate turpis tincidunt, tempor lacus. Mauris euismod metus finibus sagittis tincidunt. Donec a augue viverra, porta metus non, congue metus. Nulla tincidunt purus non pharetra elementum. Aliquam fringilla elit ac felis consequat, ut viverra urna porta. Nunc malesuada quam risus. Mauris pellentesque pellentesque porta. Vivamus euismod vulputate tortor. Aenean quis pellentesque nibh consectetur vitae. Nam condimentum justo metus, ac varius neque molestie eget. Aliquam ultricies eros viverra.
- Lorem ipsum dolor sit. (18th ed., 2015)
- Consectetur adipiscing elit. (18th ed., 2015)
- Donec porttitor purus sit.
- Sed convallis leo aliquam.
- Donec eu nisl volutpat. (18th ed., 2015)
- Fringilla orci id, porta quam. (18th ed., 2015)
- Morbi non lectus vitae mauris. (18th ed., 2015)
- Ultrices pretium vitae non erat.
- Nulla consequat arcu vitae. (18th ed., 2015)
- Lorem ipsum dolor sit. (18th ed., 2015)
- Consectetur adipiscing elit. (18th ed., 2015)
- Donec porttitor purus sit.
- Sed convallis leo aliquam.
- Donec eu nisl volutpat. (18th ed., 2015)
- Fringilla orci id, porta quam. (18th ed., 2015)
- Morbi non lectus vitae mauris. (18th ed., 2015)
- Ultrices pretium vitae non erat.
- Nulla consequat arcu vitae. (18th ed., 2015)
- Sed convallis leo aliquam.
- Donec eu nisl volutpat. (18th ed., 2015)
External Links
- Lorem ipsum dolor sit. “Vivamus quis mi eget justo porttitor eleifend” gloriathemes.com – November 2, 2010
- Consectetur adipiscing elit. “Cras blandit felis a cursus fringilla.” gloriathemes.com – June 13, 2017
- Donec porttitor purus sit. “Integer porta dolor sit amet maximus rhoncus.” gloriathemes.com – April 10, 2013
- Sed convallis leo aliquam. “In at sapien quis ante ullamcorper porttitor.” themeforest.ney – July 21, 2012