声音合成原理新人指南Vol.1

您所在的位置:网站首页 人声语音合成器怎么用 声音合成原理新人指南Vol.1

声音合成原理新人指南Vol.1

2024-07-01 01:36:37| 来源: 网络整理| 查看: 265

本文原文主要内容摘自Beau Sievers的个人网站,并由PrehistoricTuna译注转载于此(以及梳理语言并添加部分个人见解)。

(*注:这是一篇严肃正经的声音合成入门概念指南,你将在这里看到——到底傅里叶变换和合成器有什么关系,以及滤波器到底是什么玩意,为什么它在合成系统中如此重要等等。如果严肃类文章不是你的菜,请止步于此并右上角;或者,接着往后看看?)

* Beau Sievers是哈佛大学心理学系的博士后研究员,同时也是位作曲家,索引学的创始成员

世界上第一台一体化声音合成器(1970)介绍

本文是音乐合成原理的简要介绍。解释了合成器(指常见的各类声音合成器)的每个基本组件,以及如何将这些组件链接在一起以发出有趣声音的描述和示例。所讨论的原理并非任何特定的合成平台独有,但通常适用于音乐合成。

我希望本文能帮助感兴趣的音乐家和作曲家使用与电子音乐相关的工具和作品。大多数电子音乐文章的概念性词汇都没做透明的解释,这使得初学者难以触及其溯源。本文旨在作为一个开始起步学习的好地方。

声波和振荡器

声音是压力波,它们通过空气或其他介质传播到我们的耳朵。不同于海洋中的波浪向上和向下移 动,压力波向前和向后移动。这些波将我们的耳鼓移进移出,我们将其作为声音来体验。声音合成是一种创建信号的艺术,当扬声器将其转换为声波时,人们会发现它们很有趣。在本文的过程中, 我们将探索许多设备,这些设备可以创建和修改用于合成声音的信号。

我们将介绍的第一个这样的设备称为振荡器(Oscillator)。振荡器产生一致的重复信号(注:很关键的词,周期重复信号)。来自振荡器和其他来源的信号被用来控制扬声器中音盆的运动,从而产生传播到我们耳朵的真实声波。如果将绳索的一端绑到门把手上,站起来几英尺,然后很快地上下摇动绳索的另一端,则你做的事情与振动器大致相同。不同之处在于,你在摆动一根绳子,而振荡器在摆动一个音频信号。

音频信号通常表示在图表上,其中水平x轴表示时间(t),垂直y轴表示信号的压力(对于声波即Amplitude)。这称为音频的时域表示。时域图有点像演讲者的指示,说明如何进出。当图表的读数为1时,扬声器的音盆被完全推开,而当读数为-1时,扬声器的音盆被完全拉入。此运动在空气中产生压力波,我们可以听见声 音。如果扬声器锥体根据上图移入和移出,则会发出低音鼓的声音。

频率和音高

声波进出的速度称为频率。频率以每秒循环数为单位。波形的单个周期的长度是该波形重复所花费的时间跨度。人们通常会听到随着音调的增加声波频率也会增加。当振荡器的频率加倍时,它产生的声音的音调会向上移动八度。例如,振荡器产生的信号以每秒440个周期的速度重复,其音高与钢琴上的中央A(注:某些记法里的A4。关于乐理基础的十二平均律及其由来,还有各音符的频率换算,可以自行百度)相同。振荡器产生的信号以每秒880个周期重复一次,其音高与A相同,即高于中央A n倍八度。通常的“每秒周期”的说法是“赫兹”,缩写为“ Hz”。

基本波形

此处说明了四种不同类型的基本波形。

技术说明:音乐合成中的主题有时需要一点数学。如果你不是数学家,那可以,你可以跳过没有意义的内容。

正弦波

正弦波看起来像一碗水里的柔和的波浪,在没有突然开始或停止的情况下上下移动。类似于正弦波的常见声音包括吹口哨,从空瓶子的开口吹来的空气和响的音叉。

技术说明:正弦波是最基本的纯波形,其轮廓由称为正弦函数的三角函数描述。可以通过累加一系列正弦波来创建任何其他波形,包括以下所述的其他简单波形。有关此过程的详细信息超出了本文的范围。有关更多信息,请查阅有关Fourier Analysis and Additive Synthesis(傅里叶变换和加法合成)的Wikipedia条目。

在上图中,前两个正弦波被加在一起以产生第三个不同的波。

在上图中,正弦波被添加到其相反的方向。结果就是沉默。

100Hz正弦波的频谱图:横坐标为频率,纵坐标为能量(振幅)

上图表示基于音频频率的音频信号。这称为频域图。某些立体声系统具有LCD屏幕,在该屏幕上, 线条会根据所播放声音的音高含量而上下波动。该LED屏幕是音频的频域表示。如上图所示,正弦波只会向上推这些条之一。这是因为最简单的正弦波只有一个频率。更复杂的波可以在一个以上的频率上具有能量,而图表是跟踪正在发生的事情的好方法。我们将很快查看更复杂的波的频域图。

*****译者注:傅里叶变换说白一点就是你可以把任何形式的波都通过一定变换转化成无数个振幅(即所乘系数)不同的正弦波,同样这些正弦波相叠加即可逆变换为原始波形。正弦波就像是频域分析里的原子,因此说正弦波是最单纯的基础波形,一个正弦波它只在自己的频率坐标上拥有能量(即Amplitude振幅),它没有额外的谐波能量,而其它波形则都可以分解为无数个正弦波,除了原波形的振动基频外,还会在不同频率上产生谐波(具体见后文解释)。

傅里叶变换所使用的一个最典型的例子就是方波的变换(尽管拉格朗日说的没错,正弦波不可能合成出真正带“尖”的波形,但他是从数学角度上说的,现实中并没有绝对意义上的“尖”。傅里叶的理论意义在于实际应用,今天的音乐合成器、采样器、数字信号处理,都基于傅里叶变换的思想),见下图:

傅里叶变换傅里叶变换的动态阐释

锯齿波

锯齿波,具有非常强烈,清晰,嗡嗡的声音。可以通过添加一系列不同频率和音量级别的正弦波来产生锯齿波。我们听到的第一个声音最大的正弦波的频率就是锯齿波本身振动的频率。这称为基频。构成锯齿的每个其他逐渐安静的正弦波具有的频率是基频的整数倍。这些频率称为谐波。

例如,一个理想的基波频率为100Hz的锯齿波将在200Hz,300Hz,400Hz等频率处产生谐波,直到无限远,每个谐波都比上一个更安静。由于锯齿波包含基频的每个整数倍谐波,因此听起来对我们的耳朵来说非常丰富。基本频率定义了声音的音调,而谐波则改变了声音的特性或音色,而不会影响音调。

技术说明:锯齿波中给定谐波的幅度等于其谐波数的倒数。例如,基波频率为100Hz且振幅为1的锯齿波将在200Hz(100 * 2)处产生一个谐波,振幅为0.5(1/2),另一个在300Hz(100 * 3)处 产生一个谐波,并产生一个谐波。振幅为0.33(1/3),依此类推。以这种方式添加的谐波越多,该波看起来就越像本文中描述的理想锯齿波。

方波

方波具有丰富的声音,不像锯齿波那样嗡嗡作响,但不像正弦波那么纯净。旧任天堂的游戏配乐几乎都是由方波制作的。像锯齿波一样,可以通过添加一系列体积逐渐减小的正弦波来生成方波。但是,方波仅包含奇数谐波。

方波中给定谐波的幅度等于其谐波数的倒数。例如,基本频率为100Hz的方波将在300Hz(100 * 3)处产生谐波,幅度为0.33(1/3)。

三角波

三角波听起来像正弦波和方波之间的某种东西。像方波一样,它们仅包含基频的奇次谐波。它们与方波不同,因为每次添加的谐波的量下降得更快。

技术说明:三角波中给定谐波的幅度等于其谐波数的平方反比。例如,一个基波频率为100Hz,振幅为1的三角波将在300Hz(100 * 3)处产生一个谐波,振幅为0.1111(1/3 ^ 2)。

*****译者补充:今天的软件合成器或数字合成器的振荡器已经不再是传统意义上的电路振荡器了,但为了方便,它依然叫OSC。它们显然能产生复杂得多的波形,但不管是什么形式的波形,或者是原声乐器产生的声波,实际上都存在周期并且有特征性的。一个毫无规律的波,它最终就会变成噪声,比如噪声生成器就是这样产生声音,但噪声有时是有用的,比如你想合成一个percussion,那你可能就要用到白噪声振荡器。

建立一个合成器

既然我们已经了解了振荡器,那么让我们画一个非常简单的合成器图。该合成器将包含一个锯齿状振荡器,它将信号发送到我们的音频输出,然后再发送到我们的扬声器。振荡器的音高将由键盘控制。

一个最基本的发声电路

执行单个简单功能的各个合成器组件(例如振荡器和滤波器)称为模块。一个模块化合成器是由许多有趣的方式小模块连接在一起制成的合成。在我们使用的图中,连接模块的线就像虚拟电缆,在它们之间发送信号的方式与音频电缆在现实生活中的方式几乎相同。

音量控制

我们的合成器设计存在一些问题-尤其重要的是,由于我们无法控制振荡器的音量,因此我们的乐器始终在发出声音!为了解决此问题,我们需要添加一个称为电压控制放大器或VCA的模块。VCA的功能是提高或降低信号的音量,通常称为振幅或电平。本质上,VCA是音量旋钮。振荡器和其他声音生成模块始终在发出声音,而当你不想用它时,VCA可以降低音量。

在模拟合成器中,VCA实际上是由载有电流的导线控制的。虚拟合成器(注:数控硬件或软件类的VA合成器)内部没有真正承载电压的电线,但人们无论如何还是经常将其称为虚拟幅度控制VCA。有了许多合成器,大多数VCA都处于底层,我们不必太担心它们的位置或如何控制它们,但是了解它们的工作原理很重要。

让我们现在将VCA添加到我们的简单合成器中。这意味着要添加一个新模块和多条电缆,但是不用担心,它们会在图后立即说明。

键盘相当于电路接通开关,同时还会通过速度传感器传递一个力度值控制VCA音量,并为振荡器确定音高(频率)

这是此图中描述的合成器听起来像的一个示例。请注意,我们现在可以插入暂停并以不同的音量播放音符。

从键盘到VCA 的“ gate ”电缆是向VCA发送以下两个消息之一的信号:如果按下某个键,则为“ on”;否则为“ off”。当门信号关闭或关闭时,我们什么也听不到。当门控信号导通或断开时,VCA会将噪声从振荡器传递到音频输出。“  力度   ”电缆将一个电平发送到VCA,该电平与我们按下琴键的速度相对应,并控制输出的音量。如果我们非常用力地并因此非常快地按一个键,则输出的音量会比我们缓慢而缓慢地按该键大。

*****译者注:VCA只是一种通识的叫法,哪怕在你的虚拟合成器插件里,这部分也常被叫做VCA或Amp,但当然这里并没有电压,更谈不上电压控制,但合成器的起源就是模拟合成器,那些电路模块定义了今天这种形式。

滤波器

一般来说,滤波器是用于操纵信号的工具。从技术上讲,任何以任何方式修改信号的设备都是一个滤波器。但是,当人们谈论滤波器时,他们通常指的是Filter,它会修改信号的谐波含量,从而在频域中改变声音的特性。这就是本文中所使用术语“滤波器”的含义。

滤波器使您可以选择声音中的频率范围,然后增强或抑制这些频率。减少声音中的高频或增加低频会使声音看起来“更暗”或被遮盖,而增加声音的高频或减小低频会使声音看起来“更明亮”。这样的滤波在现实生活中一直都在发生。如果你正在与某人交谈,并且将一本书放在嘴前,则该书会滤除语音中的大部分高频成分,从而使声音听起来暗淡而模糊。

低通和高通滤波器

低通滤波器允许低频率通过该滤波器并阻挡高频率谐波。被滤波器阻止的频率范围称为阻带。允许通过滤波器的频率范围称为通带。从通带到阻带的过渡是逐渐的(*注意是逐渐过渡的,并不是真的一刀切),并且发生在称为过渡带的范围内。过渡带的宽度取决于滤波器降低信号的速率。该速率称为斜率(Slope),以分贝每八度(dB/Oct)为单位进行测量。(将分贝作为幅度测量单位的详细讨论超出了本文的范围。与以往一样,有关分贝的Wikipedia文章中提供了信息。)滤波器将信号电平降低到其原始电平的十分之七左右的频率称为截止频率。高通滤波器则和低通滤波器相反:阻止低频并允许高频通过。

低通滤波器及其基本属性高通滤波器及其基本属性

技术说明:定义滤波器截止频率的确切电平降低量是信号最大电平的0.707倍。信号的功率与信号幅度的平方成正比,在最大电平的0.707倍(1/√2)时,功率下降了一半。因此,截止频率也称为“半功率点”。由于功率下降导致音量下降约3分贝,因此截止频率也可以称为“ 3dB点”。

带通和带阻滤波器

带通滤波器就像一个低通和高通组合使用以分离一组频率的通过,。带阻滤波器则是带通滤波器的相反:一个频带被阻断而其他内容是允许通过的。

带通滤波即低通和高通的组合带阻(很少用)也一样

滤波器的属性

这些滤波器具有许多我们可以控制的属性。对于低通和高通滤波器,我们可以更改截止频率,从而可以控制受影响的频率范围。电子舞曲中Lead音色的一种流行用法是将低通滤波器的截止频率从高缓慢降低到低,然后再缓慢移回。

使用带通和带阻滤波器,我们无需更改截止频率,而是更改受影响频段的中心频率和宽度。使用某些滤波器,我们还可以更改斜率,该斜率确定了阻带频率在多大程度上降低了电平。

许多过滤器允许可变的共振(Resonance)或Q值(不科普,详细百度)。当通带附近的截止频率附近的声音在发出时又被返送回滤波器, 从而产生反馈(feedback)时就会发生共振,反馈量会影响这些频率的大小以及声音的音色。例如哇音效果盒就是一个谐振低通滤波器,其脚踏板控制截止频率。

反馈引起滤波器共振

让我们在虚构的合成器中添加一个低通滤波器模块。我们将其放置在振荡器和VCA之间。根据我们对其的控制方式,此滤波器可以对合成音进行各种改变,从逐渐降低高频的刺耳度到做出各种更强烈的特殊效果。

在振荡器和VCA之间添加低通滤波器

随着采样的进行,低通滤波器的频率会再次上下移动。

*****译者补充:一般情况下,我们最常用的还是低通滤波器,即LPF,因为低通滤波器滤去了声波在高频域上不重要的谐波能量部分(即信号学所指的高频噪声)才使得最终获得的声音称得上乐音。LPF根据其“斜率”通常有24dB、12dB、6dB等等几种常见的类型,对应于原始的模拟电路设计即4-pole、2-pole、single pole滤波器。需要注意的是这只是大致相当,像24dB描述的是滤波器的精确斜率,但事实上真正的模拟电路会有很多干扰在整个过渡带频域上显然是不会精确的,像4-pole则是从电路设计的角度描述这种斜率特性的滤波器,它的整个斜率弯转过程就像是一根线绕过了4个坐标系上的钉子,假设一根线经过每一颗钉子都要向下弯折相同角度,那么显然:4-pole的斜率比2-pole的更陡。这种结果反馈在声音上就是4-pole滤波器切割的更快更彻底,声音会更加锋利,按理说这应该是滤波器性能更好的指标,但对于声音滤波器并不是这样,声音主要是以好听达到目的,因而有时使用2-pole的滤波器保留了更多高频泛音在某些场合是有作用的。

历史上有很多著名的合成器厂家做了很多经典滤波器电路的设计,比如像moog、Oberheim的梯级滤波器等等,今天的模拟或者数字合成器,或者软件插件常常会从电路或仿真的层面模仿以前的经典设计。好的滤波设计决定了声音的基本质量,你会发现现在有很多hybrid数模混合合成器,使用数控振荡器的同时经过DAC,又增加了纯模拟信号滤波器,它给声音带来的特别变化,是很多声音设计者所追求的。

控制信号

为了最大程度地利用合成器,我们需要一种内部控制其每个组件的方法。尽管许多合成器具有用于控制声音的无数旋钮和按钮,但大多数人只有两只手,并且一次很难准确地扭转一个或两个以上的旋钮。幸运的是,合成器中几乎每个模块都可以由另一个模块控制。我们虚构的合成器已经做到了:振荡器的频率和VCA的音量由我们的键盘控制。

包络发生器

我们可以在合成器中控制信号的一种方法是使用称为包络发生器的模块。当包络发生器接收到“开”门信号时,它将发出一个新信号,该信号可用于控制另一个模块。与振荡器反复重复其信号的振荡器不同,包络发生器仅发送一次信号。像振荡器一样,我们可以在时域图上查看包络发生器产生的信号:

ADSR,注意S是纵坐标,它的时长是你触键开关的时长

包络发生器每激活一秒,就会发送一个控制信号,该信号可用于告知另一个模块该做什么。考虑控制包络的一种方法是自动旋钮控制的映射(在DAW里,这被称为automation)。例如,上图所示的包络首先发出一个信号,该信号从零逐渐上升到一个,就像从最左端的最低位置旋转到最右端的最高位置旋转旋钮一样。之后,信号逐渐向下移动到大约0.7,就像将旋钮向左旋转一点,依此类推。

如上图所示的包络称为ADSR包络,因此以其四个阶段命名:起振,衰减,延音和释放。当我们将ADSR包络模块放在合成器中时,我们确切指定接收到“开”门信号后在包络的每个阶段将发生什么。例如,上图所示的包络具有持续250毫秒的起振阶段,其中电平增加到1。此后,它具有持续200毫秒的衰减阶段,其中电平减小到0.7。在维持阶段,只要包络发生器接收到“开”门信号,该电平就保持在0.7。维持阶段没有指定的持续时间。当门控信号变为“关”时,我们进入释放阶段, 该阶段需要200毫秒才能降至0。

尽管ADSR包络可用于控制模块化合成器中的几乎所有东西,但它们通常用于控制声音的音量。当然,相同的包络还可以控制谐振低通滤波器,从而在演奏每个音符时产生清凉的扫动和晃动效果(比如有些半模块化的合成器,只有一个包络生成器,你可以通过接线指示它用于控制音量包络或滤波包络)。

让我们在下面的合成器中添加一个包络发生器。这种包络将导致振荡器发出的声音逐渐衰减,持续并急剧下降。我们将使用连接到VCA电平输入的ADSR包络发生器:

对VCA添加ADSR包络控制信号

低频振荡器(LFO)

经常用来控制其他模块的另一种类型的模块是低频振荡器或LFO。LFO就像普通振荡器一样,可以具有我们指定的任何波形和幅度,但是它具有非常低的次音频频率,产生非常缓慢的振荡信号,通常用于控制合成器中的其他模块。例如,LFO可能会上下移动VCA的音量,从而产生颤音(tremolo)效果。LFO就像是可以为你来回拧旋钮的小型机器人。

让我们在合成器中添加一个LFO,这会导致振荡器的音高上下左右摆动,就像小提琴手移动手以产生颤音一样。我们还将使用包络发生器来调制滤波器的频率,因此我们会在每个音符上自动获得很酷的扫频效果,尤其是当我们调高滤波器的谐振时。使用控制信号来更改另一个模块的频率的过程称为频率调制(FM),如下图所示:

包络生成器的信号同时接通LPF和VCA,同时一个低频振荡器对主振荡器进行FM频调译者补充

以上内容从声音是怎样产生的,到声音合成的基础,到一个常规的合成器是怎样运作的都做了比较详细但很好理解的解释。那么,为什么最终,今天的合成器会发展成这样的形式呢?为什么是键盘作为开关?为什么是OSC-Filter-Amp这样?

好像也没有为什么…… 如果一定要说为什么的话,可能是因为现代合成器的鼻祖minimoog被设计成这样吧…… 它的很多设计到今天依然是一种参照,比如左边放一个滑音轮、一个调制轮这样。以十二分平均律来划分音高的键盘有利于统一振荡器的音高标准,而信号路由实际上就是以前模块化电路的大致连接顺序。尽管后来也有像Buchla之类的合成器设计者并没有完全按照这种套路,但最终这一形式被今天的设计所广泛接受。

变成了VSTi/AU插件的Buchla Easel结论和进一步阅读

几乎每个市售的合成器和音乐合成软件都使用这些基本原理进行操作。有了这些知识和一些独创性,你就不必再使用可怕的合成器预设了。

但是,这还不是终点。关于声音合成和电子音乐,有很多优秀的文献,最好的学习方法之一就是不断阅读。也就是说,这里有一些好东西:

The Computer Music Tutorial, by Curtis Roads

The Csound Book, ed. Dr. Richard Boulanger

Computer Music: Synthesis, Composition, and Performance, by Charles Dodge and Thomas Jerse

Microsound, by Curtis Roads

The Computer Music Journal

Advanced Programming Techniques for Modular Synthesizers, ed. James J. Clark

第一期先写这么多吧。很基础的内容,但对某些概念做了很详细的阐释以解除你的困惑。

没有第二期大概…



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭