《七一、SBIR:全頻域前牆反射修正》製作特性差異音訊、體驗聽感

六四、擺位干涉條紋與room mode

goldbingo wrote:
X左右 / Z前後:

這張圖,突然想到可以把它變成負片,黑變白、白變黑:

這圖讓我突然回想到之前[廿四、Room mode]中提到的這個影片:
goldbingo wrote:
轉換到二維,則會像像這影片(https://youtu.be/wvJAgrUBF4w),沙子會停留到較不震動的地方,形成紋路。



房間用牆壁吸收率0.1模擬的圖形,竟然跟沙子造出來的圖案有如此驚人的相似性!

這才想通了,room mode不是只有簡單的平行牆面反射,還會有其他各種想不到的各種角度,交叉疊合而成。不同的頻率,依據房間尺寸、形狀,若是反射夠強的話,就會產生一個肉眼看不到,像是沙盤一樣的獨特奇妙紋路,而且是三維空間的。

那麼這紋路跟喇叭所在位置,也就是擺位有關嗎?複習一下模擬所用的喇叭位置及空間,房間寬6米,深4米,高3米。這次我把干涉波紋一路畫到喇叭位置。


在高度反射(牆面吸收率只有0.1)的房間,把右喇叭右移試試。

對於440Hz,10cm開始稍有影響,到25cm可打亂原本規律性。但對於228.7Hz這種平行牆面的駐波,就算移了25cm,也難以撼動改變。

移動若達50cm,440Hz的紋路已經跟一開始完全不同了。而228.7Hz才有比較明顯的改變。


「room mode只跟房間有關、跟喇叭擺位無關?」

就定義上,這些干涉紋路,跟room mode並不等價。room mode定義上,指的是房間造成的頻率響應不平均問題,只考慮牆壁反射的因素。但是有喇叭發聲下,會影響能量分佈,更何況有兩個喇叭還會相互干擾。這幾個現象總和起來,就形成了這裡看到的紋路變化。只是room mode與干涉定義上要分清楚,別搞混就行。

兩者理論基礎上的共通點:「波長與相位」

440Hz半波長約38公分
228Hz半波長約65公分

兩個發出同樣聲音的音源,到聆聽位置的距離,差半波長的奇數倍,相位會相反,就會產生振幅相消,也就是梳狀濾波(comb filter)效應。想要藉由移位來改變某個位置特定頻率的響應,得有約略等級的位移,不論是聆聽位置或喇叭。

如下圖右邊是114Hz的room mode:

就算喇叭移了50公分,仍無法有效改變114Hz的駐波,因為其半波長長達1米以上。反之上圖右邊1760Hz半波長約10公分,干涉波紋加上room mode極為破碎複雜,已完全不知如何分析起了。

———— 感想 ————

從這房間響應模擬,學到了個觀念:「每個頻率都會產生類似room mode的紋路」。只是形狀、強度與常見幾種較強烈的幾個模式不一樣、難以用簡單數學表示及推算而已。而room mode還會跟發聲源交互影響,產生類似干涉的波紋。

藉由量測頻率響應,可以了解想要修正的頻率點在哪,就能約略知道得移動多少才會改變。但很可能移了後,另一個頻率點又不好了。量測能幫助觀測到變化,利於選擇有效的方式去處理它,少繞些路。
六五、Pink noise房間響應測量

要大量量測房間響應,對聆聽位置或擺位快速評估。使用掃頻計算頻率響應,相對上比較沒有效率,因為掃頻得要固定位置掃完,再進行計算分析,只能一點一點做。

這時,有一個簡便的方法,就是使用pink noise,結合RTA(Real Time Analyzer)。受惠於現代科技進步提升,不再需要專業儀器,只要有手機,就可以得到可供參考的結果。

————— RTA or FFT ? —————

現今的手機要實時計算FFT,其實也不是難事,RTA與FFT只差在解讀時的方便性。主因是pink noise的FFT,天生會每10倍頻掉10dB,除非能後製修正。使用上不如RTA看pink noise時,會直接得到水平的結果直覺。

以下爲將原始pink noise wav檔放入REW,計算RTA及spectrum(也就是FFT):


———— 跟弦波掃頻結果會一樣?————

網路上找資料時,有個疑點我也很好奇。Pink noise結果會跟掃頻結果相同嗎?room mode房間響應也會忠實呈現嗎?這次不就理論來計算,直接用模擬驗證,再以實測佐證。

用模擬的好處是完全控制變因,沒有播放及錄音設備諧波失真、沒有底噪、沒有時鐘jitter等等不理想性。還能調整牆壁吸收係數,模擬不同程度room mode影響。


房間4m(深) x 6m(寬) x 3m(高),牆面吸收率為0.5中等,只用右邊喇叭發聲。先用正弦波掃頻,分析換算得到如下脈衝結果:

直接音脈衝之後,有間隔不等時間到達的牆面反射。將振幅改以dB為scale,如下:

殘響一路持續到約200ms,才降到-60dB以下。轉成頻率響應如下,50~400Hz間有劇烈頻率響應起伏。room mode常見的大凹現象確認存在。


接下來模擬播放pink noise,進行分析:

Pink noise本身的原始頻譜是斜直線往高頻漸低(頻率每增加十倍降10dB)。錄音收到減去輸入音源,就得到淡綠色的頻率響應,把這條用pink noise算出來與用正弦波掃頻的結果放在一起,兩者完全重合,一模一樣。


改將牆面設定成吸收係數只剩0.1,有更大量反射,room mode造成的頻率響應凸起、凹下現象更嚴重:

使用pink noise仍然可以跟正弦波掃頻得到一樣的結果!

———— 實際麥克風量測 ————

實際量測來試試,在客廳的主要聆聽位置,使用UMIK-1錄音。

紅線為掃頻得到的頻率響應,綠色虛線則是用pink noise計算出來。佐證了與模擬一樣的結論:「pink noise可取代掃頻,用來估測房間響應」

Pink noise vs Sine sweep 這影片,17分鐘開始有一些有趣的demo。說明了掃頻除了頻率響應,還能提供更多的資訊,例如諧波失真成分。若想進階利用pink noise得到脈衝響應,雖REW上沒找到這功能,但有些專業商用軟體其實是做得到的。

這篇[How to take fast impulse response measurements in Smaart© without pissing people off] 也還蠻有意思的,雖然用的仍是特定軟體,但是內容提了一個不錯的建議。測試音量不用太大,只要比背景雜訊高個10dB就足夠了。除了減少影響到鄰居,自己測試時耳朵也不會那麼痛苦。

———— 只用iPhone收音 ————


iOS這個 AudioTools app,內建了iPhone內建麥克風的校正檔。錄音分析結果,跟Umik-1比較,在35~400Hz間也還算有模有樣,該凸的凸,該凹的凹。若沒有專門量測用的麥克風,手邊的手機,就是一個可用的工具了呢!
六六、外接時鐘YouTube錄音

原本希望可在這些錄音中,找到外接master clock所造成差異的蛛絲馬跡。結果雖然尚無能力找出時鐘的影響,但卻因為這題學到更多的經驗。聽到的差異,也許是別的原因造成的。跟一開始以為的,有很大的不同!

——— Esoteric N-05XD/G-05 ———


先從[ SOUNDTEC TV ]這個Youtube錄音開始,有兩首,分別只用N-05XD內部時鐘、切換到外部G-05 master clock。

第一首:Danny Boy / TOMA & MAMI with SATOSHI(ネットワークPCM 192kHz/24bit)
全曲長約2分30秒,一開始前面40秒,有很奇特的現象:

低頻區200Hz以下,很明顯的看到接了外接的master clock,少了許多訊號能量。放大來看:

使用內建時鐘時,多出來的頻率能量,正好就在60,120,180Hz,很像是power noise。難道是外接clock能降低power noise? 

可是改看曲子最後的2秒鐘,就沒有看到明顯差異了。

(註:上圖時間軸標示要加上180, 才是曲子的時間)

直覺上,我們會認為只更動單一變數:切換內外部時鐘,但忽略了「時間」也是一個變數。也許實驗時,設備還在熱機,內部電路或溫度還沒達到穩態。這時感受到的,的確有聽感變化,只是不是我們以為的那個變因造成的。

第二首:蒼い風 / HYPS(SACD)
看全曲約5分鐘頻譜圖相減平均差異,各種頻率下都幾乎沒有差異,然而真的沒有差異嗎?

將5分鐘分成每分鐘一段,共五段,分別計算平均頻譜差異:

可以觀察到各段在低頻100Hz以下變異性不小,正值表示外接時鐘時,低頻會稍強。反之負值則內建時鐘時較強。

由此現象延伸思考如下:
📌 1. 若此差異不是錄音設備造成,現場的確有機會感受到聽感上的差異,但未必是時鐘造成的。
📌 2. 此差異隨時間變化的特性,若想知道是不是受內建或外接時鐘影響。可對同一首曲子段落,多次錄音交叉比對。若同樣內建時(或同樣外接時),就有差異,那麼就是其他的變因造成的,不是時鐘。改錄擴大機輸出,也有利於排除環境雜音影響。
📌 3. 一般常見的推論,Clock jitter會影響波形時間的正確性。而頻率越高,週期越短。因此受到同樣大的jitter影響下,高頻受到的影響理論上比較大(請參考這篇 十七、Clock Jitter)。這無法解釋這低頻響應隨時間變化的現象,除非對於時鐘來源的影響,還有其他的理論可解釋。


——— TEAC UD-505-X / CG-10M-X ———


逸品館 ]這個影片,共錄了三首分別使用內建及外接時鐘,每首長度都約2分鐘。

第一首鐵達尼號原聲帶Never An Absolution及第三首玉置浩二的夏の终りのハーモニー,觀察到一樣的問題,尤其是第一首的前面一分鐘最為明顯:

這次不是只有一開始有這樣的差異,一直到第三首最尾巴幾秒,都還有類似現象:

加上了外部時鐘,同時也改變了電源雜訊的樣貌,這已不是所謂的clock jitter的影響。畢竟有一條實體連上了一條線到另一台機器,有可能會造成ground loop或是地雜訊互竄的問題。

——— 感想 ———

如同一開始破題所提,造成訊號變異的原因,並不是因為只換了時鐘源,所以造成聽感差異就只有單一變數。這次經驗學習到實驗設計(不論是用聽感或儀器錄音),有更多要考慮的地方:
🎯  1. 有些機器需要熱機,才會到達穩定狀態
🎯  2. 有可能實驗前,原本的機器就有其他變數存在,多次同段音樂重複聆聽盲測(或錄音),有助於釐清
🎯  3. 用實體線外接另一台機器,別忘了也許共地會改變ground loop狀態或地雜訊分佈。
🎯  4. 隨時間變異的特性最難搞,同一段音樂有時有差異,有時又沒有。這會讓聽感辨別、數據分析都不容易找出一致性,會需要花更多力氣交叉驗證才有機會釐清。找出隱藏在背後真正原因,能穩定重現差異性並解決它,是最挑戰(還要點耐心及運氣)的事。
六七、Op-Amp YouTube錄音

在YouTube找到對不同Op-Amp的錄音,有一些小發現。先說結論:

一、空氣錄音仍舊較容易引入變因,聆聽到差異時,要小心是否是因為引入的變因造成。直入錄音設備,不經由喇叭、麥克風,變因較可控。

二、YouTube使用Opus有損壓縮,是否會影響聽感,也要小心謹慎判斷。最好能有無損壓縮的錄音檔,可減少變數。

—————————————

謝謝[@steventsao.tw],在[ 另一棟樓 ]中提供YouTube Burson, Sparkos, NE5532 - Opamp Blind Test (Feat. Fosi ZA3) — Late Night Unboxing

這部影片是對喇叭Warford Denton 85s,使用錄音設備Zoom F3錄製,麥克風則沒有在影片中找到品牌型號。

錄音分別有Vocal, Guitar, Drums, Classical, Jazz五首,每首用4顆不同的Op-Amp(A~D)分別錄音。空氣錄音最容易遇到的就是環境雜音,來看第一段Vocal的前半段頻譜差異:

(橫軸是時間,縱軸是頻率,此圖是頻譜相減,紅色代表正值、藍色代表負值)

可發現前二十秒,有縱向條紋,表示有寬頻雜訊引入,建議不要用這區段做ABX測試,容易受此雜訊影響聽感判斷。除了這首曲子的前二十秒之外,其他部分及其他曲子就幾乎沒有此現象,環境雜音控制的還算不錯。

其次,16KHz以上,有橫向深紅、深藍色紋路。表示此頻段能量差異不小。舉A、B頻譜為例:

可以看到白色圈圈,頻譜明顯不同,這在YouTube影片的音訊相當常見,很可能是所使用的Opus有損壓縮演算法造成的不同。這個現象在所有曲子都有,至於會不會造成聽感可聞的差異,有興趣的朋友可試試以下連結的網頁,進行ABX測試。

Op-amp Blind Test — Burson V7V-Dual / Sparkos / Stock (NE5532) / Burson V7C-Dual

網頁長這樣:

可以選曲目,4顆一起比、或是兩兩相比。切了每首曲子前20秒及20秒之後兩段,ABX比較時用較短的段落,在音感記憶猶新時,比較差異較容易成功。

空氣錄音還有另一個問題:低頻變異量大

上圖是Classical C&D的頻譜圖,C明顯在低頻能量強很多。但這種現象,在其他曲目卻又不存在,也不必然C的低頻都比較強。所以也沒辦法當作固定不變的辨別依據。聽感聽得出來嗎?有興趣的朋友也可試試上面提供的ABX測試網頁。

為何說這也是空氣錄音的變因?因為以下另一段影片中的錄音,只有Opus有損壓縮問題,沒有一開始寬頻雜音及低音能量起伏不定的問題。

—————————————

這一隻較新的影片,改使用XLR output,直入Zoom F3錄音。

Ultimate Opamp Sound Test on Fosi ZH3 (Burson, MuzgAudio, Sparkos, Staccato, Muses02, etc.) — Late Night Unboxing

頻譜圖相減:

幾乎都是白色,低頻並沒有明顯變強的紅色。

第一首的一開始:

也沒有明顯縱向條狀寬頻雜訊。只剩15kHz以上似乎仍是Opus有損壓縮造成的高頻差異。聽得出差異嗎?有興趣的朋友可試試以下由影片整理出來的ABX測試網頁:

Op-amp Blind Test — Staccato OSG-DHb / OPA1612A / Sparkos SS3602 / Muzg Audio JFET / Burson V7 Vivid / NE5532P / Burson V7 Classic / Muses02

—————————————

感想:

要非常感謝每一位在 YouTube 分享的錄音影片,錄音及剪輯都非常辛苦,讓我們能透過網路就能體驗聽感。但也要同時小心聆聽時,聽到的究竟是環境噪音還是真的聽感差異。

至於錄下的音訊,經過有損壓縮是否會影響辨別差異,則又是另一個課題了。若能有同一個條件(Op-amp)下的兩段同一曲的錄音,會更有助於分析及聽感判斷。

當然最好的方法,仍是用無損音質錄音,這樣聽到的差異,就有機會進一步再做更多分析與比較。然而最深層核心的技術(或說是哲學)問題是:

「在電學的領域、不牽涉空氣錄音,造成聽感上差異的成分,你相信能被紀錄下來嗎?」🤔
goldbingo
tacoseer 我也有一樣的經驗過,感覺有抓到不同處了,但正確率卻不行,p-value很高 [XD]
tacoseer
是的,這結果告訴我如果完全靠猜,對 5 次的機率為24.6%,但在統計檢定中,至少對 5 次或更多的機率為62.3%。代表與隨機亂猜沒有區分,我以為聽出差異是錯覺。
Op-Amp YouTube空氣錄音 - VirtualHiFi

VirtualHiFi的這部影片,雖然是空氣錄音,但是另外用心提供了32 bit/48kHz無損錄音檔,分享給大家。(方便的話,也請鼓勵一下他喔)

10 OpAmps tested with HQ sound demo - Op-Amp Rolling - Find the hidden gem ! — VirtualHiFi
(影片說明文字裡有附無損錄音連結)

有興趣的朋友,也可以試試ABX test:

ABX test 連結

因為是空氣錄音,有可能錄到環境雜音,或是低頻擾動不穩定。我在ABX test網頁上,加了一個新功能。擺上頻譜圖給需要的時候,自行參考選擇比較穩定的段落聆聽比較。

即使不做ABX測試,單看圖也蠻有趣的



有五種頻譜分析可看:

Avg dB diff (log freq) : 全段綜合頻率響應
Full spectrogram (log freq) : 頻譜相減
Full spectrogram (linear freq) : 頻譜相減
LPF detail (log freq) : 頻譜相減並濾除雜訊
LPF detail (linear freq) : 頻譜相減並濾除雜訊

利用用LPF那兩個功能,可以快速看看有沒有環境雜音或低頻擾動跑進去。

LPF detail (linear freq):環境雜音


LPF detail (log freq) : 低頻擾動
六八、訊號線錄音分析

前一篇聊到YouTube錄音有Opus有損壓縮的困擾,不利於進一步音訊分析及聽感測試。在尋找相關主題時,找到另一位ANA[DIA]LOG的影片:Cheap vs High-End Interconnects test: Belden vs Mogami vs Neotech



在他影片上的說明,發現一個驚喜:

他將24 bit/96kHz的原始錄音,也在pcloud分享出來。終於可以不再透過層紗來分析了。(方便的話,請給該作者一個鼓勵他)

其設備配置如下:

OPPO 105D (Audiocom modified) → T+A DAC 200 → [cable under test] → Don Garber fi Preamplifier → Prism Lyra 2 (24-bit/96kHz ADC)

Track 1: Mogami W2534
Track 2: Neotech Nemoi 1220
Track 3: Belden 8402

待測線在DAC及前級之間,用ADC錄音前級擴大機輸出,不經過喇叭、空氣、麥克風。我將無壓縮wav檔,切成20秒一段,方便進行ABX test,連結如下:

訊號線 ABX test  ]

有興趣的朋友,可以試試您是否聽得出差異。YouTube作者在影片中,也有使用程式分析DR、頻譜、Loudness,可以發現數據上差異存在。接下來我將延伸進行更詳細分析,一窺究竟。

—————— TL;DR ——————

先說結論:

的確發現不同,三個錄音在音量上存在小於0.01dB的差異,Neotech在20kHz發現類似AM(調幅)干擾訊號,原因不明。除此外,在底噪、相位響應則沒有發現不同。

—————— 頻率響應 ——————

因為只有三個錄音檔,沒有原始播放來源檔。然而分析需要一個基準才能比較,我選了Mogami當作基準,Neotech及Belden對Mogami進行FFT後相除,得到相對頻率響應:

由圖得到以下觀察:
1️⃣ 頻率響應完全平直,表示沒有EQ效應(比較正式的說法是染色或音染coloration),不會對高或低頻有不同加強或削弱的改變。
2️⃣ 雖然頻率響應完全平直,但並不是0。Neotech相對偏高+0.0027 dB,Belden相對偏低−0.0049 dB。
3️⃣ Neotech在20kHz左右,有明顯突刺,在Belden及Mogami並沒有。

詳細分析,還有以下延伸思考:

1️⃣ 平直是相對的,因為是拿Neotech-Mogami,所以平直並不代表由DAC到ADC的過程,頻率響應沒有變化。而是兩條線的變化一模一樣,所以相減之後就是平的,代表線不會改變高低頻成分比例。

2️⃣ -0.0049dB的音量差異,對人耳聽感,應該難以區別。但在電路上的意義就不同了,這差異很大!以電阻分壓計算,一般的前級輸入阻抗若是47kΩ,換算回訊號線組抗高達26Ω,我在 [十五、傳輸線實驗] 中量過,5米長的便宜紅白梅花線,也不過8 Ω。上網查了三條線的規格,都小於0.1 Ω/m。除非該Preamp輸入阻抗很低,或是這幾條線接頭有問題,阻抗正好都偏高。


再同時看左右聲道狀況:

左右聲道都是類似的音量差異,這排除了線沒插好導致接觸電電阻偏高。畢竟不會這麼巧,都變化量相似。整個系統中可能有「非」線材的因素引入,例如機器熱機、溫度等。比較不像是線材或接頭差異造成。

3️⃣ 放大Neotech在20kHz的突刺如下,很詭異的是等間隔約100Hz一根根類似AM(調幅)訊號,會是周邊螢幕或電源有50Hz為基頻的相關雜訊干擾?很難說就一定是干擾,還是有其他原因。



利用頻譜圖觀察差異訊號,這是一個非常穩定存在長達120秒的訊號,不能排除是電路某個元件正好在該量測區間產生此訊號。


巧合?還是干擾?不得而知。但差異是明確存在於20kHz超音波的頻段。

—————— 底噪 ——————

因為是正常音樂的錄音,也沒有播放的原始音源可參考,沒辦法直接計算SNR。退而求其次是找錄音中各頻段能量小的地方,看看有沒有因為底噪影響升高。



觀察如下:
1️⃣ 各不同頻帶最低能量並不相同
2️⃣ 不同三條線,特性幾乎完全重疊。可見音量低的地方,底噪變化也許不同但太小,或是都一樣

因為都重疊了,不容易看出差異。以Mogami為基準減去,得到下圖:

3️⃣ 最右邊20kHz,一樣看到Neotech有根突刺

此外都是0dB,證明這些低能量區仍是音樂訊號,要嘛是底噪太小有變化也看不到、或是底躁量根本一樣,並沒有發現有底噪不同而變化。比較有趣的是最右邊20kHz的地方,放大來看(精度有提高、peak值會不同):


更明顯的看到方才Neotech在頻率響應上看到的現象,Belden與Mogami都沒有。雖然數據上在安靜的區段非常明顯,但20kHz人耳並不敏感,能否聽感上能感受到,會是個有趣的題目。您的瀏覽器要支援96kHz,電腦也要能輸出96kHz到DAC,這樣ABX test網頁才能派上用場。

—————— 相位響應 ——————

利用FFT計算,在得到頻率響應時,同時也會得到相位響應,但直接算出來的相位無法解讀,因為頻率沒有矯正。DAC有晶振,ADC有另一顆晶振,不共用晶振的話,勢必會有頻差,而且頻差還會隨時間而異。

下圖是利用correlation估出來的group delay,左邊是Neotech相對於Mogami,右邊是Belden相對於Mogami:


由時間差變化趨勢,可以反推一階近似,得到頻差:

Neotech vs Mogami: -0.171 PPM
Belden vs Mogami: -0.048 PPM

晶振頻差不可能是訊號線造成的,跟製程、溫度、電源比較有關。去掉頻差,終於可以看到相位響應:


總算有點像樣了,兩個差很大,難道找到了證據線材會造成差異?其實不是,光修正頻差還不夠,還有scaling效應,將左圖除以(0.171/0.048)=3.53縮小:


兩者就幾乎完全重合了,這表示相對Mogami而言,Neotech與Belden在相位響應上是一樣的。至於8kHz以上的上下變化,難道是Magami跟另外兩條不同?其實不然,我試過改以Belden為基準,一樣會得到上面那張圖。

究竟為何有此相位響應?其實這只是一般音樂頻率成分導致演算法的差異。我將音樂分成30秒一段,共四段。同樣跑分析結果如下:


這個現象跟著音樂特性跑,不同音樂段落,用這個方法計算的phase response會不一樣。這並非真實的phase response,只是因爲測試音樂的特性,在估算相位時受頻率成分比重影響,演算法造成的偏差。也可以硬把這項誤差估算扣掉,就可得到下圖,相位響應都幾乎是0度。但這已經是估算的估算,有點over engineering了。


結論是在相位響應上,沒有找到與線相關有差異的證據。

—————— 感想 ——————

詳細分析結果及數據也放在以下網頁(英文版)。

Analysis: Amplitude, Phase & Clock Drift — Mogami W2534 / Neotech Nemoi 1220 / Belden 8402

過程中最困難的,是變因釐清與控制。clock, gain, interference等等,要怎麼從三個獨立的正常音樂錄音中抽出來。

從要能完整控制分析變因,也學到了一些東西:
1️⃣ 單一錄音會有代表性問題,能有同一條線3個以上錄音,更能確定是變因還是實際現象。(20kHz AM noise)
2️⃣ 機器熱機、特性穩定度也是個要小心的點,多次錄音也可減緩此疑慮。(音量差異)
3️⃣ 分析相位、底噪等,用標準測法(共clock、sine sweep、單耳播放等等)會很有幫助,較容易得到直接數據。(Xtal ppm誤差)

最後,找到的差異,還是要靠聽感做確認。有可能數據雖然有差,但小到聽感無法辨別。也有可能聽感發現有異,只是我目前的分析不夠完整。能有更多朋友的反饋,將可持續演進分析及量測手法。
六九、SBIR互動網頁

之前在[廿三、喇叭前牆距離 ]曾經聊過一次,最近做了一個互動網頁,獨樂樂不如眾樂樂,分享給大家。

Room FR vs listener position ]

畫面上半段是heatmap,表示相對該頻段的能量是偏大(紅色)還是偏小(藍色)。

有一個Wall r表示牆壁的反射率,0.85表示有85%的聲音會反射。然後下面有個圖,您可以拉喇叭位置,就會改變heat map,拉人的話,會顯示在heat map的位置。

然後中段有頻率響應圖(矯正到音量一致0dB為中線):

Dry就是原始全平0dB,Uncorrected還沒開DRC矯正。LF corr與Full band選只修正低頻,或全頻帶修正。一開始是灰色,只要按了下方綠色按鈕,就能進行DRC矯正。

兩種常用的演算法,PEQ就是用等化器來修,Min-Phase則用最小相位演算法。不同演算法有不同的特性,之後可以再回來談這一塊。

舉例按了Min-phase之後會變成這樣:

人人那裡會標示綠色虛線在哪裡跑DRC,頻率響應圖可以看到修正結果。這時可以移動喇叭或人的位置,就換看到若沒有重新矯正,頻率響應會變成什麼樣子。


最後在最下面是聆聽感受:

我放了三首曲子,加上粉紅噪音。可以隨性調整上述喇叭、人的位置以及反射率,調整後的特性就能馬上聽到。 音量已經調成一樣大,大家可以專注於聽感上的改變。

若以原始(Dry)相對全頻Min-Phase矯正,你聽得出差異嗎?歌曲跟粉紅噪音感受會不一樣嗎?專注於切換1秒之後,會有不同結論嗎?

目前先做到這些,有什麼建議或使用分享,都歡迎大家提出。Have fun~
七十、最小相位濾波器

上一篇提到有使用了最小相位(Minimum-Phase)濾波器來做DRC,這也是之前一直沒有嘗試過的演算法。平時最常用的是PEQ,也就是多段參數等化器。這在REW、或一般常見的機器或軟體工具中,是最常見的。

——————————

談最小相位濾波器前,先說說PEQ大概是怎麼用來修正頻率響應的。舉上一篇提到的後牆反射SBIR為例,假設修正的目標是500Hz以下:

先把上圖高於0dB以及小於0dB要修正的量轉成下圖,淺紅色、淺藍色就是理想上需要修正的量。我這裡限縮不得增強超過6dB。留下灰色區域不去補。

挑一個夠高、夠寬的紅色突起放上去。這個紅色線的頻率、高度、寬度就決定了一個PEQ的biquad濾波器。理想要達到的目標減去剛剛設計好的濾波器,剩下的就是殘餘量(虛線)。

下一步以此殘餘量為目標,這次挑了一個反向的紅色濾波器,又剩下虛線的能量給下次繼續努力。

就這麼一路做到第十個:


合起來PEQ綜合的頻率響應如下。


修完之後的頻率響應如下:

因為灰色那塊是一開始就不打算修的地方,所以最後那個頻率的響應還是會比較凹一些。

——————————

那麼,什麼是最小相位濾波器設計?一樣從目標濾波頻率響應開始:

然後,就是一堆數學。簡單來說(我也只能簡單的說),就是用對數值域做IFFT(反傅立葉轉換)到quefrency domain,並將負向向右折到正向:

然後再FFT轉回頻率響應,同時產出相位響應:

最後進行IFFT轉成時域脈衝響應,變成FIR filter參數。


這樣《就做完了》。

——————————

最小相位法,看起來跟PEQ設計,好像完全不一樣。但來看看做出來的結果:

在500Hz內,兩者都把頻率響應變平了。做出來的濾波器如預期,只是PEQ比較沒貼著目標那麼近,但長得很像。

神奇的是相位響應:

這是怎麼回事,這麼巧,連相位響應都很像?明明做法是截然不同?

——————————

下圖橘線,是一個剛剛我們一開始,設計PEQ時,所用的第一個 biquad濾波器,藍線虛線是用最小相位演算法做出來,一樣頻率響應的濾波器。兩種的相位響應一模一樣!

這是因為「biquad濾波器,也是最小相位!」

PEQ若是只用biquad濾波器來組成,最小相位濾波器疊加在一起,還是最小相位濾波器。你也可以想像成,若你有無限多個biquad濾波器,就可以無限逼近目標頻率響應。所有的biquad濾波器合起來,仍然是最小相位濾波器。

兩者真的是「你泥中有我,我泥中有你。」
七一、SBIR:全頻域前牆反射修正


之前提到的例子是對SBIR低頻20-500Hz做頻率響應修正,若想對全頻域20-20kHz來修,數學上當然做得到。問題是,有沒有必要?修了真的比較好嗎?為了方便比較,以下是將高頻平滑後的SBIR頻率響應:

用來修正的濾波器頻響如下:


🔸 Min-phase(藍線):不平滑化,直接做最小相位濾波修正
🔸 Min-phase(REW var)(綠線):平滑化後,做最小相位濾波修正
🔸 PEQ(紅虛線):一樣平滑化後,以24個biquad EQ修正

若是以平滑過要變成全平直0dB為目標,計算誤差方均根,來看誰最接近。不論是只修正低頻或是全頻修正,三種方式都沒什麼差異。



主因是高頻的差異全都被平滑化不見了,不論用哪個方法都一樣。

但若是以原始未平滑化的頻率響為目標,就會看到全頻最小相位法修正(藍色),會得到好處。相較其他只做低頻的修正,高頻的部分的響應抖動,變得比較沒那大了。


看起來數字比較好,但修正高頻細節響應,有沒有實質效益?高頻會比較飽滿?比較不毛躁?用以下連結來實際聽聽:

A7. Audio Export


有三首歌,加上粉紅噪音。歌曲不容易辨別,但仔細聽可以感受到前牆反射SBIR造成的聲音空洞感,修正後會補回來,辨別難度還挺高的。但若是用粉紅噪音就很容易了,和DRY粉紅噪音比:
❌Room(SBIR) 房間響應修正前:底盤虛弱、高音風嘯聲、甚至有點金屬感
❌所有LF只處理低頻,三種方式都會補上底盤、但高頻聽感還是一樣問題
❌Full全頻Min-phase(REW var)跟PEQ,一樣補了底盤、高頻問題依舊
✅只有Full全頻Min-phase修正,高頻風嘯聲消失,跟DRY原始音源聽感一樣,底盤也足

既然全頻最小相位修正還原度這麼好,為何不直接用就搞定?會有什麼限制或踩什麼坑呢?接下來會繼續以SBIR這個例子,更具體的聊聊這部分。
文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 22)

今日熱門文章 網友點擊推薦!