格式:優(yōu)先選擇無壓縮的 WAV 格式(采樣率≥16kHz,位深 16bit),避免 MP3 等壓縮格式導(dǎo)致的頻譜失真。
時長:單段語音至少包含 3 個以上完整元音(如 “a、i、u”,每個元音發(fā)音≥0.5 秒),確保能提取穩(wěn)定的 F1-F4。
環(huán)境:背景噪音≤30dB(可通過 Audacity 的 “效果→降噪” 功能預(yù)處理,降低低頻噪音對 F3/F4 的干擾)。
Praat 是最易上手的工具,以下為詳細(xì)操作步驟,全程約 5-10 分鐘:
打開 Praat,點(diǎn)擊 “Open→Read from file”,導(dǎo)入待分析的 WAV 文件。
在 “List of Objects” 中選中音頻文件,點(diǎn)擊 “View & Edit”,進(jìn)入編輯界面(上方為波形圖,下方為頻譜圖)。
用鼠標(biāo)拖動選中一段 完整元音片段(如 “a” 的發(fā)音,波形平穩(wěn)、無明顯停頓的部分),避免包含輔音(如 “b、p”)或靜音段。
在編輯界面頂部菜單欄,點(diǎn)擊 “Pitch→Show Formants”,彈出 “Formant Settings” 窗口。
按以下標(biāo)準(zhǔn)配置參數(shù)(適配中文語音):
Maximum formant(最高共振峰頻率):男性語音設(shè)為 5000Hz,女性 / 兒童設(shè)為 6000Hz(覆蓋 F1-F4 的頻率范圍)。
Number of formants(共振峰數(shù)量):設(shè)為 4(即提取 F1、F2、F3、F4)。
Window length(窗口長度):設(shè)為 0.025 秒(25ms,平衡時間分辨率與頻率分辨率)。
點(diǎn)擊 “OK”,頻譜圖上會自動出現(xiàn) 4 條紅色軌跡,分別對應(yīng) F1(最下方)、F2、F3、F4(最上方)。
選中目標(biāo)元音片段后,點(diǎn)擊菜單欄 “Formant→Extract formants”,Praat 會生成該片段的 “Formant Table”(包含每 0.01 秒的 F1-F4 頻率值)。
點(diǎn)擊 “Table→Save as text file”,將數(shù)據(jù)導(dǎo)出為 TXT 文件(可直接用 Excel 打開),取該片段 F1-F4 的 平均值(排除首尾波動較大的數(shù)值,取中間 80% 穩(wěn)定值的平均),作為該元音的共振峰特征值。
語音同一性判斷需 “核心指標(biāo) + 輔助指標(biāo)” 結(jié)合,避免單一參數(shù)誤判,具體流程如下:
將待判斷的兩段語音(設(shè)為 A 和 B)按上述步驟提取相同元音(如均提取 “a”“i”“u”)的 F1-F4 平均值,按以下標(biāo)準(zhǔn)判斷:
示例:若 A 的 “a” 元音 F1=700Hz、F2=1200Hz、F3=2800Hz,B 的 “a” 元音 F1=720Hz(差異 2.8%)、F2=1230Hz(差異 2.5%)、F3=2850Hz(差異 1.8%),則 F1-F3 差異均符合標(biāo)準(zhǔn),初步判定一致。
僅靠共振峰可能因 “模仿發(fā)音” 誤判,需結(jié)合以下指標(biāo)進(jìn)一步確認(rèn):
基頻(F0):同一人的基頻穩(wěn)定(男性約 80-150Hz,女性約 150-250Hz),兩段語音的 F0 平均值差異≤10%。
音長與節(jié)奏:同一人發(fā)相同詞語的 “元音時長”“停頓間隔” 差異≤15%(如均發(fā) “你好”,“你” 的元音時長均為 0.3 秒左右)。
頻譜形狀:在 Praat 中對比兩段語音的頻譜圖,同一元音的 “能量集中區(qū)域”(頻譜圖中顏色較深的頻段)需一致(如 “i” 的能量集中在 F2 附近,兩段語音的深色區(qū)域頻段需接近)。
假設(shè)提取 A 和 B 的 “a”“i” 元音共振峰及基頻數(shù)據(jù)如下:
共振峰差異:A 與 B 的 “a” 元音 F1 差異 2.8%、F2 差異 2.5%、F3 差異 1.8%;“i” 元音 F1 差異 3.3%、F2 差異 2.2%、F3 差異 2.5%,均符合 “差異≤5%(F1/F2)”“≤8%(F3)” 標(biāo)準(zhǔn)。
輔助指標(biāo):基頻差異≤3%,元音時長差異≤3.3%,均一致。
最終結(jié)論:高度可能為同一人。
避免 “單一元音判斷”:至少提取 3 個不同元音,因同一人不同元音的共振峰 “相對關(guān)系” 更穩(wěn)定(如 F2-F1 的差值)。
排除環(huán)境干擾:若兩段語音錄制環(huán)境差異大(如一段安靜、一段嘈雜),需先通過 Audacity 降噪(“效果→降噪”,取靜音段為噪音樣本),再提取共振峰。
批量處理建議:若需對比多組語音,用 Wavesurfer 的 “批量提取” 功能,將所有共振峰數(shù)據(jù)導(dǎo)出到 Excel,用公式自動計(jì)算差異度,提高效率。
西數(shù)司法鑒定中心