聲紋采集詳情
聲紋采集系統的性能(néng)受許多因素的影響,包括不同的說話人、說話方式、環境噪音、傳輸信道(dào)等等。提高系統魯棒性,是要提高系統克服這(zhè)些因素影響的能(néng)力,使系統 在不同的應用環境、條件下性能(néng)穩定;自适應的目的,是根據不同的影響來源,自動地、有針對(duì)性地對(duì)系統進(jìn)行調整,在使用中逐步提高性能(néng)。以下對(duì)影響系統性能(néng)的不同因素分别介紹解決辦法。
解決辦法按針對(duì)聲紋特征的方法(以下稱特征方法)和模型調整的方法(以下稱模型方法)分爲兩(liǎng)類。前者需要尋找更好(hǎo)的、高魯棒性的特征參數,或是在現有的特征 參數基礎上,加入一些特定的處理方法。後(hòu)者是利用少量的自适應語料來修正或變換原有的說話人無關(SI)模型,從而使其成(chéng)爲說話人自适應(SA)模型。
說話人自适應的特征方法有說話人規一化和說話人子空間法,模型方法有貝葉斯方法、變換法和模型合并法。
聲紋系統中的噪聲,包括環境噪聲和錄音過(guò)程加入的電子噪聲。提高系統魯棒性的特征方法包括語音增強和尋找對(duì)噪聲幹擾不敏感的特征,模型方法有并行模型組合PMC 方法和在訓練中人爲加入噪聲。信道(dào)畸變包括錄音時話筒的距離、使用不同靈敏度的話筒、不同增益的前置放大和不同的濾波器設計等等。特征方法有從倒譜矢量中減去其長(cháng)時平均值和RASTA濾波,模型方 法有倒譜平移。