現(xiàn)代語(yǔ)音通信已不再是傳統(tǒng)接線生時(shí)代的交換式系統(tǒng),而是更依賴網(wǎng)絡(luò)基礎(chǔ)建設(shè)的封包傳遞,取而代之的是各種通訊軟件?,F(xiàn)代化語(yǔ)音服務(wù)的提供,更涉及了眾多不同的廠商,例如:因特網(wǎng)服務(wù)供貨商、手機(jī)制造商、通訊軟件供貨商…等。因此在通信系統(tǒng)的快速發(fā)展過(guò)程中,如何在眾多服務(wù)堆棧的架構(gòu)確保語(yǔ)音質(zhì)量就變得很重要。在這當(dāng)中,評(píng)估語(yǔ)音質(zhì)量的方法就成為首要關(guān)鍵。
語(yǔ)音質(zhì)量方法的應(yīng)用對(duì)象,我們可以看到OPTICOM公司在ITU Workshop 的數(shù)據(jù)(如下)
可將它分成兩類: 終端設(shè)備的聲學(xué)性能、網(wǎng)絡(luò)傳輸對(duì)語(yǔ)音的損傷。
終端設(shè)備的聲學(xué)性能:其中具體的終端設(shè)備例如像是耳機(jī)麥克風(fēng)、視頻會(huì)議系統(tǒng),筆電自帶的喇叭麥克風(fēng)…等。這些設(shè)備也還有會(huì)連帶影響聲學(xué)性能的信號(hào)處理算法、編譯碼器、降噪算法…等。
網(wǎng)絡(luò)傳輸對(duì)語(yǔ)音的損傷: 像是有線傳輸/無(wú)線傳輸、驅(qū)動(dòng)程序、流量控制…等。
因此, 語(yǔ)音質(zhì)量測(cè)試的應(yīng)用對(duì)象, 在終端裝置方面, 不管是耳麥/手機(jī)/筆電/視頻會(huì)議系統(tǒng)…等都是適合的待測(cè)物. 在軟硬件方面, 通訊軟件/DSP算法/編譯碼器…等也都是可以成為待測(cè)物的對(duì)象。
評(píng)估方法可概分為兩類:
? 主觀評(píng)估法
? 客觀評(píng)估法
傳統(tǒng)的主觀評(píng)估,需召集一組人,并要求他們判斷各種音頻片段的音質(zhì),通常判斷評(píng)分值介于1到5。將所有個(gè)人分?jǐn)?shù)加總后再除以個(gè)體數(shù)。其結(jié)果稱之為平均值意見(jiàn)得分(MOS)。
雖然用真實(shí)的人類受試者進(jìn)行測(cè)試成本高又耗時(shí),但可以使用包含基于心理聲學(xué)建模(如 PESQ 或 POLQA)的算法來(lái)克服這些限制。如果正確使用,這些模型將非常匹配來(lái)自人類群體的結(jié)果。這種自動(dòng)化允許開(kāi)發(fā)中的快速迭代以及高效的生產(chǎn)線驗(yàn)證。獲得的測(cè)量結(jié)果被歸類為客觀的,因?yàn)樗鼈儾皇苋说臍赓|(zhì)或測(cè)試條件的影響,且結(jié)果是完全可重復(fù)的。
主觀評(píng)估法需要大量的測(cè)試人員及工時(shí),耗費(fèi)成本甚巨。相對(duì)來(lái)說(shuō),客觀評(píng)估采用儀器設(shè)備就不會(huì)有這樣的問(wèn)題。
PESQ是上一代應(yīng)用于通信系統(tǒng)和語(yǔ)音編碼的端對(duì)端語(yǔ)音質(zhì)量評(píng)估的客觀語(yǔ)音質(zhì)量評(píng)估方法。它被定義在ITU-R Rec. P.862 標(biāo)準(zhǔn)中。但由于它的局限性,國(guó)際電信聯(lián)盟ITU 發(fā)展了新的ITU-T Rec. P.863 標(biāo)準(zhǔn),稱之為POLQA(Perceptual Objective Listening Quality Analysis)也就是『感知客觀 聆聽(tīng)質(zhì)量分析』。
其中,所謂的“感知”指的是使用算法來(lái)預(yù)測(cè)真人聆聽(tīng)的主觀得分。
PESQ和POLQA起源于 ITU-T 的客觀語(yǔ)音質(zhì)量測(cè)量系列,該系列始于 1997 年的 P.861 (PSQM),2001 年被 P.862 (PESQ) 取代。它最初是為測(cè)試窄帶網(wǎng)絡(luò)而開(kāi)發(fā)的。之后在 2010 年被ITU-T P.863 POLQA有效取代,并支持?WebRTC 和 IP 的呼叫,。
MOS 通常用于從 1(質(zhì)量差)到 5(質(zhì)量極好)的范圍內(nèi)描述語(yǔ)音質(zhì)量。
百佳泰的POLQA服務(wù), 采用Audio Precision 方案, 提供以下特性:
●? ITU-T P.863 語(yǔ)音質(zhì)量感知評(píng)估,映射到 MOS 尺度
●?窄帶、寬帶和超寬帶操作
●?與聲學(xué)接口一起使用
●?輸入
- 以 8、16 或 48 kHz 采樣的 16 位線性音頻?輸入長(zhǎng)度為 6 到 12 秒的語(yǔ)音文件
● 測(cè)量
- 單一MOS值
瞬時(shí) MOS值: 隨時(shí)間變化的MOS曲線圖 - 平均 MOS(包含語(yǔ)音活動(dòng)期和靜音期)
值批處理: 逐一評(píng)估每個(gè)樣本音文件的MOS值
這些量測(cè)能力對(duì)于無(wú)線耳機(jī)、智能型耳機(jī)、智能型手機(jī)… 等產(chǎn)品的語(yǔ)音通訊質(zhì)量, 將帶來(lái)莫大幫助。
相關(guān)連結(jié)參考:
1. Perceptual Audio Test Options for APx500 Series Analyzers
2.?POLQA Vs PESQ Objective quality scoring explained
【了解更多相關(guān)對(duì)于無(wú)線耳機(jī)、智能型耳機(jī)、智能型手機(jī)… 等產(chǎn)品的語(yǔ)音通訊質(zhì)量測(cè)試問(wèn)題,歡迎聯(lián)系百佳泰】
聯(lián)系專屬技術(shù)顧問(wèn) →cn_service@allion.com.cn