【音视频】专项培养-MOS评测
1、*性能測試*
(1)結論:
關于推流丟包率,我們上次就發現了這個問題,幾乎沒有丟包,也就意味著每次傳輸都保證了傳輸數據到達率,但是這個在弱網下就是一個好的表現嗎?沒有主動丟包的策略每幀數據都傳輸是否加劇了網了擁堵程度?所以這部分是否我們可以主動控制鍵丟包.這點不知道我理解得對不對(參考聲網丟包xx %突然能夠聽清楚對方的話)或者(低端設備播放高清視頻時有跳幀的說法)所以我們可以定制下自己的丟包策略 2.極限測試,主要是比較的舍我們sdk和行業水準。所以我們對sdk的測試過程提出了高的要求 連麥數(友商基本上號稱十多路)分辨率,尤其在教育領域 共享屏幕的分辨率幾乎遠超360*640,其他幀率,碼率也是同理。
(2)解釋:
上行無丟包,說明推流到服務端是沒問題的,只有一路上行,所以上行數據會好一些。下行有丟包,是因為下行拉4路流,平均碼率600k,4路就是2.4M,加上重傳等其他冗余包等,應該會比這個2.4M更大,下行拉流越多,帶寬不夠的情況下,丟包可能會更嚴重。這個的確也會是以后一個長期優化的方向點。
9連麥拉9路流,分辨率是144x192,大部分碼率只有50K,9路加起來才450K,有一部分9連麥是250k碼率,9路流加起來也才2.25M。所以今天的這個測試數據量應該是已經超過了APP 9連麥的場景。SDK會陸續支持大小流模式或者SVC去支持更多的并發拉流,能一定程度上更好地支持教育模式或者會議模式。
2、內存、cpu獲取工具
https://github.com/didi/DoraemonKit
3、多家RTC服務的MOS評測方法
(1)科普:影響音視頻質量和穩定性的因素
網絡
音視頻對網絡傳輸的依賴性越來越顯而易見。網絡狀況對于音視頻質量的影響是很直觀的,如果音視頻包在網絡傳輸的過程中丟失,晚到,或者不均勻的到,就會造成我們常說的丟包,延時和抖動。隨著網絡上主機數量的不斷增加,網絡服務的需求將超過網絡提供的能力,從而造成傳輸時延變化(抖動)、傳輸時延過大甚至引起分組丟失,也就是說出現了大塞車(網絡擁塞),這將對傳輸時延要求比較苛刻的實時音視頻傳輸造成很大影響,從主觀聽感或視覺感受上造成聲音或視頻畫面的卡頓和滯后,嚴重影響通話的質量和可懂度。在公共互聯網上,特別是在遠距離通信的情況下,如果缺乏足夠的網絡部署和丟包對抗技術,這種情況就會變得尤為明顯。
此外,除了在傳輸層引起的丟包抖動,路由器,移動數據網絡等問題也會引起丟包抖動。網絡中存在很多的節點,如路由器、網關等。這些節點采用排隊機制決定數據發放的順序。如果在瞬間某節點數據排隊較長,該節點就會采取丟棄數據包的方式保證節點的正常工作。即使沒有被丟棄,經過較長的排隊之后,這些數據包往往要花很長的時間才能到達目的地,由此就產生了網絡的時延以及時延抖動。
設備
設備對于音視頻質量的影響是相對隱性的,但是往往會起著決定性的作用。相較于蘋果機,安卓機的問題就非常碎片化了。由于安卓機型太多,適配對和安卓機打交道的開發者來說往往司空見慣,比如受一些中低端機型性能影響,音視頻在蘋果機上測試覺得不錯,但是到一些中低端的安卓機器上就問題百出。這類問題無論網絡好壞都會產生,這時候就必須有音視頻引擎的算法模塊來做對應的算法適應和適配了,解決這類問題的技術門檻一般都是很高的。
物理環境
物理環境對音視頻通話的影響不易察覺,但又不可忽視。例如,近場時候的尖銳雜音(嘯叫)就是由于設備A的麥克風會直接收錄到設備B的揚聲器播放的聲音,然后又會傳回設備B播放出來,形成了一個正反饋回環導致的。只要分開一定距離通話或者靜音掉其中一方就會消失。而本地身處嘈雜的環境下的聽對方會更困難,對方聽自己也會有受到噪聲的干擾。
一、設置參數
在測試以前,要設置音視頻參數:分辨率、碼率、和幀率。設置好音視頻參數以后,在測試過程中,參數要保持不變。
推薦使用下面兩組參數分別進行測試:
| 參數設置 | 分辨率 | 幀率(fps) | 碼率(kbps) |
| Profile1 | 640*360 | 15 | 800 |
| Profile2 | 540*960 | 20 | 1200 |
| Profile3 | 1280*720 | 25 | 2000 |
| Profile4(PC) | 1920*1080 | 25 | 4000 |
二、測試報告的設置條件如下:
| 測試對象 | XXX- SDK |
| 參數設置 | Profile1 |
| 測試設備 | iPhone6 |
三、評估指標
我們使用音視頻技術方案的三個關鍵指標來評估其表現:延遲時間、流暢度、和清晰度。
| 延遲時間 | 采用客觀的評估方法。以毫秒為單位,測量單向通訊的延遲時間。 |
| 流暢度 | 采用主觀的評估方法,MOS 評分法,分數范圍為 1 分至 5 分。 |
| 清晰度 | 采用主觀的評估方法,MOS 評分法,分數范圍為 1 分至 5 分。 |
延遲時間比較適合采用客觀的評估方法,單位為毫秒,只需要測量單向音視頻數據流從推流 端到拉流端所耗費的時間即可。這個方法十分直觀,也廣為接受。
流暢度和清晰度完全是用戶體驗的主觀反饋,而且不流暢或者不清晰的技術原因有多源性的 特點,無法簡單地通過技術指標來衡量。因此流暢度和清晰度比較適合采用主觀的評估方法, 這里推薦用 MOS 評分法來評估。
MOS (Mean Opinion Score)是一種在通訊工程中用來評估 QoE(Quality of Experience)的 方法。它是一個有統計意義的數量樣本空間的算術平均值。需要組建一個人數有統計意義的 測試團隊,對測試對象的質量根據主觀體驗進行打分,分數范圍為 1 分至 5 分,1 分最差, 5 分最好。建立打分結果的數量樣本空間以后,計算其算數平均值,就可以得到 MOS 值。
MOS 作為一種主觀的質量評估方法,被廣泛的應用于音頻、視頻、和音視頻的質量評估中。 對于 MOS 的評分梯度和標準,ITU-T 在 P.800.1 中有詳細的方法建議。
MOS分采用人工評分的評估方法。主觀MOS分采用ITU-T P.800和P.830建議書,由不同的人分別對原始語料和經過系統處理后有衰退的語料進行主觀感覺對比,得出MOS分,最后求平均值。
MOS值=測試視頻值+(5-視頻源值)
(例如:評分人A給測試視頻序號為1的視頻評分為3分,同時給視頻源的評分為4.5分,那么A實際最終給1號測試視頻的分值應該是3.5分 。)
進行人工評分時打分可以打到小數點1位(例如4.6分)
為了簡單和可操作期間,下面采用 ACR(Absolute Category Rating)來為 MOS 定義評分梯度:
| MOS 評分 | 描述 |
| 5 | Excellent,十分流暢,或者十分清晰 |
| 4 | Good,十分偶然有卡頓或者花屏,但不影響整體體驗。 |
| 3 | Fair,偶有卡頓,或者偶有花屏/馬賽克,但是還能接受 |
| 2 | Poor,卡頓,或者花屏/馬賽克出現的頻率較多,但是還算可用。 |
| 1 | Bad,完全卡住,或者畫面不可辨,完全不可用。 |
在測試某個指標表現的時候,請保持其它方面的條件不變。
四、現網測試
為純粹測試技術方案的真實表現,而不受其他因素干擾測試效果,因而沒有使用專線, 不加任何外部輔助,在公共互聯網上進行真實的測試。
建議測試區分開互聯網使用的低高峰時段,有些測試時段和高峰時段分別測試。
流暢度和清晰度的評估采用主觀的評估方法:MOS 評分法,最低 1 分,最高 5 分。
1. 跨運營商網絡測試(中國國內)
不同的運營商網絡之間是存在帶寬瓶頸的。本測試的目的是評估RTC服務商在跨運營商網絡情況下的表現。
| 跨網組合 | 延遲時間(ms) | 流暢度(MOS) | 清晰度(MOS) |
| 電信-聯通 | |||
| 電信-移動 | |||
| 移動-聯通 |
2. 跨國網絡測試(全球)
在不同的國家之間的進出口光纖是存在帶寬瓶頸的。本測試的目的是評估RTC服務商在跨國跨洋網絡情況下的表現。(下圖內容為示意數據)
| 用戶A | 用 戶 B( 國 外 | 國外省市 | 網絡類型 | 分辨率/碼 率/機型 | 流暢度 (MOS | 延遲 (ms) |
| 中國北京 | 美國 | 紐約 | ||||
| 中國北京 | 加拿大 | 蒙特利爾 | ||||
| 中國北京 | 阿聯酋 | 迪拜 | ||||
| 中國北京 | 日本 | 東京 |
五、模擬測試
根據現網測試的結果和客戶運營的反饋,添加了模擬測試的設計。模擬測試是通過網損設備模擬各種網絡損傷的情形,在公司8點之前和23點之后進行測試。
1. 上行網絡丟包測試
| 上行丟包率 | 延遲時間(ms) | 流暢度(MOS) | 清晰度(MOS) |
| 5% | |||
| 10% | |||
| 20% | |||
| 30% | |||
| 50% |
2. 下行網絡丟包測試
| 下行丟包率 | 延遲時間(ms) | 流暢度(MOS) | 清晰度(MOS) |
| 5% | |||
| 10% | |||
| 20% | |||
| 30% | |||
| 50% |
3. 網絡抖動測試
| 網絡抖動 | 延遲時間(ms) | 流暢度(MOS) | 清晰度(MOS) |
| 50 毫秒 | |||
| 100 毫秒 | |||
| 200 毫秒 |
4. 帶寬限制測試
假設當前推流的碼率是 800k bps,對上行帶寬進行限制到 500k bps,期望的結果是RTC服務商SDK 會自動調節碼率來適應網絡情況,碼率會被調整到 500kbps 或以下。
| 限制帶寬 | 碼率 | 延遲時間(ms) | 流暢度(MOS) | 清晰度(MOS) |
| 不限制帶寬 | 800 kbps -2000 kbps |
|||
| 限制帶寬到 500k bps |
5. 如何觀察延遲時間
1)登錄https://miaobiao.51240.com,即可看到以毫秒為單位計時的時鐘。這是為了 方便客戶測試,注意:時鐘頁面經過調整,和下文截圖不完全一致。
2)具體方案舉例:準備兩個 iPhone6 手機,在每個手機上都安裝demo app。然后讓兩個個手機處于 連麥狀態。在每個手機的 APP 界面上都可以看到當前的時間。 3)使用第三個手機拍攝這兩個手機上的即構 demo app 的界面,捕捉連麥狀態下的瞬間鏡 頭,即可看到音視頻連麥雙方的 demo app 界面上的時間差距。這個時間差距就是延遲時間。
總結
以上是生活随笔為你收集整理的【音视频】专项培养-MOS评测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是人民币离岸市场
- 下一篇: 华为手机的望远镜在哪里(怎样开启华为手机