• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
     首頁(yè) > 資訊 > 國(guó)內(nèi) >

    美迪格威 | 白皮書:采用GPU做云原生編解碼轉(zhuǎn)換(3/3)

    2022-03-18 15:08:37   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


      云原生構(gòu)建應(yīng)用簡(jiǎn)便快捷,部署應(yīng)用輕松自如、運(yùn)行應(yīng)用按需伸縮,在通信行業(yè),服務(wù)提供商提供云原生實(shí)時(shí)通信的能力將在很大程度上取決于媒體處理平臺(tái)的能力及其對(duì)各種編碼的支持。本文介紹采用GPU做云原生編解碼的優(yōu)勢(shì)。我們將以三篇文章來(lái)分析,這是第三篇:GPU轉(zhuǎn)碼性能、成本和質(zhì)量
      GPU轉(zhuǎn)碼性能、成本和質(zhì)量
      音頻轉(zhuǎn)碼的GPU性能和成本
      為了更好地確定使用GPU與CPU的固有價(jià)值,我們分析了三個(gè)變量: 性能 (支持的會(huì)話數(shù)),功耗 (# 會(huì)話/瓦特) 和成本 ($/會(huì)話)。  對(duì)于CPU,我們使用了英特爾至強(qiáng)E5-2698 v3 @ 2.10GHz,16-core dual socket card。  對(duì)于GPU ,我們使用了Nvidia P100。圖3描述了我們分析的配置。  注意: 對(duì)于下面討論的所有分析,我們認(rèn)識(shí)到這是一個(gè)時(shí)間點(diǎn)評(píng)估。  最肯定的是,CPU和GPU的處理能力將繼續(xù)提高,但我們相信GPU的增量將繼續(xù)超過CPU可實(shí)現(xiàn)的增量。
      對(duì)于規(guī)模、功率和成本的計(jì)算,CPU是完全配置和完全加載的。GPU完全符合成本,但對(duì)于規(guī)模和功耗的分析,僅加載到可以在CPU處理中使用瓶頸的程度。這在使用少于4個(gè)GPU的低復(fù)雜度編解碼器類型中最為明顯。此外,CPU處理被設(shè)置為不超過85% 利用率。
      GPU與CPU性能對(duì)比:會(huì)話數(shù)
      圖3.1顯示了使用CPU+GPU進(jìn)行轉(zhuǎn)碼而不是僅使用CPU時(shí)可能支持的會(huì)話數(shù)的增量或增加。  假定100% 會(huì)話被轉(zhuǎn)碼, 可以看出,根據(jù)編解碼器類型,GPU將會(huì)話數(shù)增加到1366%。
      
      GPU與CPU功耗對(duì)比,會(huì)話數(shù)/瓦
      圖3.2顯示了每瓦特使用的會(huì)話數(shù)。在此分析中,服務(wù)器和CPU的功耗是常見的,因此功耗差異基于所使用的GPU數(shù)量。與總體會(huì)話計(jì)數(shù)所見的結(jié)果一樣,每瓦會(huì)話數(shù)在會(huì)話數(shù)量上顯示出非常強(qiáng)勁的增長(zhǎng),根據(jù)編解碼的類型,范圍從54% 到456% 增加
      GPU與CPU成本消耗對(duì)比:美元/每會(huì)話
      圖3.3顯示了每個(gè)會(huì)話的美元成本以及使用GPU潛在的成本節(jié)省。  在這里,通過轉(zhuǎn)移到GPU解決方案可以實(shí)現(xiàn)的節(jié)省范圍從使用AMR-NB的65% 到使用EVRC B0的492% (9.3 kbps)。
      
      使用浮點(diǎn)處理的GPU音頻質(zhì)量
      曾經(jīng)一個(gè)反對(duì)使用GPU進(jìn)行轉(zhuǎn)碼的論點(diǎn)是:使用CPU進(jìn)行定點(diǎn)處理轉(zhuǎn)碼更有效,可以產(chǎn)生更好的語(yǔ)音質(zhì)量。這與專為浮點(diǎn)計(jì)算而設(shè)計(jì)的GPU形成對(duì)比。如果此論點(diǎn)成立,則直接意味著使用GPU會(huì)導(dǎo)致語(yǔ)音質(zhì)量下降。實(shí)際上,通過查看實(shí)際測(cè)試結(jié)果可以證明該論點(diǎn)是錯(cuò)誤的。
      我們分析了CPU (固定點(diǎn)) 與GPU (浮點(diǎn)) 的語(yǔ)音質(zhì)量結(jié)果,用于轉(zhuǎn)碼三種編解碼類型: G729AB; AMR-WB; 和EVRC-WB,使用G.729標(biāo)準(zhǔn)規(guī)范中的語(yǔ)音測(cè)試向量。語(yǔ)音質(zhì)量測(cè)量是使用PESQ標(biāo)準(zhǔn)進(jìn)行的。表1顯示了完整的PESQ測(cè)量結(jié)果。亮點(diǎn)是:
      G729AB: GPU在CPU語(yǔ)音質(zhì)量測(cè)量的0.4% 之內(nèi)。請(qǐng)注意,測(cè)試是在沒有不連續(xù)傳輸 (DTX) 的情況下運(yùn)行的,也就是“沉默抑制”,因此在沉默期間發(fā)送了數(shù)據(jù)包。
      EVRC-B: GPU的語(yǔ)音質(zhì)量測(cè)量與CPU的語(yǔ)音質(zhì)量測(cè)量相差0.9% 或更小。在兩個(gè)比特率上進(jìn)行了測(cè)試: 9.3kbps 和8.5 kbps,結(jié)果相似。
      AMR-WB: GPU測(cè)量對(duì)比CPU測(cè)量,范圍從0.7% 好~0.55% 差。這個(gè)測(cè)試是在從6.6 kbps到23.85 kbps的比特率的整個(gè)頻譜上進(jìn)行的
      
      總之,我們的測(cè)試表明,使用帶浮點(diǎn)處理的GPU的語(yǔ)音質(zhì)量測(cè)量比使用固定點(diǎn)處理的CPU更好,或在1% 內(nèi)。  根據(jù)我們的經(jīng)驗(yàn),<1% 差異將不會(huì)導(dǎo)致語(yǔ)音質(zhì)量的感知下降。有關(guān)固定點(diǎn)與浮點(diǎn)語(yǔ)音質(zhì)量的其他研究,請(qǐng)閱讀3GPP TR 26.976版本10.0.0版本10, AMR-WB語(yǔ)音編解碼器文檔的性能表征。具體地說,附件B和B.7章節(jié)確認(rèn)了我們發(fā)現(xiàn)的使用浮點(diǎn)與固定點(diǎn)編碼的AMR-WB PESQ分?jǐn)?shù)的比較。
      從表2可以看出,根據(jù)轉(zhuǎn)碼類型,GPU的使用可以將性能提高到480%。這種增量性能帶來(lái)了137% 的增量成本。因此,基于轉(zhuǎn)碼類型或規(guī)模要求,GPU的使用比僅使用CPU更具吸引力
      音頻和視頻混合轉(zhuǎn)碼
      正如我們從音頻和視頻的性能評(píng)估中看到的那樣,GPU為規(guī)模和性能提供了非凡的價(jià)值。那么,當(dāng)音頻和視頻轉(zhuǎn)碼都在同一臺(tái)服務(wù)器上執(zhí)行時(shí),性能會(huì)如何呢?為了分析這一點(diǎn),我們重新使用了圖4中的配置,并對(duì)音頻進(jìn)行了基準(zhǔn)測(cè)試。表3僅顯示了AMR-WB<-> G.711音頻轉(zhuǎn)碼的比較
     
      接下來(lái),我們添加了視頻。對(duì)于GPU,為了適應(yīng)兩種類型,我們分配了40個(gè)內(nèi)核中的12個(gè)用于視頻轉(zhuǎn)碼,并將其余28個(gè)內(nèi)核分配給音頻轉(zhuǎn)碼。表4顯示了將視頻和音頻轉(zhuǎn)碼放在一起的匯總結(jié)果。對(duì)于組合轉(zhuǎn)碼,僅使用CPU,視頻轉(zhuǎn)碼會(huì)話平均下降67%,音頻轉(zhuǎn)碼會(huì)話下降25%。相反,當(dāng)使用CPU和GPU時(shí),視頻轉(zhuǎn)碼會(huì)話的數(shù)量保持恒定,并且音頻轉(zhuǎn)碼會(huì)話僅減少6.25%。
      總結(jié)
      媒體轉(zhuǎn)碼現(xiàn)在可以在云中交付,等于或比使用傳統(tǒng)DSP可以實(shí)現(xiàn)的性能更好。盡管最初在虛擬環(huán)境中進(jìn)行了媒體轉(zhuǎn)碼,使用CPU,該解決方案不足以實(shí)現(xiàn)規(guī)模,并且始終將只是未來(lái)的墊腳石。  現(xiàn)在很明顯,未來(lái)就在這里,它是使用GPU進(jìn)行實(shí)時(shí)通信的轉(zhuǎn)碼-云中的通信服務(wù)。
      這份白皮書表明,進(jìn)行音頻轉(zhuǎn)碼在性能方面GPU遠(yuǎn)遠(yuǎn)優(yōu)于CPU,成本、功率和在語(yǔ)音質(zhì)量方面都等于CPU。當(dāng)將視頻轉(zhuǎn)碼添加到混音中,GPU再次成為超級(jí)解決方案,使基于GPU的媒體互通成為基于虛擬云部署的最佳解決方案


    【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

    專題

    CTI論壇會(huì)員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 濮阳市| 郸城县| 绥中县| 边坝县| 青冈县| 同江市| 石林| 庆阳市| 兴国县| 庆元县| 温州市| 江华| 海宁市| 临清市| 来宾市| 称多县| 顺昌县| 浦北县| 武山县| 珲春市| 庐江县| 砀山县| 长治市| 霍林郭勒市| 冷水江市| 永清县| 新源县| 长武县| 井研县| 内乡县| 建德市| 滦平县| 武汉市| 农安县| 铜川市| 肥城市| 施甸县| 苏州市| 渭南市| 甘南县| 诸暨市| http://444 http://444 http://444 http://444 http://444 http://444